綱領・ガイドライン等

集計処理加工

集計処理プロジェクト管理

本項では、本基準に規定されている最低基準に適合するデータを提供することをクライアントに保証するための、調査プロジェクトのデータ処理計画の立案・実行(回収された調査票の点検作業から適切なクロス集計や多変量解析の実施、出力およびデータの保管まで)の要件を示す。

1.基本的な集計フロー

調査プロジェクト固有の違いはあるものの、すべての会員社は、以下の集計フロー(手順)を基本的に踏まえるべき作業工程と認識し、その間に発生する種々の問題に対してクライアントと緊密な連係を保ちながら適切な管理・運営を行わなければならない。

2.外部委託のケース

集計業務を外部業者に委託する場合でも管理運営の責任は会員社にあり、本ガイドラインが適用される。

3.集計管理責任者
  • 本基準では、プロジェクトのデータ作成ならびにデータ処理加工の全般的な管理を行う者を集計管理責任者と称する。
  • 集計管理責任者は、プロジェクトの基本的な要求事項を示すジョブ・ファイル(仕様書)に基づいて、集計フロー、最終納期を含むスケジュール、成果品の内容またはイメージ、オプションとなるべき追加集計の範囲などについて、(営業担当を通じ)クライアントに十分説明し、同意を得た上で行う。

調査票のチェックおよび誤りの修正(手作業)

集計作業に入る前には、必ず調査票の記入内容、論理矛盾等をチェックし、誤りがあれば修正しなければならない。
明らかに一定の修正ロジックが確認できるものについては、データ入力後にコンピュータ上で一律に修正処理を行うことも可能である。 この場合には、効率性の追求のため、手作業による処理を簡略化することができる。

1.チェック仕様書等の作成 (マシンチェック)
  • チェック作業に携わる担当者は、調査票の内容を十分に理解し、スタッフ等に適切な指示を与えられるよう準備していなければならない。
    そのために、あらかじめチェック仕様書を作成し、明確かつ統一した基準の下に修正作業を行う。
  • チェックロジック、修正方法等を示す文書ファイルがあり、それに基づいてデータ処理作業が完成した作業内容ごとに再追跡され、再構築されることを容易にしなければならない。
  • 無回答が極端に多い場合やブレイクダウン(分析軸)項目が不明・拒否である場合などには、無効票として集計から除外せざるを得ないが、その判断基準についても検討が必要となる。
  • なお、チェック仕様書の内容については、クライアントの求めに応じていつでも適切に説明ができる状態に保管されていなければならない。
2.修正作業

回答の修正に際しては、誤りの種類・性質(調査票設計上の問題、調査員の実査上の問題、回答者の誤りや誤解の傾向等)やその出現数を整理し、それらの傾向に準じて適宜、修正方針を変更したり、よりふさわしい方法を判断し、それに従って訂正しなければならない。

アフターコード

  • アフターコーディングに際しては、あらかじめコード表(コーディング・ガイド)を作成して統一的な処理を行う。
  • コーディング担当者に対し、集計管理責任者は当該プロジェクトについての指示を与えなければならない。
1.コード表作成
  • コード表の作成に使用する調査票は、偏りのないように抽出しなければならない
    (例:人口特性/地域など)
  • コード表を適切に作成するために、回答を分類する上で十分な票数(プロジェクトの規模によるが、通常100票以上)を抽出し、書き抜き処理を行うようにする
  • コード表(案)は、クライアントの同意を得ておかねばならない
2.コード表の適用
  • 承認されたコード表は、すべての調査票に適用する (追加コードも同様)

データ入力

データ入力では、オペレーターが調査票に記入された通りに回答をキー・インしなければならない。
データを自動読み取りする場合、使用する自動読取機が回答を正確に認識し読み取れるよう調整されなければならない。

1.データ形式の確認

データ入力の方法には、いくつかの種類があるが、あらかじめ使用するデータ形式を社内的に理解・徹底させておかなければならない。

2.ベリファイの励行
  • データ作成の際には、*4ベリファイを実施することを原則とする。
  • データ入力は外部のパンチセンター等に外注するケースも多いので、調査機関として確実なチェック体制をとらなければならない。
3.調査票のプライバシー保護への配慮

外部のパンチセンターや計算センターに処理を依頼する場合、調査原票の匿名性が確保されるよう十分な配慮が払われなければならない。

*4「ベリファイ」とは、同じ調査票を複数のパンチャーが別々に入力し、両者のデータを比較することによってパンチミスを発見しようとする作業のこと。

チェックコントロールの作成

入力されたデータが調査票の内容を正確に反映し、チェック仕様に適合していることを保証するためにコンピュータでのチェックを行わねばならない。コンピュータでは主に机上作業でもれた論理的な誤りを発見する。

1.集計プログラムの特性の確認
  • 現状、会員社に於ては多数の集計方法および集計プログラムが採用されており、チェックコントロールの作成方法等も多様である。
  • いずれの場合に於ても、処理の内容がブラックボックス化することのないように集計業務に携わるスタッフには適切な教育が施されなければならない。
2.データ修正
  • データ修正の方法にも、大きく分けて次の2つの方法がある。
    1. データファイルを直接修正する方法
      データをエディター等で確認しながら上書き修正をかけていく方法。簡便だが、修正記録が残らないこと、ローデータ(パンチ直後のデータ)が直接修正されてしまうため、後戻りがきかない。
    2. パラメータにより修正する方法
      データ修正用のパラメータを作成し、ローデータファイルとは別に修正後のデータファイルを作成する方法。 面倒だが、修正記録が残るので事後に追跡ができること、いざという時にはローデータに立ち返ることができる点が優れている。
  • いずれにせよ、完成した作業内容が再追跡され(ドキュメントによる修正記録が残る)、ローデータが再構築できることが望まれる。
  • 論理チェックをクリアできなかったデータについて正当な理由がない限り、クライアントの合意なしに勝手に解釈したり、変更してはならない。

集計

クロス集計表にはすべて以下の事項が明示されていなければならない。

  1. (ウエイト付けなしの)標本基数(ベース)
  2. ウエイト付けした標本基数
  3. 表の明確なタイトル
  4. 行および列の明確な名称
  5. フィルターをかけた基数についての正確な記述
1.集計プランおよび結果表仕様の指定

集計の本作業に入る前に、分析軸とするブレイクダウン項目を設定し、どれとどれにクロスをかけるか、クロス集計計画表(通称クロス表)をあらかじめ打ち合わせ、確認されていなければならない。

  • ブレイクダウン項目の定義(明確化)
    (例: ヘビー/ミディアム/ライトのユーザー区分)
  • クライアントの求めがある場合、適切な事例にてアウトプットイメージを事前に提示しなければならない。
2.クロス集計にかかわる用語の確認

クロス集計にかかわる用語等については、会員社間でも必ずしも統一がとれていないのが現状だが、少なくともクライアントに対しては、各用語の意味(使い方)を適切に理解してもらうよう配慮されなければならない。

3.ウエイト付け

一般的にウエイトバックが必要となる理由は

  1. 層化サンプリングの段階でウエイト付けする場合
  2. 回収率の違いにより標本構成に偏りが出てそれをウエイト付けにより補正する場合
    上記2点が多いと考えられるが、これらの理由と使用したウエイト付け法をクライアントに明確に理解される形式で提示しなければならない。
  3. ウエイト付けをした場合、主な表すべてにおいて、ウエイト付けした基数(ベース)としない基数(両者を明確に区別)を明示すること。
  4. なお、ウエイトをかける前段階のサンプル数が、ウエイト付けをした時、統計的に有意な精度を保ちうるかどうかは慎重に検討すべきで、仮に少数のサンプルでウエイトバックを実施した場合には、報告書等に必ずその注記が必要となる。

集計プログラム作成と調査機関の責任範囲

集計プログラムの作成にあたっては、その集計ソフトの特徴や限界を正しく理解し、適切な処理が行われるよう細心の注意をもって運営されなければならない。

1.集計プログラム作成
  • 集計作業上、入力されたローデータおよび中間過程の計算ファイル、実行プログラム等は何らかの形式で保管され、トラブル等が発生した場合にいつでも立ち返ることができるよう整備されていなければならない。
  • 集計プログラムは基本的に調査機関に帰属するものと考えられるが、クライアントからの追加集計や再集計の要望等に的確に対応するため、調査完了後少なくとも最低限の期間(1年間)、現行のMR綱領に従って保管することを保証しなければならない。
2.データ納品

データ納品を要請される場合、クリーニング済みのデータをどのような形式で、またどのような媒体で提供するのか、事前に確認を行う。

その際、以下の事項をチェックする。
  1. ファイルフォーマットはクライアントが同意したソフトウェア仕様と互換性がある。
  2. すべてのディスクについてウイルス・チェックを行う。
  3. ファイル数および各ファイルのレコード数が正確である。
  4. すべてのディスクに内容を示すラベルを貼付し、出来れば使用上の制限に関する指示を添える。

統計的検定、多変量解析または他の特殊な加工技法を用いた場合のデータ提示方法

データは以下の基準に沿って提示しなければならない。

  1. 有意差検定を行った場合、検定表に付加する技術的な説明文、あるいは報告書の中に検定方法(t検定、カイ自乗検定など)と有意水準を処理のステップを含め明示しなければならない。
  2. 尺度項目にウエイト値を与えて、平均スコアを算出する場合は、報告書にその旨を明示しなければならない。
  3. 多変量解析または他の特殊な技法を用いた場合、処理加工と結果を吟味し、適切な手法とデータを用いて実施し、分析結果の報告には使用したプログラム名や分析ステップを明示しなければならない。
1.検定・解析
  • 統計的検定を行う際には、データの分布形態、データの尺度等に応じた適切な方法を選択しなければならない。
  • 検定をかけるデータ項目については、ヒストグラム等によって事前にデータの分布状況を確認し、正規分布と著しくかけ離れた状況などの場合には、そもそも検定を行う意味があるかどうかをチェックする必要がある。 (また、異常値チェックによる外れ値の除外、平均値、中央値のチェック等は当然の手順として組み込まなければならない)
  • データ中に不明・無回答を含んだサンプルがある場合には、場合によってはそれらを除外して分析を行うことが望ましい。
    ただし、サンプル数が少ないなど制約条件が大きい場合には、不明・無回答が全体の精度に極力影響を及ぼさないようなダミー数値を与えるなどの配慮を行い、かつ報告書等にそのようなステップの存在を明示しなければならない。
2.独自の分析手法に関する対応
  • 会員社が独自に開発した分析手法については、その原理や計算手順、特徴、期待される精度、手法の限界等を簡潔に解説した資料(小冊子・論文・報告書など)を作成し、その紹介に努めることが望ましい。
  • また、クライアントより独自の分析手法に関する問い合わせがあった場合には、当該受託業務の範囲内であれば誠意をもって適切な対応を行わなければならない。ただし、業務受託以前の段階においては、情報開示の程度は会員社の判断に委ねられる。