スキップしてメイン コンテンツに移動

サーベイ(Survey)におけるサンプリング(Sampling)のまとめ@ケンタッキー大学院


サーベイ研究のサンプリング方法のまとめ

はじめに

Probability SamplingとNon-probability Samplingの違いを理解するのが目標。

個人的にはRandom SamplingとNon-random (Biased)Samplingと言ってくれた方がわかりやすいと思った。

基本用語

  • Margin of error:標準偏差(SD)に似てる。サーベイで取ったデータは対象となる全人口(Population)ではないので、誤差が生じる。±Margin of errorと表示する。
  • Population:研究対象となる単位(Unit/Element)を総合したもの。研究対象全体のこと。例えば、ある学校の生徒全体を対象にする場合は、その学校の全生徒。
  • Unit of analysis:サーベイデータを取ろうとしている要素(Element)例えば研究対象がある学校の生徒なら、「生徒」がUnitになる。
  • Population parameters:Populationの変数(Variables)のデータ・情報。例えば、全生徒の人種やフルタイム・パートタイム・休学中の情報などを全て集めたら、Population(全生徒)の内訳がわかる(Parameters)。

注意点
ここで大切なのは、Populationをきっちり定義すること

ある大学キャンパスの生徒をサーベイする場合、「生徒」をちゃんと定義しているか?

フルタイムの学生、パートタイムの学生、休学している学生を含むのかどうか、把握し定義しないと、サーベイ結果をその大学の生徒に適応(Generalize)することはできない。

注意点:
通常、全てのサーベイ研究対象者の情報を集めることは不可能。なので、統計計算で、サーベイでとったサンプルのデータからPopulation parametersを推定する(Sample statistics)。

Sampling error:もちろん、統計計算で推定したPopulation parametersと実際の値は誤差があり、その誤差をSampling errorと呼ぶ。


プロバビリティ・サンプリング

サンプリングは、調査対象を特定してサーベイ・研究への参加をお願いするプロセス
特別な理由がないかぎりは、プロバビリティサンプリングがベスト。

出来る限りPopulation(研究対象全部)に近い特徴をもったサンプル(実際にサーベイをお願いし、答えてもらう人達)を選ばないと、サーベイ結果を研究対象全体を反映するものと主張することはできない。

例えば、大学のすべての生徒を対象にした研究で、その大学の医学部生が全体の5%、工学部が全体の15%だとしたら、実際のサーベイ結果も、医学部生の回答が全体の5%、工学部生が全体の15%近くであるべき。

それを可能にするには「ランダム」にサンプリングする必要がある。

「ランダム」はテキトー、という意味ではなく、「ランダム化比較試験RCT」が、研究に参加する人を2グループに「ランダム」に振り分けて、サンプルの背景因子が両群で同じようにするように

サーベイでも、Populationの背景因子(Variable Parameter)とサーベイするサンプルのVariablesが同じようになるように意図的ではなくランダムに選ぶ必要がある。



プロバビリティサンプリングの種類


  • Simple(単純)ランダム・サンプリング
  • Stratified(階層化)ランダム・サンプリング
  • Systematic(システマティック)ランダム・サンプリング
  • Cluster or Multistage(クラスター・多段階)ランダム・サンプリング


シンプル:研究対象となるUnit(例えば生徒)の全てのリストが手に入る場合。例えば学生IDからランダムに必要なサンプル数だけ対象者を抽出するなど。

階層化:サンプルのVariableをPopulationに揃えたい場合。例えば、医学部と工学部、その他を5%、15%、80%になるように100人をサーベイしたい場合、医学部生5人、工学部生15人、その他の学部から80人サーベイする。この時、それぞれの学部の誰にサーベイするかは、シンプルランダムサンプリング同様のランダムな抽出を行う。
もしくは、サーベイを取った後に、Populationの割合に応じて、「Weightingテクニック」で調整することも可能。

システマティック:Populationの数が大きい場合、毎n人目の人をサーベイする。Populationga5万人として、100人サーベイしたい場合、50000/100でリストから500人ごとにサーベイをとる。

多段階:大きな「Cluster」から初めて、徐々に小さな「Cluster」を選んでいく方法。例えば、選挙で候補者の投票前の支持率が知りたい場合、まずは「県」をランダムに10県抽出、次にその10県の市・郡からまたランダムに10か所をランダムに抽出、さらにそこから、番地をサンプリングに必要な数ランダムに抽出、といった具合。

ようするにキーワードはランダムにサンプリングをしたかどうかと思った。ランダムであれば、全ての研究対象が等しくサーベイを受けるチャンスがある。


ノン・プロバビリティ・サンプリング

ランダムにサンプリングしていない時点で、サーベイの結果は、サーベイに答えた人にしか適応できない(Generalizabilityが限定される)。研究対象全てが等しくサーベイを受けるチャンスがない=バイアスのかかった、偏ったデータをとっていることになる。



ノン・プロバビリティ・サンプリングには以下の方法がある


  • Convenience sampling(Accidental)
  • Purposive sampling(Judgmental)
  • Quota sampling
  • Snowball sampling


コンビニエンス(都合):研究対象のうち連絡できる人だけにお願いするとか。お店から出てくる人にお願いするとか、ボランティアで「Opt in」した人だけにお願いするなど。

Purposive(あえて):研究対象の中でも、ある特定のグループの人たちから情報を得た方がよいとわかっている場合、はっきりとした理由がある場合、そのグループの人たちにサーベイをお願いするよねという話。質的研究ではよくみられるが、この本は「量的」サーベイを扱っているので注意。

Quota(割り当て式):階層化と似たようなアプローチ。ただランダムにサンプリングはしない場合はQuotaとなる。例えば、医学部生5人を医学部で出待ちしてサーベイをお願いし、工学部15人は工学部前で出待ちしてサーベイをお願いする場合。「出待ち」はAccidentalサンプリングにすぎない。

雪だるま式:研究対象をどう見つけるか難しい場合。例えば、「医学教育の専門家」をサーベイするためにPopulationを定義したとしても、システマティックに対象を見つける方法がなければ、まずは知っている専門家にサーベイをしてもらいつつほかにも専門家を紹介してもらうとよい。問題点は、知り合いの知り合いをサーベイしていくのでどうしても似たり寄ったりのグループをサーベイすることになる。質的研究ではよくやることだが、量的サーベイではここは大きな欠点になってくる。


しかし、このサーベイコース、ぺースが早すぎる。先週は締め切りが1週間に3つ。今週は4つ!

コメント

このブログの人気の投稿

同僚がよくお世話になっているCureusというオープンアクセス・ジャーナル

Cureusに毎月のように同僚がケースレポートを出している件 「俺、この数か月で7つケースレポート出版した」 という信じられない言葉を耳にした時も「いや無理でしょ」と思ったが 同期の(主に外国人医師)同僚に頼まれ、とりあえず「レビューアー」だけやってみることに。 サイトからアカウントを作って、すぐに登録は無料で簡単♪ (注:宣伝ではありません) どうやら、論文執筆するか、レビューするかでポイントがたまるらしい。 インパクトファクターはないからとりあえず 戦闘力 みたいなものをつけてるのかしら? 一番、驚きなのは同期の人曰く、論文を提出した人がレビューアーを3人くらいまで「 指定 」できること。 普通レビューアーを編集者に「提案」することはあっても、「指定」はできない。  そして、さらに3-4人ほど、編集者から関係ないレビューアーへ依頼が行くらしい。 (自分がファースト・オーサーで使うことはよほどのことがないと使わなそうなので、ほんとかどうかは知らないし、同僚のためにも調べないことにした) でも、6-7人がレビューするうち、 約半分はフレンドリーなコメントが来る ってことだと想像している🙊 早速、2件ほどケースレポートのレビューを丁寧にしたが 1つは、30か所以上コメントする始末。突っ込みどころ満載。この人からはレビューアー評価★5もらえたが。 1つは、15か所ほど指摘。 どちらも症例自体はよいんだけれど、こんなの世に出してる場合じゃない。さすがに、これからはレビューアーとしては敬遠されるかな。 最近初めてCureusで症例報告を出版した同僚が言っていた 「 2-3日で審査が終わって、指摘されたところをアップデートしたらアクセプト、そのままオンラインで出版された 」  え?6-7人の審査がそんなに早く終わったの? と聞いたところ 全くコメントせずに提出するレビューアーも中にはいるらしい😱 なるほど、確かにレビューもとても簡単で、オンラインで直接文章にメモとして書き込めるようになっており、「SUBMIT」を押して、最後の総括コメントいれて終わり だから、そういう人が出てくるのも致し方ないか? だからそんな多くのレビューアーにお願いするのだろうと想像している ...

KY(ケンタッキー)州ドライバーズライセンス(運転免許)を取得

さてさてどっぷり5月病にはまってしまい、日記を書くこともおざなりになってしまっている今日この頃 最近ケンタッキー州の運転免許を取得したので記録 NY州で取得した免許をWI州に移すときは書類提出だけで済んだと記憶しているが KY州はビザ持ちの場合、書類、筆記試験、路上試験と一からやり直さなくては免許が取れない。つまり、免許の移行というものができないらしい。 6月まで使っていた臨床トレーニング用Jビザは、一年ごとの更新のため、運転免許証もビザの期限に合わせて期限が1年になっているのがつらいところ。 7月に引っ越してすぐにWI州の免許が期限切れで使えなくなってしまうのだ   そのため6月に日本に一時帰国した際に、地元の運転免許センターで国際免許証を取得しておいた 期限は一年間で、これでケンタッキー州の運転免許をとるまで1年間の猶予が与えられることになる 元J2の妻は、NYにいたときに就労許可証を取得していた経緯があったので(結局働くことはなかったが)、ソーシャルセキュリティナンバーを持っており あとは、仕事の契約書か給与明細と、電気やガス代などのUtility関係の請求書さえあれば申請可能な状態だった   ガスかなにかの請求書に妻と自分の名前を併記してもらうようにお願いし まつこと、、、 2か月、ようやく請求書が手元に届き   市の運転免許センターらしきところへ 受付窓口に並んでいると、アメリカ国民でなければ違う窓口でまずは書類審査をうけろと言われた(入口入ってすぐにあるドアから入る) 同じ建物内の、違うドアから入り、狭い待合室で待たされたのち なにか書類を持たされ、通常の受付へと通された そのあとはしばらく待った後に、筆記試験を受けてその日は終了 筆記試験は、一問解くごとに正解不正解が分かるようになっており、親切だったが 当日の朝に、ネットで練習問題を一度見ただけの知識では結構難しい問題も普通にあった 僕らは国際免許証を持っていたためかLearner Permitというものはもらえなかった 帰り際に路上試験の予約をしようとしたが、次の週までの予約しかとっておらず 後日電話にて予約をとった(なかなか電話にでてくれず苦労した) ジョークのような ...

アメリカで言語療法(スピーチセラピー)と作業療法(オキュペイショナルセラピー)を受けるべきか

アメリカの健診で、子供の言葉の遅れを指摘された。セラピーを受けるべきか? 自分の身に起こったことだが 、言葉が遅れているからセラピーを勧められても、一人目の子供だと特にどうしたらいいか分からない。 結論としては、「とりあえず受けてみる」べきだと思う。 その時はマンハッタンに住んでいたので、家では日本語、デイケアにも入れる余裕はなく(週2で月1000どる越えとか今でも無理)英語を話す子供との触れ合いも少なく、言葉が遅れるのは半ば必然の状況でもあった。 しかし、小児科の先生も「バイリンガルの環境だと遅れることはよくあります」と事情を汲んだうえでセラピーの評価だけでも勧められたので 言われたように州が運営するBirth to threeに連絡。スムーズに手続きが進み(聴覚検査はやらされたか)、最初の言語聴覚士評価 に向かった。 若い言語聴覚士の人があの手この手で一緒に遊んでくれ、言葉を引き出していた。 こんな方法があったのか! といろいろな発見や学びがあったのに驚いた。普段遊んでいても出さないような音を真似して発していた。  そして評価が終わってセッションが始まる前にWI州に引っ越し WI州のBirth to threeの評価をまた受けるのであった。 各州に3歳未満のためのBirth to threeプログラム、3歳以上は各学区(スクールディストリクト)が運営するプログラムがあるはずだが(義務らしい)、それぞれシステム、プログラム、費用負担が違うので確認が必要   有効かどうか見極めるためにもまずは連絡をとることから始めるべき そして、パブリックのサービスがうまく都合にあわなければぷプライベートのセラピークリニックをプライマリケアから紹介してもらうことも可能である。   アメリカの子供の発達支援のシステムとクオリティは日本よりもだいぶ個別化されており良質である(と感じる)  日本でセラピーを受けたことはないので完全な比較はできない。保健師として地域母子保健を仕事にしていた妻から聞くに、日本では、例えば1歳半健診は、多くの子供を一堂に集めて一気にスクリーニングする。効率とコストの面では圧倒的に優れているこのシステム、裏を返すとすごく「雑!」なシステム。 ...