Seminar (Psychology)
統計用語:難?
出口研究室 > 演習室 > ゼミ室 > やさしい統計用語のお勉強 > 統計用語:難?


t 検定と有意確率(p )
(てぃーけんてい・ゆういかくりつ)
※参照:標準偏差標本の大きさ
  Excelファイル

 心理学の研究で調査などをするときは,「○○小学校の5年2組の人たち」というような,特定の学級や小学生の特徴を探るのではなく,むしろ,全国に存在するあらゆる学級ないし小学生が持っている特徴を探ることを目的としていると思います。
 しかし,現実問題として,この世に存在しているすべての小学校に通っている子どもたちについて調査をすることは,非常に難しいものがあります。このため,数十人から数千人程度の児童に対して調査を行い,そこから「小学生の特徴」について考察することになります。
 つまり,調べようとしている「対象全体」ではなく,対象の一部分だけを取り出して,「対象全体」の特徴を探ろうとしているのです(具体的な例としては,新聞社などで行われている世論調査などを思い浮かべてみてください)。

 このように,調べようとしているものの一部に対してしか調査(測定)をしていない場合,そこにはいろいろな問題が出てきます。

 例えば,「日本の小学校に通っている男児と女児の勉強時間に差はあるのか」ということについて調べるとします。しかし,すべての子どもたちに対して調査を行うことは,現実には非常に困難です。そこで,ランダムに(無作為に)男女150人ずつ,計300人の児童を選び出し,「勉強時間」について回答してもらいました。
 その結果,男児の方が,女児よりも15分ほど勉強時間が短かったとします。

 このことから,「日本の小学校に通っている男児と女児とでは,男児の方が勉強時間が短い」と考えてもいいのでしょうか。

   

 この問いに対して正確に答えることは,なかなか難しいものがあります。調べようとしていることは,「日本の小学校に通っている男児と女児」であるにもかかわらず,「男女各150人ずつ,計300人」の子どもたちにしか調査を行っていないのです。実際には(すべての子どもたちに調査をしたら),勉強時間に差はなかったとしても,今回調査に参加してもらった子どもたちのうち,たまたま(偶然)男児は勉強時間が短い子が多く選ばれ,たまたま女児は勉強時間が長い子が選ばれてしまっただけかもしれません。

 このような時に,t 検定を使います。この検定では,男児と女児の「勉強時間の平均値」や「勉強時間の散らばり具合」(標準偏差),「人数」(標本の大きさ)を基にして,「実際には(日本の小学校に通っている子どもたち全体には)差がないにもかかわらず,偶然,(今回の調査で示された「差」以上の)差が出る確率」を計算します(ちょっとわかりづらい表現かもしれません…)。この確率のことを「有意確率」といいます。

 心理学では,一般に,有意確率が5%よりも低い場合に,「差がある」と見なしています。有意確率が5%ということは,「実際には差がないにもかかわらず,今回の調査で,偶然,差が生じた可能性は20回に1回である」ということを意味します。20回に1回という僅かな可能性(よりも低い確率)なのですから,「差がある」と考えてもいいことにしようね,という感じです。
 もしも,有意確率が5%よりも高かった場合,仮に平均値に差があったとしても,「差がある」と考えることはできないことになります(だからといって,「『差がない』と考えてもいい」ことを意味するわけではないことには,注意してください)。

 ちなみに,「有意確率が○○%よりも低い場合,これを意味のある差と考える」としたとき,「○○%」のことを「有意水準」といいます。ですので,心理学では,有意水準は5%に設定されることが多いということになります。


  −メモ−
  • 有意確率は「p 値」とも呼ばれ,文献中では「p 」で示されることが多いです。
  • 有意確率は,「有意である確率」(高いほど有意である可能性が高まる値)ではないことに注意してください。
  • すべての有意確率がt 検定によって算出されたものとは限りません。相関係数の有意性の検定でも「p 」は出てきます。
  • 検定では,各群(上の例では「男児」「女児」)の平均値だけでなく,標準偏差や標本の大きさ(n )も重要な役割を持っています。
  • 2つの群の平均値の差と標準偏差が一定であれば,n が大きいほど有意確率(p 値)は低くなります。また,平均値の差とn が一定であれば,標準偏差が小さいほど有意確率は低くなります。
  • 「有意でない」ということは,「nonsignificant; n.s. 」と表されることもあります。
  • 「有意水準」は「α」で表されることもあります。
  • t 検定の具体的な計算式やその詳細について知りたい人は,『吉田寿夫 (1998). 本当にわかりやすいすごく大切なことが書いてあるごく初歩の統計の本 北大路書房』などを読んでみて下さい。






因子分析(探索的因子分析)
(いんしぶんせき
(たんさくてきいんしぶんせき)

※参照:相関係数
 
 これは,心理学の論文ではよく見る分析です。「因子」という言葉がちょっと聞き慣れないかもしれませんが,因子分析による結果のおおまかな意味を把握することは,さほど難しくはないのではと思います。

 例えば,授業中の私語について研究することになったとします。一言で「私語」といっても,「冗談を言う」,「黒板で見えないところを友人に聞く」,「授業に対する感想を言う」,「授業と関係ない用事を話す」などなど,いろいろなものがあると思います。
 そこで,授業中に話している私語の話題を思いつく限り挙げることにしました。その結果,全部で8つの私語の「話題」が出てきました。

 しかし,このままでは,私語の話題は8つもあり,なんだかわけが分からなくなってしまいそうですね。できれば,1つ1つの私語の「話題」の後ろにある,私語の「テーマ」を探してみたいところです。こうした方が,「私語」というものを,もっとわかりやすく考えていけそうです。

 こんなときに,因子分析を使います。因子分析では,「『冗談を言う』人は,『授業と関係ない用事を話す』ことも多いな」とか,「『黒板で見えないところを友人に聞く』人は,『授業に対する感想を言う』ことも多いな」とかいうように,私語の「話題」同士の関連を基にして,その背景にある「テーマ」を探っていきます。
(なお,このような分析を行うためには,「私語の話題」1つ1つについて,「あなたはどのくらい,このような私語を行いましたか?」と質問していく必要があります。)

 そして,「私語には,どうも2つの『テーマ』があるようだ」とか,「1つめのテーマは『黒板で見えないところを友人に聞く』『授業に対する感想を言う』という話題と関連が強く,2つめのテーマは『冗談を言う』『授業と関係ない用事を話す』という話題と関連が強いようだ」などということが分かるようになります。
 この例で言うと,1つめのテーマは「授業に関係のある私語」,2つめのテーマは「授業と無関係の私語」と考えることが出来そうですね。

 なお,上の例での「テーマ」のことを,論文では「因子」(共通因子)と呼び,個々の「話題」のことを「項目」とか「(観測)変数」などと呼んでいます。ちなみに,因子分析表で「因子負荷量」と書いてあるものは,「因子」と「項目」の関連の強さ(と向き)を表した数字です。

  −メモ−
  • 通常,論文では「因子分析(主因子法,バリマックス回転)を行った」とか,「最尤法,プロマックス回転による因子分析を行った」などというように,「○○法(解),◇◇回転」という記述があります。もしも「バリマックス回転」と書いてあったら,「因子1と因子2の間には関連がない(相関がない)」ということを前提として分析しています。「プロマックス回転」と書いてあったら,このような前提なしで分析しています。これ以外にも色々な「回転」がありますが,ここでは省略します。
  • プロマックス回転などの斜交回転を行った場合,「因子間相関」というものが論文では記載されます。これは,文字通り「因子」と「因子」の相関です。上の例では,「『授業に関係のある私語』をする人は,『授業と無関係の私語』もするのかな?」といったことを表します。
  • 因子分析については,『松尾太加志・中村知靖 (2002). 誰も教えてくれなかった因子分析−数式が絶対に出てこない因子分析入門− 北大路書房』が分かりやすく説明しています。
  • 因子分析と似たような分析に「主成分分析」があります。因子分析と主成分分析とでは,上の例で言うところの「話題」と「テーマ」の関連に対する考え方が異なります。内容的に少々難しくなりますので,ここでは詳しい説明は行いませんが,興味のある人は上の松尾・中村(2002)などを読んでみて下さい。
  • 因子分析には,「探索的因子分析」と「確認的因子分析」があります。ここでは,探索的因子分析について説明しています。
  • 上の私語の例は,出口・吉田(2005)を参考に作成しました。よろしければご覧下さい。(「大学の授業における私語の頻度と規範意識・個人特性との関連−大学生活への適応という観点からの検討−」『社会心理学研究』第21巻2号, pp.160-169)






交互作用効果と主効果
(こうごさようこうか・しゅこうか)

 
 「交互」に「作用」に「効果」にと,なんとなく難しそうな言葉ですね。論文中では,単に「交互作用」と書かれていることもあります。この言葉の説明はちょっと長くなってしまうかもしれませんが,まずは,以下の例を読んでください。

 ある学校のA先生は,新しい授業の仕方を考えました。その授業とは,基本的に先生は何もせずに,生徒が自分で資料を集め,生徒同士の話し合いをもとにして学習を進めるというものです。A先生は,さっそくこの授業を行ってみようとしました。
 そこに,A先生の友だちのB先生がやってきました。B先生も新しい授業の仕方を考えたのです。B先生の授業は,面白い教材を使いながら,先生が生徒に対して,1つ1つ丁寧に学習内容を教えていくというものです。ただし,生徒同士の話し合いはほとんど行いません。
 さて,どちらの授業の方が優れているのかについて調べるために,実際にこの2つの授業を行ってみました。授業が終わった後,生徒たちには理解度テストを受けてもらいました。そして,A先生の授業を受けた生徒の点数と,B先生の授業を受けた生徒の点数とを比べてみることにしました。
 その結果,A先生の授業を受けた生徒の平均点は70点でした。一方,B先生の授業を受けた生徒の平均点も70点で,2つの授業の間には特に差が出ませんでした。

   

 …さて,このような時に,「A先生が考えた授業と,B先生が考えた授業は,どちらも同じような効果を持っている」と考えていいのでしょうか?

 2人の先生は,生徒1人ひとりのテストの点数を丁寧に確認してみました。すると,興味深いことがわかりました。生徒の性格によって,授業の効果が異なっていたのです。
 A先生の授業を受けた生徒のうち,テストで高い点数をとった人は,「人と話すことが好きな生徒」ばかりだったのです。「落ち着いて物事を考えることの好きな生徒」の多くは,あまり高い点数をとることはできませんでした。
 一方,B先生の授業を受けた生徒で高い点数をとった人は,「落ち着いて物事を考えることの好きな生徒」ばかりでした。「人と話すことが好きな生徒」は,あまり高い点数をとることができませんでした。

 このような時,「『テストの点数』に対する,『授業の仕方』と『生徒の性格』の交互作用効果が見られた」といいます。つまり,「生徒の性格」によって,「授業の仕方」が「テストの点数」に与える影響が異なるというようなことを,交互作用効果というのです。

 ちなみに,「話し好きか,思索好きか」という「生徒の性格」別の「テストの点数」を一緒にしても,「授業の仕方」によって点数に違いがでる場合,「『テストの点数』に対する,『授業の仕方』の主効果が見られた」といいます。

  −メモ−
  • 適性処遇交互作用(Aptitude Treatment Interaction; ATI)という言葉は,この交互作用効果と深く関連しています。興味のある人(特に教員を目指している人)は,『小川一夫(編著) (1990). 学校教育の社会心理学 北大路書房』などを読んでみてください。
  • 「交互作用効果」「主効果」という言葉は,「分散分析」という言葉と一緒に出てくることが多いです。分散分析とは,例えば,試験の成績に地域差はあるか,男女間に差はあるかなど,複数の群の間に,(平均値の)差があるかどうかを調べるための分析です。
  • これらの「効果」以外にも,「単純主効果」,「単純交互作用効果」,「単純単純主効果」など,いろいろな「効果」があります。関心のある人は,『森 敏昭・吉田寿夫(編著) (1990). 心理学のためのデータ解析テクニカルブック 北大路書房』を読んでみてください。






重回帰分析
(じゅうかいきぶんせき)
※参照:相関係数偏相関係数
  Excelファイル

工事中です(「計算法」のファイルは使用できます)。

  −メモ−
  • …。






パス解析と共分散構造分析
(ぱすかいせき・きょうぶんさんこうぞうぶんせき)
※参照:相関係数
 
 「共分散構造分析」…,なんともまあ長い名前です。「構造方程式モデル」とか,英語でSEM (Structural Equation Modeling)とも呼ばれたりもしますが,どちらも難しそうな名前ですね。

 この分析は,論文では「パス解析」という言葉と一緒に出てくることが多いようです。では,「パス解析」とは,なんでしょうか?
 例えば,「人と仲良くなりたいと思う → 他人の気持ちを考えるようになる → 困っている人を助けることが多くなる」というように,人の気持ちや関心,そして行動との関係を表した「モデル」があったとします。パス解析とは,「このモデルが,どのくらい現実にあてはまるのか」とか,「『気持ちと関心』『関心と行動』との関連はどうなっているのか」ということについて調べるものです。

 ある事柄同士の関連を調べる場合,「相関分析」がよく使われます。ただし,相関分析は,基本的には2つの事柄の関連しか見ることはできません。

 しかし,共分散構造分析では,3つ以上の事柄(ここでは「気持ち」「関心」「行動」)の関係も,まとめて調べることが出来ます。このため,たくさんの事柄の関連について調べるときに,よく用いられます。
 また,多くの場合,「パス図」と呼ばれる図も一緒に掲載されます。パス図では,事柄と事柄を結んだ矢印の近くに数字が書いてあります。これは「パス係数」と呼ばれるものです。パス係数は,相関係数と同じように,ある事柄とある事柄との関係を数字で示したものです。

  −メモ−
  • 共分散構造分析について詳しく知るためには,「観測変数」「潜在変数」などの言葉を知る必要があります。これは内容的に少々難しくなりますので,ここでは詳しい説明は行いません。興味のある人は『山本嘉一郎・小野寺孝義(編著) (1999). Amosによる共分散構造分析と解析事例 ナカニシヤ出版』などを読んでみて下さい。なお,相関係数や因子分析との関連も含めて,共分散構造分析について考えてみたい人は,『南風原朝和 (2002). 心理統計学の基礎−統合的理解のために−(有斐閣アルマ) 有斐閣』がおすすめです。






分散分析と多重比較
(ぶんさんぶんせき・たじゅうひかく)
※参照:t 検定と有意確率交互作用効果と主効果
 
工事中です。

  −メモ−
  • …。






偏相関係数と擬似相関
(へんそうかんけいすう・ぎじそうかん)
※参照:相関係数重回帰分析
  Excelファイル

 「偏相関係数」の前に,「相関係数」の復習をしておきます。相関係数とは,簡単に言うと,「ある事柄とある事柄の関係の強さと向きについて表した数」でしたね。これに「偏」(英語だとpartial)が付いて,「偏」+「相関係数」で「偏相関係数」となっています。

 とりあえず,以下の例を読んでください。

 ある人が,小学生を対象に,「手のひらの大きさ」と「理科の学力」との相関係数を計算したとします。なんとなく,両者の間には何の因果関係もないような気がしますよね。しかし,(驚いたことに)正の相関係数(それも統計的に有意な)がでてしまったとしましょう。
 なぜ,こんなことが起こったのでしょうか? 「理科の学力が高くなると,手のひらが大きくなる」とも思えませんし,「手のひらが大きくなると,理科の学力が高くなる」というのもなんだか妙ですよね。

 さて,ここで,「手のひらの大きさ」「理科の学力」という2つの事柄以外に,「児童の年齢」という3つめの事柄を含めて,もう1度考えてみましょう。
 まず,「児童の年齢」が上がる(成長する)と,「手のひらの大きさ」は大きくなるはずです。また,同じく,「児童の年齢」が上がる(学年が上がる)と,「理科の学力」も高くなるはずですね。

 このように,「手のひらの大きさ」「理科の学力」という事柄に対して,「児童の年齢」という3つめの事柄が,それぞれ影響を及ぼしているとき,「手のひらの大きさ」「理科の学力」との間に,「見せかけの相関関係」が生じることがあります。この「見せかけの相関関係」のことを「擬似相関」といいます。

 擬似相関が疑われる場合,「偏相関係数」を計算したりします。「偏相関係数」とは,上の例でいうと,「児童の年齢」が「手のひらの大きさ」に与える影響を取り払った値と,「児童の年齢」が「理科の学力」に与える影響を取り払った値との,相関係数のことです。つまり,「児童の年齢」が,「手のひらの大きさ」と「理科の学力」の双方に与える影響を取り払って計算した,「手のひらの大きさ」と「理科の学力」との相関係数です。

  −メモ−
  • 「偏相関係数」(partial correlation coefficient)に似た言葉として,「部分相関係数」(part correlation coefficient, semi-partial correlation coefficient)というものがあります。英語での表記もかなり似ていますが,この2つの意味はちょっと異なります。詳しくは,『南風原朝和 (2002). 心理統計学の基礎−統合的理解のために−(有斐閣アルマ) 有斐閣』などを読んでみてください。