29第4章 ■ 平均の検定第4章2)正規分布の確認図2に示すように,データが正規分布する場合には左右対称の分布となり,平均値,中央値,最頻値は同様の値となるが,非常に偏った分布の場合にはこれらは異なる値となる.正規性の検討の基本的な方法は,平均値,中央値,最頻値が近い値であることを確認するととともに,ヒストグラムにより左右対称性や平均値周辺で頻度が最も高くなっているかを視覚的に確認することであるが,標本サイズが小さいとわかりにくいこともある.ほかの正規性の検討方法としては,正規確率紙による直線性の確認,尖度・歪度の検定,Kolmogorov-Smirnov検定などの方法が知られているが,統一的な判断基準があるわけではない.Kolmogorov-Smirnov検定など,データが正規分布するかどうかを統計学的に判定する「正規性の検定」は,標本サイズが大きいと有意な結果が出やすくなる(正規分布が棄却されやすくなる).つまり,正規分布からのずれはわずかであっても,標本サイズが大きいと,統計学的には「正規分布していない」と判定されてしまう傾向がある.ただ,実際には平均値の検定が不適切なほど正規分布を逸脱していないことも多い.正規性の検定結果を過大評価せず,視覚的な確認も含め,よく吟味する必要がある.検定の結果,帰無仮説を否定(棄却)できなかった場合,それは「比較する平均値が等しい」ことを保証するものではない点に注意する必要がある.「比較する平均値に有意な差を認めなかった」などと表現するのがよい.memo 検定の結果の解釈正規分布しない場合,どうすればよいでしょうか?question!医学関連のデータでは正規分布しないこともよくありますが,この場合,前述のようにノンパラメトリック法(第16~18章参照)やカイ2乗検定などを用いて割合を比較するなどの方法が1つの解決策です.ほかには,一見,正規分布していないようにみえても,対数をとる,逆数をとる,平方根をとるなど,データを変換することによって正規分布として取り扱える場合があり,この方法で解決している研究論文も数多くあります.医学研究でよく使われるのは対数をとる(対数変換する)方法で,対数をとった分布が正規分布する場合は対数正規分布とよばれます.answeradvice図2 データの分布と代表値正規分布の一例非正規分布の一例平均値中央値最頻値平均値中央値最頻値
元のページ ../index.html#3