SPSS使い方|中央値の出し方とt検定のやり方【備忘録】

2020年12月3日

私的備忘録レベルで、SPSSの使い方を記事にします。

「SPSSの使い方が知りたい」
「t検定がやりたい」
「MWT-U検定がやりたい」
「標準偏差が出したい」
「中央値が出したい」
「パーセントタイルが出したい」
「ロジスティック回帰分析がやりたい」

上記を解決すべく、SPSSの使い方(操作方法)を解説。

t検定のやり方

操作方法

分析→平均の比較→独立したサンプルのt検定

操作方法はこのサイトが分かりやすい>t検定|SPSSの使い方

t検定は、母群間が「正規分布」で「等分散」していなければいけない。

引用元:F検定/役に立つ薬の情報~専門薬学~

正規分布するかどうか迷ったら、ノンパラメトリック検定を選択する。

正規分布に従うか迷う場合はノンパラメトリック解析を選択しましょう。

なぜなら有意差が出にくいノンパラ解析で、「有意差あり」なら「確実に有意差がある」からです。

-中略-
しかし、MWUで「有意差なし」でもで「有意差なし」でもt-testで有意差が検出されることがあるので、そういう場合は、母集団の正規分布の検討が必要です。

引用元:医学研究初心者のためのやっぱりわかりにくい統計道場

等分散しているかどうか検討は「F検定」を行う必要がある。

F検定のやり方と統計量F(F値)

F検定によって求めた統計量F(F値)によって、等分散するかどうかを判定する。

・仮説の設定
帰無仮説(H0):「2群間の分散に差がない(等分散である)」と仮定する。
対立仮説(H1):「2群間の分散に差がある(等分散でない)」と仮定する。

-中略-

・判定
1≦F≦Fαのとき、P>0.05となる→帰無仮説を棄却できない→等分散である。
F>Fαのとき、P<0.05となる→帰無仮説を棄却する→不等分散である。

引用元:F検定/役に立つ薬の情報~専門薬学~

FαはF分布表で確認する。

付表4.F分布表

F値は、比較したいA群とB軍の不偏分散の割り算で求める。

このとき、分子の方が大きい数値になるようにする。

F値がF分布表の値よりも大きい場合→「帰無仮説(等分散である)」を「棄却する」ので、要は2群は「等分散していない」という事になる。
F値がF分布表の値よりも小さい場合→「帰無仮説(等分散である)」を「採択する」ので、要は2群は「等分散している」ということになる。

MWT-U検定のやり方(P値、中央値、パーセントタイル)

日付や係数など、平均値に“ばらつき”がある(正規分布しない)集団の検定は「ノンパラメトリック検定」を行い「中央値」と「パーセントタイル」を出す。

MWT-U検定|P値の出し方

P値の出し方:分析→ノンパラメトリック検定→過去のダイアログ→2個の独立サンプルの検定

「検定変数リスト」に検定した項目を選ぶ
「グループ化変数」に0,1で因子を選ぶ

MWT-U検定|中央値、パーセントタイルの出し方

MWT-U検定の場合、中央値とパーセントタイルも必要。

中央値、パーセントタイルの出し方:分析→記述統計→探索的

カイ2乗(カイ2二乗)検定のやり方

分析→記述統計→クロス集計表

「行」と「列」を選択。

統計量を「カイ二乗検定」にチェックを入れる。

クロス集計|SPSSの使い方 (kokugakuin.ac.jp)

Log-Lank(ログランク)検定のやり方

Log-Lank(ログランク)は、イベント発生の検定を行うときに使う。

カプランマイヤー曲線というもので表される。

引用元:第6章 再犯リスク要因を特定する-生存時間分析

何に何検定をあてはめるのか

平均値などで比較する場合

  • 正規分布する場合→パラメトリック検討(t検定など)
  • 正規分布しない場合→ノンパラメトリック検定(MWU検定など)
  • 同じ母集団の時間別での比較→対応のあるt検定
  • 違う母集団の比較→対応のないt検定
  • 原因の検索→ロジスティック検定

原因の有無で比較する場合

  • 性別(0,1)で分けたり、疾患の有無(0,1)で分けた検定→解二乗検定

イベント発生などを比較する場合

  • 生存曲線→Log-Lank検定