統計における尺度の種類

アイキャッチ画像。表情尺度スケールっぽいイラスト。 統計

どの統計の教科書にも必ず書いていることですが、データはすべて4つの尺度に分けることができます。

データがどの尺度かによって使える検定や解析方法が異なるので、これらの違いを区別することは非常に重要です。

一応自分の備忘録として、4つの尺度の特徴などについてまとめておきます。

4つの尺度について

データは水準が低いものから順に、名義尺度、順序尺度、間隔尺度、比例尺度の4種類に分けることができます。

名義尺度(nominal scale)

互いに上下関係のない尺度で、単にカテゴリー分けをしただけのものです。

0=男性、1=女性、とか。

0=脳外科、1=循環器内科、2=消化器内科、3=精神科、とか。

基本的には順番も恣意的なものになります。

なので、わざわざ数値を振らずそのままカテゴリー名を用いることも多いです。

名義尺度によるデータは

  • モード
  • 度数
  • 連関係数
  • χ²検定

などに適用できます。

順序尺度(ordinal scale)

データに大小関係だけを表す(ただし数値と数値の間隔は関係がない)尺度のことです。

数値の大きさに上下関係がある、というだけなので、「a=1、b=3、c=8」でも「a=10、b=21、c=22」でも測定における意味は同じです。

なので、加減乗除の計算はできません。

例えばアンケートにおける「非常に良かった」「良かった」「普通」「悪かった」「非常に悪かった」みたいなデータとか。

あと通信簿の5段階評価とか、地震の震度とか。

FIMやブルンストロームステージなんかも、順序尺度になりますね。

順序尺度のデータは(名義尺度で使えるものに加えて)

  • 中央値
  • 四分位偏差
  • スピアマンの順位相関係数
  • マンホイットニーのu検定
  • ウィルコクソンの符号付き順位検定

などが適用できます。

間隔尺度(interval scale)

尺度の間隔が一定に保たれている尺度です。

つまり、1と2の間隔が、2と3の間隔と等しくなる(同じ意味をもつ)ということ。

よく例に挙がるのは、温度(摂氏)や時間、日数などです。

一部の検査のデータ(知能指数など)も間隔尺度とみなして扱うことがあります。

間隔尺度におけるデータは

  • 算術平均
  • 標準偏差
  • ピアソンの積率相関係数
  • t検定
  • 分散分析

など、概ね何でもできます。

比例尺度(ratio scale)

単位が一定で、なおかつ原点が定まっている尺度です。

体重、身長、華氏の温度など、倍率関係を扱うことが可能なデータです。

体重80㎏の人は、体重40㎏の人の2倍重いですもんね。

ちなみに握力(㎏)や下腿周囲長(cm)も比例尺度になります。速度や経過時間、人数、金額なども同様に比例尺度です。

基本的には全ての統計的解析を扱うことが可能です。

量的データ、質的データ

名義尺度や順序尺度のデータは質的データ(または属性データ)と言うことがあります。

便宜上数字を当てはめることも多いですが、本来は単にカテゴリー別に分けているだけなので、数字に数値的な意味はありません。

これらのデータを扱うことが出来る検定を、パラメーターに左右されないことからノンパラメトリック検定と言います。

一方で、間隔尺度や比例尺度によるデータを量的データと言います。

コメント

タイトルとURLをコピーしました