どの統計の教科書にも必ず書いていることですが、データはすべて4つの尺度に分けることができます。
データがどの尺度かによって使える検定や解析方法が異なるので、これらの違いを区別することは非常に重要です。
一応自分の備忘録として、4つの尺度の特徴などについてまとめておきます。
4つの尺度について
データは水準が低いものから順に、名義尺度、順序尺度、間隔尺度、比例尺度の4種類に分けることができます。
名義尺度(nominal scale)
互いに上下関係のない尺度で、単にカテゴリー分けをしただけのものです。
0=男性、1=女性、とか。
0=脳外科、1=循環器内科、2=消化器内科、3=精神科、とか。
基本的には順番も恣意的なものになります。
なので、わざわざ数値を振らずそのままカテゴリー名を用いることも多いです。
名義尺度によるデータは
- モード
- 度数
- 連関係数
- χ²検定
などに適用できます。
順序尺度(ordinal scale)
データに大小関係だけを表す(ただし数値と数値の間隔は関係がない)尺度のことです。
数値の大きさに上下関係がある、というだけなので、「a=1、b=3、c=8」でも「a=10、b=21、c=22」でも測定における意味は同じです。
なので、加減乗除の計算はできません。
例えばアンケートにおける「非常に良かった」「良かった」「普通」「悪かった」「非常に悪かった」みたいなデータとか。
あと通信簿の5段階評価とか、地震の震度とか。
FIMやブルンストロームステージなんかも、順序尺度になりますね。
順序尺度のデータは(名義尺度で使えるものに加えて)
- 中央値
- 四分位偏差
- スピアマンの順位相関係数
- マンホイットニーのu検定
- ウィルコクソンの符号付き順位検定
などが適用できます。
間隔尺度(interval scale)
尺度の間隔が一定に保たれている尺度です。
つまり、1と2の間隔が、2と3の間隔と等しくなる(同じ意味をもつ)ということ。
よく例に挙がるのは、温度(摂氏)や時間、日数などです。
一部の検査のデータ(知能指数など)も間隔尺度とみなして扱うことがあります。
間隔尺度におけるデータは
- 算術平均
- 標準偏差
- ピアソンの積率相関係数
- t検定
- 分散分析
など、概ね何でもできます。
比例尺度(ratio scale)
単位が一定で、なおかつ原点が定まっている尺度です。
体重、身長、華氏の温度など、倍率関係を扱うことが可能なデータです。
体重80㎏の人は、体重40㎏の人の2倍重いですもんね。
ちなみに握力(㎏)や下腿周囲長(cm)も比例尺度になります。速度や経過時間、人数、金額なども同様に比例尺度です。
基本的には全ての統計的解析を扱うことが可能です。
量的データ、質的データ
名義尺度や順序尺度のデータは質的データ(または属性データ)と言うことがあります。
便宜上数字を当てはめることも多いですが、本来は単にカテゴリー別に分けているだけなので、数字に数値的な意味はありません。
これらのデータを扱うことが出来る検定を、パラメーターに左右されないことからノンパラメトリック検定と言います。
一方で、間隔尺度や比例尺度によるデータを量的データと言います。
コメント