上のデータは,ある評価法(3段階評価)を用いて,被検者10人(a〜j)を対象に,検者A〜Eの5人で評価して判定した結果のデータです.
例えば検者Aはaを1と判定しています.データはかならずこの形式で入力してください.
解析したいのは,@ある評価法を用いて,被検者a〜iを検者A〜Eによって評価し,再現性(信頼性)はあるかどうかを知りたい.とします.
別に,検者A〜Eを検者Aのみとし,Aある評価法を用いて,被検者a〜iを検者Aによってくり返し5回評価し,再現性(信頼性)
はあるかどうかを知りたい.でもよいです.
@上表をEXCELに入力して,コピーします(ラベル[文字]部分はコピーせずデータ数値部分のみ).
ARを開いてコマンドライン先頭>から「x<-excel.w(5)」と入力します.xはR上でのデータ名(とりあえずこのまま入力してください),
(5)は,5列のデータという意味です.もし自分のデータが7列であれば,「x<-excel.w(7)」と入力します.
B入力が完了したら,まずはENTERキーを押します.
Cその後,コマンドライン先頭>から
>ICC.CI(x,95)
と入力し,ENTERします.”95”は95%信頼区間の意味です.99とすることで,99%信頼区間も指定できます.
> ICC.CI(x,95)
estimate lower bound-95% upper bound-95%
ICC(1,1) 0.2668539 0.02914107 0.6399035
ICC(1, 5 ) 0.6453804 0.13049438 0.8988383
ICC(2,1) 0.2800000 0.05134072 0.6433879
ICC(2, 5 ) 0.6603774 0.21296788 0.9002079
ICC(3,1) 0.3075758 0.05525117 0.6742791
ICC(3, 5 ) 0.6895380 0.22625289 0.9118987
全てのICCと,信頼区間が出力されます.
上述の@の場合は,ICC(1,1)を参照します.estimateがICC(1,1)の結果です.Aの場合は,ICC(2,1)を参照します.
estimateがICC(2,1)の結果です.ICC(3,1)はさしあたり気にしないでください.再現性が高いとは,ICCが,およそ0.7以上のときです.
ICCは被検者のデータのばらつきが大きいとき,高くなる性質を持っています.つまり,健康な20歳代の握力を対象としてICCを求めるときよりも,
健康な20歳代から70歳代までの握力を対象としてICCを求める方が高くなります.対象者の年齢に幅があれば値はばらつきますので,ICCも高くなります.
そこで,SEMを求め,これを比較する対策法があります.
例えば上の例の,検者A〜Cのデータと検者D〜Eのデータで範囲制約性の問題がないか調べたいとします.SEMは
>sem2(データ名)
で求められます.
@EXCELの検者A〜Cのデータをコピーし,Rでコマンドライン先頭>から「x<-excel.w(3)」と入力します.これでxというデータに検者A〜Cのデータが入ったことになります.
A同様に,EXCELの検者D〜Eのデータをコピーし,Rでコマンドライン先頭>から「y<-excel.w(2)」と入力します.これでyというデータに検者D〜Eのデータが入ったことになります.
BまずRで,ICCを求めます.関数はICC.CI(x,95)とICC.CI(y,95)です.
> ICC.CI(x,95)
estimate lower bound-95% upper bound-95%
ICC(1,1) 0.2297297 -0.12444906 0.6647228
ICC(1, 3 ) 0.4722222 -0.49706599 0.8560700
ICC(2,1) 0.2660944 -0.05116034 0.6725701
ICC(2, 3 ) 0.5210084 -0.17097532 0.8603794
ICC(3,1) 0.3100000 -0.07083631 0.7193753
ICC(3, 3 ) 0.5740741 -0.24758495 0.8849309
> ICC.CI(y,95)
estimate lower bound-95% upper bound-95%
ICC(1,1) 0.4626866 -0.16254582 0.8303722
ICC(1, 2 ) 0.6326531 -0.38819036 0.9073261
ICC(2,1) 0.4782609 -0.09528997 0.8322453
ICC(2, 2 ) 0.6470588 -0.21065306 0.9084431
ICC(3,1) 0.5076923 -0.13592367 0.8499581
ICC(3, 2 ) 0.6734694 -0.31461034 0.9188944
ICC(2,1)はy,すなわち検者D〜Eの方が信頼性は高いと判断します.
しかし,範囲制約性の問題があるのでSEMを求めて検討してから,ICCが高い低いと判断しなければなりません.
SEMは,被検者のデータそのものの大小に影響されず,純粋に測定間の誤差を表します.そして,SEMは小さいほど,データのバラツキが少ないことになります.
sem2(x),sem2(y)と入力すると,以下が出力されます.
> sem2(x)
SEM lower bound-95% upper bound-95% lower bound-99% upper bound-99%
0.7149204 0.5402029 1.0572418 0.4975959 1.2118257
> sem2(y)
SEM lower bound-95% upper bound-95% lower bound-99% upper bound-99%
0.5962848 0.4101457 1.0885836 0.3683130 1.3581059
SEMはxが0.7149204,yが0.5962848で,xの方が大きくなっています.つまりxのデータの誤差は大きいことがわかります.
これはICCが小さいこととも関連します.SEMが同じということは誤差自体は同一なので,ICCの値が異なっていても高い低いは議論できません.
逆に,SEMが有意に大きい小さく,かつICCが大きい小さいときは,根拠を持って高い低いの議論が出来ます.
有意に大きい小さいを判断するには信頼区間が役立ちます.
この例では,xのSEMの95%信頼区間は[0.5402029〜1.0572418]です.yのSEMの95%信頼区間は[0.4101457〜1.0885836 ]です.これらの信頼区間はオーバーラップしているのでICCの値を単純に比較すれば高い低いとなりますが,
有意にICCが高い低いとはいえないことになります.
うえの2つの表で,左の表と右の表では,左表の被検者eと,右表の被検者ほの値が異なるだけです.
「e」は「1,3,1」で「ほ」は「11,13,11」です.
ほ=e+10という関係にあり,データのバラツキ自体は差がありません(それぞれ検者の差は,2と-2で同一).
単に定数10だけ高くなっているということです.ICCを求めてみると,左はICC(2,1)=0.266,右はICC(2,1)=0.939です.
「右表の信頼性は高い」ということになります.しかし,ほ=e+10となっているだけで,データのバラツキ自体は差がありません(それぞれ検者の差は,2と-2で同一).
そこでSEMを求めると,両者ともSEM=0.7149204と同一になります.