2006年2月11日土曜日

相関係数=cosθ

次元の話で,
n次元とは別に,縦横高さ・・・ではなく,
 (バスト,ウェスト,ヒップ,身長,体重)
でもいいし,
 (風速,気圧,湿度,温度,降水量,日照量,風水)
でもいい.

と書いたが,これはもちろんベクトルであるが,統計量と見れば相関が計算できる.

(バスト,ウェスト,ヒップ,身長,体重)

としたとき,2人のデータ
 A=(a1,a2,a3,a4,a5),B=(b1,b2,b3,b4,b5)
について,内積
 A・B=a1×b1+a2×b2+a3×b3+a4×b4+a5×b5
とそれぞれの大きさ
 |A|=√(a1^2,a2^2,a3^2,a4^2,a5^2),|B|=√(b1^2,b2^2,b3^2,b4^2,b5^2)
が計算でき,なす角θに対し,
 cosθ=A・B/(|A||B|)
が計算できる.この cosθ は統計における「相関係数」である.
-1≦cosθ≦1 であるが,1に近いほど「正の相関が強い」
0に近いほど「相関が無い」
-1に近いほど「負の相関が強い」
といえる.

国語と数学の成績について,全国10万人のデータの相関を調べるのは,代数的には10万次元のベクトルのcosθを計算していることになる.

ついでにいうと,フーリエ解析は無限次元のベクトルと見ることができる.

0 件のコメント:

コメントを投稿

スパム対策のため,コメントは,承認するまで表示されません。
「コメントの記入者:」は「匿名」ではなく,「名前/URL」を選んで,なにかニックネームを入れてください.URL は空欄で構いません.