1相关系数是在算两组资料之间
1.相關係數是在算:兩組資料之間,到底有多 “麻吉”!
,,,,2.記得向量的重要工具>>> 嗎?可以利用它來記a,b,abcos,
相關係數的公式喔!
X:x,x,x,..........,xY:y,y,y,..........,y ◎若給兩組資料 , 123n123n
,【規格化】: 令 (x,X,x,X,,,,,,,,x,X)a,12n
, b,(y,Y,y,Y,,,,,,,,,y,Y)12n
n
(x,X)(y,Y),,ii,a,bi,1則 = =r (相關係數) cos,,,,nnab22(x,X)(y,Y),,iii,1i,1
*【疑問1】 “麻吉”的意思是什麼呢?
◎當兩向量同向 = r 兩組資料完全正相關(很 “麻吉”) cos,,1,,
◎當兩向量反向 r兩組資料完全負相關(不 “麻吉”) cos,,,1,,,
,*【疑問】為何不令 a,(x,x,x,..........,x) 123n
, b,(y,y,y,..........,y) 呢? 123n
*【自圓其說】
上述假設不易顯示向量各分量中的『正負號』,不太具有代表性!
*【例題1】已知三位學生的數學與物理成績如下:
數學(X) 60 40 80
物理(Y) 40 10 70
請問:數學與物理成績的相關程度如何?
,,X,(60,40,80)Y,(40,10,70)(做法一): 令: ,
(注意到了嗎?所有的分量都是正的!不太合理吧!求出來的 r 呢?)
,,X,Y=0.96 (不太好看….修正一下吧!) r =cos,,,,XY
,,X,(0,,20,20)Y,(0,,30,30)(做法二) ,,令, ?X,60Y,40
(注意到了嗎?分量有正、有負,比較合理吧!求出來的 r 呢?)
,,X,Yr == 1 (完全正相關)……….(漂亮吧!) cos,,,,XY
從上面的比較,各位就知道【規格化】的用心良苦了吧! *【整理】
若想問兩組資料之間的「相關程度」,可視為:將兩組資料當作
兩個向量,仿照上頁所提方法加以【規格化】後,再求其 “規格化” 向量之夾角的cos值。
*【特性】
(1)
, ?cos,,1?r,1
(2)當兩向量同向 = r 兩組資料完全正相關 cos,,1,,
當兩向量反向 r 兩組資料完全負相關 cos,,,1,,,
(3)可將兩組資料化身成n個序對,描繪在座標平面上加以觀察:
若n個序對排列之後看起來愈像一直線愈接近1 (可用例r,
一驗證)
(4)令 ,,,,則: X,aX,bY,cY,d
◎ 若r,r同號 a,c,,,XYXY
◎ 若r,,r異號 a,c,,,XYXY
*【問題】:
但是,萬一情形並不像例題一這麼美好的話,所形成的圖形不僅不
是一直線,相關係數也不容易算了………..那怎麼辦呢? 唉…….只好退而求其次來找【最適合直線】了!