「ほっ」と。キャンペーン
試験勉強_2
さてさて、一部の人のための試験勉強ファイルですが、
やっと3日目の復習です。興味のある人はクリックして
続きを読んでくださいね。




11/9 の復習 (主成分分析とか)

主成分分析に行く前にちょっと前回の復習。

x<-c
plot(x$height,x$weight)
res<-lm(weight~height,data=x)
abline(res)
summary(res)
plot(res)

ここで図の4枚目でSとHが異様に高い値を示します。
そこでこの2つのデータを取り除きます。
Hは8番目、Sは19番目のデータです。

x[-8,]
x[-19,]
これでそれぞれのぞけます。2ついっぺんに除くときは、
x[c(-8,-19),]
とします。

y<-x[c(-8,-19),]
res2<-lm(weight~height,data=y)
plot(y$wei,y$hei) このようにリストの名称を略すことも可能です。
plot(y$weight,y$height) こうすれば軸の名前もしっかり出ますね。

ここで、足のサイズと身長で体重を推定することをします。
res3<-lm(weight~height+size,data=y)
res4<-lm(weight~height*size,data=y)
plot(res3)
plot(res4)
この図で外れ値として出てくるものをアウトライヤーと言います。

レポートの復習。
z<-f
rownames(z) 名前の一覧です。
grep("Urawa",rownames(z)) areaの方だけ出力されます。
z[grep("Urawa",rownames(z)),] Urawa関連が全て出ます。
plot(z)
points( z[grep("Urawa",rownames(z)),],col="red")
Urawaが赤色でプロットされます。

ノートに次のようなコマンドがありますが…
lm(Area~Rent,data=z[grep("kokkai",rownames(z)),])
abline(lim(Area~Rent,data=z[grep("kokkai",rownames(z)),]),col="green")
動作しません。よく覚えてないので放置します。


それでは、主成分分析にいきましょう!!
prcomp,princomp を使います。

r<-g 決してリアルゲイではありませんw
plot(r) 各教科の相関が出てきます。
prcomp(r) 下のようなものが出てきます。

Standard deviations:
[1] 17.425396 14.773005 5.219701 4.140858 3.806273

Rotation:
PC1 PC2 PC3 PC4 PC5
kokugo 0.5248956 -0.2347788 0.1222102 -0.03030716 0.808399454
sugaku -0.3663777 -0.6728456 0.1703189 -0.61967360 -0.006500631
eigo 0.5448612 -0.2894192 0.5715496 0.15463839 -0.518440808
rika -0.1990435 -0.6147459 -0.2927631 0.70448720 0.021372360
shakai 0.5037460 -0.1745903 -0.7373445 -0.30801114 -0.277867622

縦に見て、PC1が第1主成分、PCが第2主成分という具合です。

names(prcomp(r)) prcompで何があるか出てきます。
prcomp(r)$x 各要素の主成分が出てきます。
絶対値が0に近いほど文理の差がありません。
prcomp(r)$rotation 文系と理系を分けています。
plot(prcomp(r)) 主成分ごとの寄与率が出てきます。
summary(prcomp(r)) おなじみのsummaryですね。
PC1,PC2の寄与率がほぼ1だと解析が尤もらしいです。
biplot(prcomp(r)) plotの中に科目の座標軸を入れます。


こんな感じで主成分分析の復習を終わります。
次は11/30の判別分析ですね。この回は授業ノートが
不十分なためにあまり出来が良くない予想が…
[PR]
by skc_rr-22 | 2006-01-18 01:21 | 戯言(雑記)


<< いや、無理だって… 祝☆700人!! >>