「ほっ」と。キャンペーン
試験勉強
これから書く文章は、一部の人にはとても有益なものですが、
関係のない人にはまったくもって意味のない文字の羅列となるでしょう。

大変な量の解析をする人はこれを見て頑張ろう!!
あと、間違ってるところは指摘してください!!
ではでは、テスト勉強スタート!!

---------------------------------------------------------------------------

まずは、自分のRのディレクトリにテキストファイルを保存しよう。
次は読み込みです。次のように打ち込めば読み込めます。

a<-read.csv("ファイル名.拡張子")
これでaの中にファイルを入れることが出来ます。今回は

a<-read.csv("sample-1_1.txt")
b<-read.csv("sample-1_2.txt")
c<-read.csv("sample-2_1.txt")
d<-read.csv("sample-2_2.txt")
e<-read.csv("sample-2_3.txt")
f<-read.csv("sample-2_3a.txt")
g<-read.csv("sample-3_1.txt")
h<-read.csv("sample-4_1.txt")
i<-read.csv("sample-4_2.txt")
j<-read.csv("sample-4_3.txt")
k<-read.csv("sample-4_4.txt")
l<-read.csv("sample-5_1.txt")
m<-read.csv("sample-5_2.txt")
n<-read.csv("sample-5_3.txt")

というようにファイルを読み込んでいるとします。

ではこれから、日付順に復習していきましょう!!






10/5の復習

sqrt(x) = √x
sin(θ) = sinθ
2^10 = 2の10乗
log(5) = 底がeのlog5
log10(10) = 底が10のlog10
このようにRはいろいろな関数を持っている。

ベクトル表記
c(1,2,3)   ← 三次元ベクトルをつくることができる。
y<-c(1,2,3,4) yにc(4次元ベクトル)を代入
x<-c(1,3,5,7)  xにc(4次元ベクトル)を代入
x+y          x+yをベクトル計算
x%*%y       xとyのベクトル内積
rbind(x,y)    行列を作る
cbind(x,y)    行列を作る
Aを行列(6×6)としたとき
A[4,2]       Aの(4,2)成分を取り出す。  

これを組み合わせて、
y<-c(1,2,3,4)
x<-c(1,3,5,7)
z<-cbind(x,y)
z[4,2]
と続けて入力すれば
y=3
が出力される。

また、
z[3,]
と入力すると
zの3行目が全て出力される。

これがざっと10/5の復習です。Rの導入部分ですね。
ホントはもう少しありますが、ノートがこの先はいい加減で思い出せないので
却下しますw


10/19   回帰分析
c<-read.csv("sample-2_1.txt")
d<-read.csv("sample-2_2.txt")
e<-read.csv("sample-2_3.txt")

dat<-c datの中にサンプル2-1を入れる。
plot(dat) サンプル2-1の関係を図示する。
dev.off() 図を閉じる。
dat$weight datのweightのみを見る。
names(dat) datにある名前を見る。
plot(dat$height,dat$weight) 身長と体重の図を示す。
(横軸がheightで縦軸がweightになる。)

lm(weight~height,data=dat) datのweightをheightで説明する式を作る。
このとき、(Intercept) の下の数字が切片、heightの下の数字が傾きになる。

res<-lm(weight~height,data=dat) resの中に式を入れる。
abline(res) 図の中にresの式に当たる直線を引く。
このときabline(res,col='色の名前')とすると直線に色が付く。

summary(res) lmのより詳しい解析。
Residualsとは残差のことである。つまりその下の値は以下を示す。
Min,1Q,Median,3Q,Max→残差の最小値、1/4分位点、中央値、3/4分位点、最大値

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 34.0878 71.5429 0.476 0.639
height 0.1654 0.4185 0.395 0.697
↓↓
Coefficients:
    Estimate   Std. Error        t value   Pr(>|t|)
(Intercept)  切片     切片のずれそうな値    ここら辺の値で回帰分析
height   傾き    ゆらぎそうな値      するかどうかを判断する。

Residual standard error: 残差→直線からずれる値
Multiple R-Squared: 寄与率
Adjusted R-squared: 不偏寄与率

plot(res) 残差のプロットが出てきます。エンターキーで切り替え。
1枚目 中央の横のラインからの距離が誤差。
2枚目 誤差の分布。直線であるほど誤差が正規分布。
3枚目 誤差の二乗の分布。高いほど怪しいデータ。
4枚目 クックスの距離。高いとダメ。
5枚目 …ありませんねw
この図が表示されている途中でcntrol+Cで途中で終わることが出来ます。

dat2<-dat[c(1:18,20),] 怪しいデータの19を削除します。
plot(dat$height,dat$size) datの身長と足のサイズの図を出します。
res2<-lm(size~height,data=dat) datの足のサイズを身長で説明する式を出します。
res3<-lm(size~height,data=dat2) dat2の足のサイズを身長で説明する式を出します。
abline(res2,col='red) res2の直線を赤色で表示。
abline(res3,lwd=2) res3の直線を線の太さ2で表示。
newdat<-d サンプル2-2をnewdatとします。
predict(res2,newdat) 式からデータで予測できる。
つまり、res2によってnewdatの身長から足のサイズを予測する。
newdatの中の身長に対する足のサイズが一覧で表示される。
百聞は一見にしかず!!さぁ、やってみよう!!
ってところで、この日の復習はここで終了。

このページの容量が多くなってしまって、編集するときに重いので、
11/9の復習以降は次の記事にします。
[PR]
by skc_rr-22 | 2006-01-17 21:42 | 戯言(雑記)


<< 祝☆700人!! 再起動 >>