2015年12月5日土曜日

Rコマンダーでデータのインポートとか試す

Rコマンダー(R Commander)でデータのインポートとか試す。
Rコマンダーの初期設定については、http://techinfo4dog.blogspot.jp/2015/12/rr-commander.html など参照。

参考:http://plaza.umin.ac.jp/~takeshou/R/Rcmdr01.html

Excelで元データを作り、保存する。(H:\test\testdata.xlsx)


 

Rを起動し、プロンプト部分にlibrary(Rcmdr) と入力してRコマンダーを起動する。データ→インポート→Excelからインポート、を選択する。

 

インポート設定で、データセット名をDataset01にし、「スプレッドシートの1列目の行名」を選択し(サンプルは1列目に人名が入り、1行目はデータだから)、OKボタンを押す。(欠測値は含んでいない。)

 
ファイル選択ダイアログが出るので、先ほど準備した元データを選択する。

 

シートが3シートあったようで、シート選択ダイアログが出るので、Sheet1を選択。(Sheet1にサンプル作った。)

無事読み込まれたっぽい感じで、上のほうに青文字の「Dataset01」が追加された。

 

「データセットの編集」ボタンを押すと、その場で編集できるらしい。行・列の追加もできる感じ。
 

 

 


ためしに新しい行、「いぬ」追加してみる。うっかり途中でEnter押すと保存されずに閉じてしまう場合があるので慎重に作業。

 


「データセットを表示」ボタンを押すと中身が表示されるけれどずれていて見づらい。




参考サイト(http://plaza.umin.ac.jp/~takeshou/R/Rcmdr02.html)に従い、ヒストグラムを書いてみる。メニューの「グラフ」→「ヒストグラム」。
 

変数一覧が表示されるのでとりあえずX1選択。
 


グラフがR側(R起動して最初に立ち上がる画面のほう)に書かれる。


クラスタ分析は、メニューの「統計量」→「次元解析」→「クラスタ分析」→「階層的クラスタ分析」。


 

 


また、Rのコンソールのほうに戻ると、「Dataset01」と入力すると、中身が表示される。




行列をひっくり返したい場合には、Dataset01 <- t(Dataset01)。(参考:http://monge.tec.fukuoka-u.ac.jp/r_analysis/basic_data_frame04.html)




「エラー: アクティブデータセットに層別因子がありません.」が出るのは、層別の指定がされていないから。層とは、数値で入力されているカテゴリカルデータのこと(性別とか)。「データ」メニューから「アクティブデータセット内の変数の管理...」を選び,さらに「数値変数を因子に変換...」を選んで進むと何とかなるらしい。(未確認)(http://www.okadajp.org/RWiki/?plugin=attach&pcmd=open&file=RcmdrPractice2.pdf&refer=100%E4%B8%87%E3%83%92%E3%83%83%E3%83%88%E8%A8%98%E5%BF%B5%E3%82%B3%E3%83%BC%E3%83%8A%E3%83%BC P.11 。ほかの便利そうなR Commander使いかたファイルが http://www.okadajp.org/RWiki/?100%E4%B8%87%E3%83%92%E3%83%83%E3%83%88%E8%A8%98%E5%BF%B5%E3%82%B3%E3%83%BC%E3%83%8A%E3%83%BC


Rコマンダー(R commander)のインストール

RにRコマンダー(R commander)追加してみる話。

参考:http://plaza.umin.ac.jp/~takeshou/R/Rcmdrinst.htmlhttp://cse.niaes.affrc.go.jp/miwa/ja/R/setupReasy/

Rを起動し、「パッケージ」メニューから「パッケージのインストール」選択。


CRAN表示で一番下の(HTTP mirrors)選択。その後Japan(Tokyo)選択。



Rcmd選択。

 

Would you like to use a personal library instead? 表示で「はい」を選択。

 

Would you like to create a personal library 'C:\.....' to install package into? 表示で「はい」を選択。(デフォルトでログインユーザの中のDocuments/R……が選択されている。)
 




library(Rcmdr)コマンド実行。

 > library(Rcmdr)
 要求されたパッケージ splines をロード中です
 要求されたパッケージ RcmdrMisc をロード中です
 要求されたパッケージ car をロード中です
Error in loadNamespace(j <- i[[1L]], c(lib.loc, .libPaths()), versionCheck = vI[[j]]) :
   ‘minqa’ という名前のパッケージはありません
 エラー:  パッケージ ‘car’ をロードできま



のエラーが出て起動しない。
 

(管理者として実行してもNGだった。)



minqaパッケージを、Rcmdパッケージをインストールしたときと同様に、追加インストールする。

 






 再度library(Rcmdr)コマンドを実行する。不足するライブラリをインストールしろダイアログが出るので「はい」選択。再度CRANかローカルか問われるのでCRAN(デフォルト)で「はい」選択。




 終了後、勝手になんか起動した。
 http://plaza.umin.ac.jp/~takeshou/R/Rcmdrfirst.html によると、Rの起動用リンクを『"c:/<省略>/Rgui.exe" R_DEFAULT_PACKAGES="Rcmdr"』に変更すると、自動的にRコマンダーが起動するようになるらしい。(未確認)


2015年11月28日土曜日

kisnetサイトを使ってクラスター分析用のRスクリプトを準備する

手っ取り早くR言語を使いたい場合、Rの設定、インストールせずにWebブラウザ経由でRを使えるサイトがいくつかある。
R言語を直接書くスキルがすでにあったり、本やWebサイトの情報をもとにさっくり入力して試したいなら、
http://pbil.univ-lyon1.fr/Rweb/index.html
が便利。
ブラウザのテキストエリアに入力してSubmit押すだけですぐに試すことができるし、グラフとか描けたりも。

 


Rの環境はすでに手元にある場合に手っ取り早くクラスタ分析したいがRに不慣れな場合、
http://www.kisnet.or.jp/nappa/software/star/mva/cluster.htm#
のサイトを使うと、Excelのデータをすぐにクラスタ分析にかけるためのRのスクリプトを作ることができる。
(Windows7 64bitにRインストールする方法については、http://techinfo4dog.blogspot.jp/2015/11/windows7r.html など参照。)










Excelで元データを準備する。
人名と数値データがいくつかあるような場合のデータだと、縦に人名が来て、行方向に数値が並ぶように作る。






ブラウザで「http://www.kisnet.or.jp/nappa/software/star/mva/cluster.htm#」を開く。
ここでは人名が3人、データが6つあるので、「参加者数」に3、「変数の個数に6、Excel内に人名があるので「成員名あり」は「はい」(デフォルトは「はい」)を選択する。






表の下にあるテキストボックスをクリックすると大きくなる。そこにExcelからコピーしてそのまま貼り付ける。




 


貼り付けた後、テキストボックスの右にある「代入」を押す。
すると自動的に上のテーブルに値が入る。
適当に設定(ここではデフォルト)し、「計算」ボタンを押すと、下のテキストボックスに結果やRコマンドが表示される。






後は手順に従って実施する。(事前にRインストールし、コンソールを起動しておく。)








コピー&ペーストを繰り返すと、クラスタ分析のデンドログラム登場。








 




 


 


もう一度行う場合には、Rの「編集」画面の「コンソール消去」を行う。