genshi.ro 冷たいことにはわけがある

811月/170

Dr.Bonoの生命科学データ解析

Posted by genshiro

オミックスデータの解析を主軸とした共同研究がいくつか走り出したので、生命科学のビッグデータに真正面から向き合う必要が生じました。たまたま1ヶ月前くらいに坊農さんの新しい本が上梓されていて、その内容が今の自分にぴったりすぎて、嬉しくてこの記事を書いてます。読んでよかった。

自分はRなどを使って時系列データの解析をおこなうくらいのプログラムは書ける人間です。でも遺伝子発現・蛋白などのビッグデータの解析は全くの素人。もちろんトランスクリプション、NGS、データベースといった言葉は知っていたけれども、エンリッチメント解析、Biomart、VCFなんてのはこの本で知りました。本書は1章「生命科学データ解析の歴史」、2章「生命科学分野のの公共データベース」、3章「データの形式とその取り扱い方」、4章「基本データ解析」、5章「実用データ解析」という構成になっていて、生命科学データの基本的な予備知識と手法について触れられてます。どの章も面白かったけど、個人的には5章がドンピシャでした。いろんなことがわかった気持ちになりました。全体を通して内容は初心者にはとてもわかり易く、特に本文の脇に無数に散りばめられている注釈が素晴らしい。FASTAは欧米ではファスト・エーと呼ばれるそうです。

来年やってくる大学院生の必読書が増えました。3,240円はお買い得だと思う。坊農さんありがとう。

235月/160

Rにインストールしてるパッケージ

Posted by genshiro

Rを3.3にあげたらパッケージを全部入れ直しになったので備忘録的にコードをかいておく。

Tagged as: , No Comments
301月/140

knitrをつかって教材作った

Posted by genshiro

FASTER論文のセミナーを依頼されたのでknitrで講義資料を作ってみた → faster.tutorial.pdf

また、オリジナルのRnwファイルもアップしておきます → faster.Rnw

ということで、明日、生まれて初めて金沢に行ってきます! さむいんだろうなぁ。。。

Tagged as: , No Comments
1611月/130

ggplot2のレジェンドをguidesで少しだけ改造

Posted by genshiro

ggplot2の備忘録。
Rにて数万というサンプルを散布図にするとレジェンドを書き換えたくなることがある。

サンプルデータを用意する。
PNGに保存するときはコメントアウトを外してください。

 

まずは普通に描画。

sample1 

点がでかすぎるので小さく。

sample2 

色がこすぎるので透過に。

sample3 

レジェンドが見えなくなっているのでguidesでデフォルトを上書きする。

sample4
詳しい使い方はSet guides for each scale.を参照してください。

Tagged as: , No Comments
711月/130

Rとggplotでダブルプロットを作る

Posted by genshiro

めちゃくちゃ久しぶりに備忘録。
Rにてダブルプロット。
ggplot2のgeom_rasterを使ってる。

こんなかんじ。

サンプルデータをかってにつくって、表示してみる。

doublePlot

Tagged as: , No Comments
106月/120

rglパッケージで3D散布図&アニメーションをかく

Posted by genshiro

久しぶりに備忘録。少し手を焼いたので。
Rで3D散布図。
rglパッケージは普通にインストール。
まずはデータ読み込み。ggplot2のmsleepデータセットを用いる。

plot3dコマンドで散布図作製。マウスでグリグリ動かすこともできる。

さらにグリグリうごかしている様子をアニメーションとして保存したい場合は、ImageMagickをインストールしておいて:

NREMとREMとAWAKEの合計時間は24時かんなので見事に1つの平面にのっていますねw

open3dで作ったウィンドウを消すには:

Tagged as: , No Comments
19月/110

TextmateにRのbundleいれた。MacBook Airにて。

Posted by genshiro

S◯NYとの交渉がすっきりおわってからMBAをセットアップし始めた。生まれて初めてMacをさわる僕にとって何もかもが新しいわけだが、Windowsから移ってくる僕と同じような境遇の人達のためにも、自分のためにも、いくつかメモ。

最終的に何を入れたかはいつかアップするとして、最初に大きくつまずいたTextMateのbundleインストールについて備忘録。

TextMateのマニュアルの「5.7 Getting More Bundles」をみながら。

最初にsubversionのインストール。Xcodeをインストールしたためかすでに入っている。

~/.bash_profileに次の1行を追加:

ここが一番なやんだ。そもそも.bash_profileがどこにあるかわからなかった。そもそもそもそもこの段階では存在しないことも知らなかった。こちらをよみつつなんとか.bash_profileを作成。

一度bashを再起動して、次のコマンドを入力。


これで無事にTextMateでRスクリプトにも色がつくようになりました。

Tagged as: , , No Comments
238月/110

ggplot2でformatterを用いて軸ラベルを整形する

Posted by genshiro

これも備忘録。いつも忘れてしまう。
 
まずはデフォルトのグラフ表示。


 

桁数を増やす。


 

Scientific表示。


 

組み込みのpercentもある。

Tagged as: , No Comments
228月/110

ggplot2でviewportを用いて1枚の画像に複数のplotを配置する

Posted by genshiro

毎回ggplotで複数のグラフを1枚の画像に収めるときに調べてる気がするので備忘録的にアップ。リゲス本を参照。

 

Source code:

 

 

Cascading plots by viewport function under ggplot



 

Rの基礎とプログラミング技法 

Rの基礎とプログラミング技法

Tagged as: , No Comments