2013年1月3日 星期四

R與生物資訊

 要往下走之前,得先確定你已經會使用R的一些基本功能,如:
  1. 讀檔:e.g. read.table, ...
  2. 安裝套件:e.g. install.packages, library, ...
  3. 產生序列:e.g. seq, rep, ...
  4. 畫圖:e.g. plot, ...
  5. 對物件的基本操作:e.g. class, names, dim, length, ...
並瞭解R對資料處理的基本結構,如:
  1. vector
  2. matrix
  3. list
  4. data.frame 
也知道如何利用loop (e.g. for)處理批次作業。更重要的是,你應該要知道如何利用help去尋找或瞭解新功能的使用方法。

有了這些基礎後,才能順利進入R在生物資訊上的應用。如果還沒有準備好,或許你可以先看一下:如何開始,然後再繼續往下。

可以參考的書籍如:

R Programming for Bioinformatics
by Robert Gentleman
台大圖書館有電子書
(檢視目錄後,發現其中與生物資訊直接相關的內容並不多)

Bioinformatics and Computational Biology Solutions Using R and Bioconductor
edited by Robert Gentleman, et al.
台大圖書館有電子書
(從目錄看來,有不少蠻實用的參考資訊)

Analysis of Phylogenetics and Evolution with R
by Emmanuel Paradis
台大圖書館有電子書

以上為不負責任的推薦(我還沒機會認真看過)

我常使用的分析方法
  1. clustering: hcluster, Mclust, kmeans
  2. classification: knn.cv, knn
  3. feature selection: t.test
  4. visualization: pheatmap 
話說回來,如果你還不太知道什麼是生物資訊,那麼這裡分享的書籍資訊可能對你幫助不大,先去瞭解一下生物資訊是什麼吧!!

沒有留言:

張貼留言