2013年1月14日 星期一

Computing for biologists 到底有多難?

最近在總圖遊蕩時,看到這本書:

Practical computing for biologists
by HADDOCK and DUNN

想知道它是否對學生的學習有幫助,因此借回來看看!

以下是個人閱讀建議:

Chapter 1: getting set up

本章節首先談論一個非常重要的問題:如何處理純文字檔案 (極重要!!)

純文字是DOS時代很常見的檔案格式,因此,在那個純樸的年代,接觸過電腦的人或許都知道該怎麼開啟純文字檔進行編輯,但自從式窗介面與Office普及之後,Word與Excel成為編輯檔案與整理資料的主流,很多我們看起來不算花俏的排版卻早已嵌入了一堆使用者看不見的控制碼。就視覺化的效果而言,這些字型與字體大小或行距等排版效果的作用很大,但對資料處理者來說,最重要的資訊其實是資料本身,因此,大部分資料分析工具所訂定的檔案交換格式,皆是以純文字的方式呈現。舉例來說,生物序列所使用的 FASTA format,即是我們在交換序列檔案的時後的首選,幾乎所有的序列分析工具都接受FASTA檔,唯有我們遵守FASTA格式的規範,別人才能正確解讀我們所提供的訊息。

既然純文字檔如此地重要,選擇一個好用的純文字編輯軟體就能事半功倍,本書的第一章中有介紹一些常用軟體,因此,沒有用過純文字編輯器的同學們一定要參考一下這個章節的啦!!

除了提及純文字檔的重要性之外,作者還提醒我們另一個地雷,那就是所謂的換行符號(return),由於Windows系統和Linux系統所使用的換行符號不一樣,如果沒有小心處理,常常會造成程式無法正確解讀資料或無法正常執行。

基於上述兩個重點,因此,在此非常推薦Chapter 1的內容!!

沒有留言:

張貼留言