簡(jiǎn)述生物信息學(xué)

    生物信息學(xué)(Bioinformatics)是研究生物信息的采集、處理、存儲(chǔ)、傳播,分析和解釋等各方面的學(xué)科,也是隨著生命科學(xué)計(jì)算機(jī)科學(xué)的迅猛發(fā)展,生命科學(xué)和計(jì)算機(jī)科學(xué)相結(jié)合形成的一門新學(xué)科。它通過(guò)綜合利用生物學(xué),計(jì)算機(jī)科學(xué)和信息技術(shù)而揭示大量而復(fù)雜的生物數(shù)據(jù)所賦有的生物學(xué)奧秘。生物信息學(xué)Bioinformatics[1]  是在生命科學(xué)的研究中,以計(jì)算機(jī)為工具對(duì)生物信息進(jìn)行儲(chǔ)存、檢索和分析科學(xué)。它是當(dāng)今生命科學(xué)和自然科學(xué)的重大前沿領(lǐng)域之一,同時(shí)也將是21世紀(jì)自然科學(xué)的核心領(lǐng)域之一。其研究重點(diǎn)主要體現(xiàn)在基因組學(xué)Genomics)和蛋白質(zhì)組學(xué)Proteomics)兩方面,具體說(shuō)就是從核酸蛋白質(zhì)序列出發(fā),分析序列中表達(dá)的結(jié)構(gòu)功能的生物信息。

一、生物信息學(xué)的定義

   1.生物信息學(xué)是一門收集、分析遺傳數(shù)據(jù)以及分發(fā)給研究機(jī)構(gòu)的新學(xué)科(Bioinformatics is a new subject of genetic data collection,analysis and dissemination to the research community)。(林華安,Dr. Hwa A. Lim,1987)

   2.生物信息學(xué)特指數(shù)據(jù)庫(kù)類的工作,包括持久穩(wěn)固的在一個(gè)穩(wěn)定的地方提供對(duì)數(shù)據(jù)的支持(Bioinformatics refers to database-like activities,involving persistent sets of data that are maintained in a consistent state over essentially indefinite periods of time)。(林華安,Dr. Hwa A. Lim,1994)

   3.生物信息學(xué)是在大分子方面的概念型的生物學(xué),并且使用了信息學(xué)的技術(shù),這包括了從應(yīng)用數(shù)學(xué)、計(jì)算機(jī)科學(xué)以及統(tǒng)計(jì)學(xué)等學(xué)科衍生而來(lái)各種方法,并以此在大尺度上來(lái)理解和組織與生物大分子相關(guān)的信息。(Luscombe,2001)

具體而言,生物信息學(xué)作為一門新的學(xué)科領(lǐng)域,它是把基因組DNA序列信息分析作為源頭,在獲得蛋白質(zhì)編碼區(qū)的信息后進(jìn)行蛋白質(zhì)空間結(jié)構(gòu)模擬和預(yù)測(cè),然后依據(jù)特定蛋白質(zhì)的功能進(jìn)行必要的藥物設(shè)計(jì)。基因組信息學(xué),蛋白質(zhì)空間結(jié)構(gòu)模擬以及藥物設(shè)計(jì)構(gòu)成了生物信息學(xué)的3個(gè)重要組成部分。從生物信息學(xué)研究的具體內(nèi)容上看,生物信息學(xué)應(yīng)包括這3個(gè)主要部分:⑴新算法和統(tǒng)計(jì)學(xué)方法研究;⑵各類數(shù)據(jù)的分析和解釋;⑶研制有效利用和管理數(shù)據(jù)新工具。

   生物信息學(xué)是一門利用計(jì)算機(jī)技術(shù)研究生物系統(tǒng)之規(guī)律的學(xué)科生物信息學(xué)基本上只是分子生物學(xué)與信息技術(shù)(尤其是因特網(wǎng)技術(shù))的結(jié)合體。生物信息學(xué)的研究材料和結(jié)果就是各種各樣的生物學(xué)數(shù)據(jù),其研究工具是計(jì)算機(jī),研究方法包括對(duì)生物學(xué)數(shù)據(jù)的搜索(收集和篩選)、處理(編輯、整理、管理和顯示)及利用(計(jì)算、模擬)。1990年代以來(lái),伴隨著各種基因組測(cè)序計(jì)劃的展開和分子結(jié)構(gòu)測(cè)定技術(shù)的突破和Internet的普及,數(shù)以百計(jì)的生物學(xué)數(shù)據(jù)庫(kù)如雨后春筍般迅速出現(xiàn)和成長(zhǎng)。對(duì)生物信息學(xué)工作者提出了嚴(yán)峻的挑戰(zhàn):數(shù)以億計(jì)的ACGT序列中包涵著什么信息?基因組中的這些信息怎樣控制有機(jī)體的發(fā)育?基因組本身又是怎樣進(jìn)化的?

   生物信息學(xué)的另一個(gè)挑戰(zhàn)是從蛋白質(zhì)的氨基酸序列預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)。這個(gè)難題已困擾理論生物學(xué)家達(dá)半個(gè)多世紀(jì),如今找到問(wèn)題答案要求正變得日益迫切。諾貝爾獎(jiǎng)獲得者W. Gilbert在1991年曾經(jīng)指出:“傳統(tǒng)生物學(xué)解決問(wèn)題的方式是實(shí)驗(yàn)的,F(xiàn)在,基于全部基因都將知曉,并以電子可操作的方式駐留在數(shù)據(jù)庫(kù)中,新的生物學(xué)研究模式的出發(fā)點(diǎn)應(yīng)是理論的。一個(gè)科學(xué)家將從理論推測(cè)出發(fā),然后再回到實(shí)驗(yàn)中去,追蹤或驗(yàn)證這些理論假設(shè)”。

   生物信息學(xué)的主要研究方向:基因組學(xué) - 蛋白質(zhì)組學(xué) - 系統(tǒng)生物學(xué) - 比較基因組學(xué)1989年在美國(guó)舉辦生物化學(xué)系統(tǒng)論生物數(shù)學(xué)的計(jì)算機(jī)模型國(guó)際會(huì)議,生物信息學(xué)發(fā)展到了計(jì)算生物學(xué)、計(jì)算系統(tǒng)生物學(xué)的時(shí)代。姑且不去引用生物信息學(xué)冗長(zhǎng)的定義,以通俗的語(yǔ)言闡述其核心應(yīng)用即是:隨著包括人類基因組計(jì)劃在內(nèi)的生物基因組測(cè)序工程的里程碑式的進(jìn)展,由此產(chǎn)生的包括生物體生老病死的生物數(shù)據(jù)以前所未有的速度遞增,已達(dá)到每14個(gè)月翻一番的速度。同時(shí)隨著互聯(lián)網(wǎng)的普及,數(shù)以百計(jì)的生物學(xué)數(shù)據(jù)庫(kù)如雨后春筍般迅速出現(xiàn)和成長(zhǎng)。然而這些僅僅是原始生物信息的獲取,是生物信息學(xué)產(chǎn)業(yè)發(fā)展的初級(jí)階段,這一階段的生物信息學(xué)企業(yè)大都以出售生物數(shù)據(jù)庫(kù)為生。以人類基因組測(cè)序而聞名的塞萊拉公司即是這一階段的成功代表。生物信息學(xué)產(chǎn)業(yè)的高級(jí)階段體現(xiàn)于此,人類從此進(jìn)入了以生物信息學(xué)為中心的后基因組時(shí)代。結(jié)合生物信息學(xué)的新藥創(chuàng)新工程即是這一階段的典型應(yīng)用。

二、生物信息學(xué)發(fā)展的幾個(gè)階段

   1.前基因組時(shí)代(20世紀(jì)90年代前) 這一階段主要是各種序列比較算法的建立、生物數(shù)據(jù)庫(kù)的建立、檢索工具的開發(fā)以及DNA和蛋白質(zhì)序列分析等。

   2.基因組時(shí)代(20世紀(jì)90年代后至2001年) 這一階段主要是大規(guī)模的基因組測(cè)序,基因識(shí)別和發(fā)現(xiàn),網(wǎng)絡(luò)數(shù)據(jù)庫(kù)系統(tǒng)地建立和交互界面工具的開發(fā)等。

   3.后基因組時(shí)代(2001至今) 隨著人類基因組測(cè)序工作的完成,各種模式生物基因組測(cè)序的完成,生物科學(xué)的發(fā)展已經(jīng)進(jìn)入了后基因組時(shí)代,基因組學(xué)研究的重心由基因組的結(jié)構(gòu)向基因的功能轉(zhuǎn)移。這種轉(zhuǎn)移的一個(gè)重要標(biāo)志是產(chǎn)生了功能基因組學(xué),而基因組學(xué)的前期工作相應(yīng)地被稱為結(jié)構(gòu)基因組學(xué)。[2]  

三、生物信息學(xué)發(fā)展簡(jiǎn)介

生物信息學(xué)是建立在分子生物學(xué)的基礎(chǔ)上的,因此,要了解生物信息學(xué),就必須先對(duì)分子生物學(xué)的發(fā)展有一個(gè)簡(jiǎn)單的了解。

研究生物細(xì)胞的生物大分子的結(jié)構(gòu)與功能很早就已經(jīng)開始,1866年孟德爾從實(shí)驗(yàn)上提出了假設(shè):遺傳因子是以生物成分存在,1871年Miescher從死的白細(xì)胞核中分離出脫氧核糖核酸DNA),在Avery和McCarty于1944年證明了DNA是生命器官的遺傳物質(zhì)以前,人們?nèi)匀徽J(rèn)為染色體蛋白質(zhì)攜帶基因,而DNA是一個(gè)次要的角色。

1944年Chargaff發(fā)現(xiàn)了著名的Chargaff規(guī)律,即DNA中鳥嘌呤的量與胞嘧定的量總是相等,腺嘌呤胸腺嘧啶的量相等。與此同時(shí),Wilkins與Franklin用X射線衍射技術(shù)測(cè)定了DNA纖維的結(jié)構(gòu)。

1953年James Watson 和FrancisCrick在Nature雜志上推測(cè)出DNA的三維結(jié)構(gòu)(雙螺旋)。DNA以磷酸糖鏈形成發(fā)雙股螺旋,脫氧核糖上的堿基按Chargaff規(guī)律構(gòu)成雙股磷酸糖鏈之間的堿基對(duì)。這個(gè)模型表明DNA具有自身互補(bǔ)的結(jié)構(gòu),根據(jù)堿基對(duì)原則,DNA中貯存的遺傳信息可以精確地進(jìn)行復(fù)制。他們的理論奠定了分子生物學(xué)的基礎(chǔ)。

DNA雙螺旋模型已經(jīng)預(yù)示出了DNA復(fù)制的規(guī)則,Kornberg于1956年從大腸桿菌E.coli)中分離出DNA聚合酶IDNA polymerase I),能使4種dNTP連接成DNA。DNA的復(fù)制需要一個(gè)DNA作為模板。Meselson與Stahl(1958)用實(shí)驗(yàn)方法證明了DNA復(fù)制是一種半保留復(fù)制。

Crick于1954年提出了遺傳信息傳遞的規(guī)律,DNA是合成RNA的模板,RNA又是合成蛋白質(zhì)的模板,稱之為中心法則(Central dogma),這一中心法則對(duì)以后分子生物學(xué)和生物信息學(xué)的發(fā)展都起到了極其重要的指導(dǎo)作用。

經(jīng)過(guò)Nirenberg和Matthai(1963)的努力研究,編碼20氨基酸的遺傳密碼得到了破譯。限制性內(nèi)切酶的發(fā)現(xiàn)和重組DNA的克。╟lone)奠定了基因工程的技術(shù)基礎(chǔ)。正是由于分子生物學(xué)的研究對(duì)生命科學(xué)的發(fā)展有巨大的推動(dòng)作用,生物信息學(xué)的出現(xiàn)也就成了一種必然。

2001年2月,人類基因組工程測(cè)序的完成,使生物信息學(xué)走向了一個(gè)高潮。由于DNA自動(dòng)測(cè)序技術(shù)的快速發(fā)展,DNA數(shù)據(jù)庫(kù)中的核酸序列公共數(shù)據(jù)量以每天106bp速度增長(zhǎng),生物信息迅速地膨脹成數(shù)據(jù)的海洋。毫無(wú)疑問(wèn),我們正從一個(gè)積累數(shù)據(jù)向解釋數(shù)據(jù)的時(shí)代轉(zhuǎn)變,數(shù)據(jù)量的巨大積累往往蘊(yùn)含著潛在突破性發(fā)現(xiàn)的可能,"生物信息學(xué)"正是從這一前提產(chǎn)生的交叉學(xué)科

粗略地說(shuō),該領(lǐng)域的核心內(nèi)容是研究如何通過(guò)對(duì)DNA序列的統(tǒng)計(jì)計(jì)算分析,更加深入地理解DNA序列,結(jié)構(gòu),演化及其與生物功能之間的關(guān)系,其研究課題涉及到分子生物學(xué),分子演化及結(jié)構(gòu)生物學(xué),統(tǒng)計(jì)學(xué)及計(jì)算機(jī)科學(xué)等許多領(lǐng)域。生物信息學(xué)是內(nèi)涵非常豐富的學(xué)科,其核心是基因組信息學(xué),包括基因組信息的獲取,處理,存儲(chǔ),分配和解釋。

基因組信息學(xué)的關(guān)鍵是"讀懂"基因組的核苷酸順序,即全部基因在染色體上的確切位置以及各DNA片段的功能;同時(shí)在發(fā)現(xiàn)了新基因信息之后進(jìn)行蛋白質(zhì)空間結(jié)構(gòu)模擬和預(yù)測(cè),然后依據(jù)特定蛋白質(zhì)的功能進(jìn)行藥物設(shè)計(jì)。了解基因表達(dá)的調(diào)控機(jī)理也是生物信息學(xué)的重要內(nèi)容,根據(jù)生物分子在基因調(diào)控中的作用,描述人類疾病的診斷,治療內(nèi)在規(guī)律。

它的研究目標(biāo)是揭示"基因組信息結(jié)構(gòu)的復(fù)雜性及遺傳語(yǔ)言的根本規(guī)律",解釋生命的遺傳語(yǔ)言。生物信息學(xué)已成為整個(gè)生命科學(xué)發(fā)展的重要組成部分,成為生命科學(xué)研究的前沿。

四、生物信息學(xué)的研究方向

   生物信息學(xué)在短短十幾年間,已經(jīng)形成了多個(gè)研究方向,以下簡(jiǎn)要介紹一些主要的研究重點(diǎn)。

1.基因序列比對(duì)

   序列比對(duì)(Sequence Alignment)的基本問(wèn)題是比較兩個(gè)或兩個(gè)以上符號(hào)序列的相似性或不相似性。從生物學(xué)的初衷來(lái)看,這一問(wèn)題包含了以下幾個(gè)意義:從相互重疊的序列片斷中重構(gòu)DNA的完整序列。在各種試驗(yàn)條件下從探測(cè)數(shù)據(jù)(probe data)中決定物理和基因圖存貯,遍歷和比較數(shù)據(jù)庫(kù)中的DNA序列,比較兩個(gè)或多個(gè)序列的相似性,在數(shù)據(jù)庫(kù)中搜索相關(guān)序列和子序列,尋找核苷酸(nucleotides)的連續(xù)產(chǎn)生模式,找出蛋白質(zhì)和DNA序列中的信息成分。序列比對(duì)考慮了DNA序列的生物學(xué)特性,如序列局部發(fā)生的插入,刪除(前兩種簡(jiǎn)稱為indel)和替代,序列的目標(biāo)函數(shù)獲得序列之間突變集最小距離加權(quán)和或最大相似性和,對(duì)齊的方法包括全局對(duì)齊,局部對(duì)齊,代溝懲罰等。兩個(gè)序列比對(duì)常采用動(dòng)態(tài)規(guī)劃算法,這種算法在序列長(zhǎng)度較小時(shí)適用,然而對(duì)于海量基因序列(如人的DNA序列高達(dá)10^9bp),這一方法就不太適用,甚至采用算法復(fù)雜性為線性的也難以奏效。因此,啟發(fā)式方法的引入勢(shì)在必然,著名的BLAST和FASTA算法及相應(yīng)的改進(jìn)方法均是從此前提出發(fā)的。

2.蛋白質(zhì)比對(duì)

基本問(wèn)題是比較兩個(gè)或兩個(gè)以上蛋白質(zhì)分子空間結(jié)構(gòu)的相似性或不相似性。蛋白質(zhì)的結(jié)構(gòu)與功能是密切相關(guān)的,一般認(rèn)為,具有相似功能的蛋白質(zhì)結(jié)構(gòu)一般相似。蛋白質(zhì)是由氨基酸組成的長(zhǎng)鏈,長(zhǎng)度從50到1000~3000AA(Amino Acids),蛋白質(zhì)具有多種功能,如酶,物質(zhì)的存貯和運(yùn)輸,信號(hào)傳遞,抗體等等。氨基酸的序列內(nèi)在的決定了蛋白質(zhì)的3維結(jié)構(gòu)。一般認(rèn)為,蛋白質(zhì)有四級(jí)不同的結(jié)構(gòu)

研究蛋白質(zhì)結(jié)構(gòu)和預(yù)測(cè)的理由是:醫(yī)藥上可以理解生物的功能,尋找dockingdrugs的目標(biāo),農(nóng)業(yè)上獲得更好的農(nóng)作物的基因工程,工業(yè)上有利用酶的合成。直接對(duì)蛋白質(zhì)結(jié)構(gòu)進(jìn)行比對(duì)的原因是由于蛋白質(zhì)的3維結(jié)構(gòu)比其一級(jí)結(jié)構(gòu)在進(jìn)化中更穩(wěn)定的保留,同時(shí)也包含了較AA序列更多的信息。

蛋白質(zhì)3維結(jié)構(gòu)研究的前提假設(shè)是內(nèi)在的氨基酸序列與3維結(jié)構(gòu)一一對(duì)應(yīng)(不一定全真),物理上可用最小能量來(lái)解釋。從觀察和總結(jié)已知結(jié)構(gòu)的蛋白質(zhì)結(jié)構(gòu)規(guī)律出發(fā)來(lái)預(yù)測(cè)未知蛋白質(zhì)的結(jié)構(gòu)。同源建模homology modeling)和指認(rèn)(Threading)方法屬于這一范疇。同源建模用于尋找具有高度相似性的蛋白質(zhì)結(jié)構(gòu)(超過(guò)30%氨基酸相同),后者則用于比較進(jìn)化族中不同的蛋白質(zhì)結(jié)構(gòu)。然而,蛋白結(jié)構(gòu)預(yù)測(cè)研究現(xiàn)狀還遠(yuǎn)遠(yuǎn)不能滿足實(shí)際需要。

3.基因識(shí)別分析

   基因識(shí)別的基本問(wèn)題是給定基因組序列后,正確識(shí)別基因的范圍和在基因組序列中的精確位置。非編碼區(qū)由內(nèi)含子組成(introns),一般在形成蛋白質(zhì)后被丟棄,但從實(shí)驗(yàn)中,如果去除非編碼區(qū),又不能完成基因的復(fù)制。顯然,DNA序列作為一種遺傳語(yǔ)言,既包含在編碼區(qū),又隱含在非編碼序列中。分析非編碼區(qū)DNA序列沒有一般性的指導(dǎo)方法。在人類基因組中,并非所有的序列均被編碼,即是某種蛋白質(zhì)的模板,已完成編碼部分僅占人類基因總序列的3~5%,顯然,手工的搜索如此大的基因序列是難以想象的.偵測(cè)密碼區(qū)的方法包括測(cè)量密碼區(qū)密碼子codon)的頻率,一階和二階馬爾可夫鏈,ORF(Open Reading Frames),啟動(dòng)子(promoter)識(shí)別,HMM(Hidden Markov Model)和GENSCAN,Splice Alignment等等。

4.分子進(jìn)化

   分子進(jìn)化是利用不同物種中同一基因序列的異同來(lái)研究生物的進(jìn)化,構(gòu)建進(jìn)化樹。既可以用DNA序列也可以用其編碼的氨基酸序列來(lái)做,甚至于可通過(guò)相關(guān)蛋白質(zhì)的結(jié)構(gòu)比對(duì)來(lái)研究分子進(jìn)化,其前提假定是相似種族在基因上具有相似性。通過(guò)比較可以在基因組層面上發(fā)現(xiàn)哪些是不同種族中共同的,哪些是不同的。早期研究方法常采用外在的因素,如大小,膚色,肢體的數(shù)量等等作為進(jìn)化的依據(jù)。較多模式生物基因組測(cè)序任務(wù)的完成,人們可從整個(gè)基因組的角度來(lái)研究分子進(jìn)化。在匹配不同種族的基因時(shí),一般須處理三種情況:Orthologous:不同種族,相同功能的基因;Paralogous:相同種族,不同功能的基因;Xenologs:有機(jī)體間采用其他方式傳遞的基因,如被病毒注入的基因。這一領(lǐng)域常采用的方法是構(gòu)造進(jìn)化樹,通過(guò)基于特征(即DNA序列或蛋白質(zhì)中的氨基酸的堿基的特定位置)和基于距離(對(duì)齊的分?jǐn)?shù))的方法和一些傳統(tǒng)的聚類方法(如UPGMA)來(lái)實(shí)現(xiàn)。

5.序列重疊群(Contigs)裝配

   根據(jù)現(xiàn)行的測(cè)序技術(shù),每次反應(yīng)只能測(cè)出500 或更多一些堿基對(duì)的序列,如人類基因的測(cè)量就采用了短槍(shortgun)方法,這就要求把大量的較短的序列全體構(gòu)成了重疊群(Contigs)。逐步把它們拼接起來(lái)形成序列更長(zhǎng)的重疊群,直至得到完整序列的過(guò)程稱為重疊群裝配。從算法層次來(lái)看,序列的重疊群是一個(gè)NP-完全問(wèn)題。

6.遺傳密碼

   通常對(duì)遺傳密碼的研究認(rèn)為,密碼子與氨基酸之間的關(guān)系是生物進(jìn)化歷史上一次偶然的事件而造成的,并被固定在現(xiàn)代生物的共同祖先里,一直延續(xù)至今。不同于這種"凍結(jié)"理論,有人曾分別提出過(guò)選擇優(yōu)化,化學(xué)和歷史等三種學(xué)說(shuō)來(lái)解釋遺傳密碼。隨著各種生物基因組測(cè)序任務(wù)的完成,為研究遺傳密碼的起源和檢驗(yàn)上述理論的真?zhèn)翁峁┝诵碌乃夭摹?/span>

7.藥物設(shè)計(jì)

   人類基因工程的目的之一是要了解人體內(nèi)約10萬(wàn)種蛋白質(zhì)的結(jié)構(gòu),功能,相互作用以及與各種人類疾病之間的關(guān)系,尋求各種治療和預(yù)防方法,包括藥物治療;谏锎蠓肿咏Y(jié)構(gòu)及小分子結(jié)構(gòu)的藥物設(shè)計(jì)是生物信息學(xué)中的極為重要的研究領(lǐng)域。為了抑制某些酶或蛋白質(zhì)的活性,在已知其蛋白質(zhì)3級(jí)結(jié)構(gòu)的基礎(chǔ)上,可以利用分子對(duì)齊算法,在計(jì)算機(jī)上設(shè)計(jì)抑制劑分子,作為候選藥物。這一領(lǐng)域目的是發(fā)現(xiàn)新的基因藥物,有著巨大的經(jīng)濟(jì)效益。

8.生物系統(tǒng)

   隨著大規(guī)模實(shí)驗(yàn)技術(shù)的發(fā)展和數(shù)據(jù)累積,從全局和系統(tǒng)水平研究和分析生物學(xué)系統(tǒng),揭示其發(fā)展規(guī)律已經(jīng)成為后基因組時(shí)代的另外一個(gè)研究熱點(diǎn)-系統(tǒng)生物學(xué)。目前來(lái)看,其研究?jī)?nèi)容包括生物系統(tǒng)的模擬(Curr Opin Rheumatol,2007,463-70),系統(tǒng)穩(wěn)定性分析(Nonlinear Dynamics Psychol Life Sci,2007,413-33),系統(tǒng)魯棒性分析(Ernst Schering Res Found Workshop, 2007,69-88)等方面。以SBML(Bioinformatics,2007,1297-8)為代表的建模語(yǔ)言在迅速發(fā)展之中,以布爾網(wǎng)絡(luò)PLoS Comput Biol,2007,e163)、微分方程Mol Biol Cell,2004,3841-62)、隨機(jī)過(guò)程Neural Comput,2007,3262-92)、離散動(dòng)態(tài)事件系統(tǒng)等(Bioinformatics,2007,336-43)方法在系統(tǒng)分析中已經(jīng)得到應(yīng) 用。很多模型的建立借鑒了電路和其它物理系統(tǒng)建模的方法,很多研究試圖從信息流、熵和能量流等宏觀分析思想來(lái)解決系統(tǒng)的復(fù)雜性問(wèn)題(Anal Quant Cytol Histol,2007,296-308)。當(dāng)然,建立生物系統(tǒng)的理論模型還需要很長(zhǎng)時(shí)間的努力,實(shí)驗(yàn)觀測(cè)數(shù)據(jù)雖然在海量增加,但是生物系統(tǒng)的模型辨 識(shí)所需要的數(shù)據(jù)遠(yuǎn)遠(yuǎn)超過(guò)了數(shù)據(jù)的產(chǎn)出能力。例如,對(duì)于時(shí)間序列的芯片數(shù)據(jù),采樣點(diǎn)的數(shù)量還不足以使用傳統(tǒng)的時(shí)間序列建模方法,巨大的實(shí)驗(yàn)代價(jià)是系統(tǒng)建模主要困難。系統(tǒng)描述和建模方法也需要開創(chuàng)性的發(fā)展。

責(zé)編:微科普

分享到:

>相關(guān)科普知識(shí)

日本女v片一区二区,公侵犯人妻一区二区,国产亚洲中文日本不卡2区,91久国产成人在线观. www.sucaiwu.net