高效、務(wù)實(shí)、嚴謹、敬業(yè)
技術(shù)服務(wù)
技術(shù)專(zhuān)題
聯(lián)系我們

聯(lián)系我們

廣州賽誠生物科技有限公司
廣州市天河區黃埔大道中124號2705室
電話(huà):020-29031124
手機:18102256923
Email:servers@gzscbio.com
Fax:020-85625352
QQ:2913120624
生物信息學(xué)概述

生物信息學(xué)主要應用到HMM隱馬可夫鏈的方法。數學(xué)中具有馬爾可夫性質(zhì)的離散時(shí)間隨機過(guò)程。該過(guò)程中,在給定當前知識或信息的情況下,只有當前的狀態(tài)用來(lái)預測將來(lái),過(guò)去(即當前以前的歷史狀態(tài))對于預測將來(lái)(即當前以后的未來(lái)狀態(tài))是無(wú)關(guān)的。在馬爾可夫鏈的每一步,系統根據概率分布,可以從一個(gè)狀態(tài)變到另一個(gè)狀態(tài),也可以保持當前狀態(tài)。狀態(tài)的改變叫做過(guò)渡,與不同的狀態(tài)改變相關(guān)的概率叫做過(guò)渡概率。隨機漫步就是馬爾可夫鏈的例子。隨機漫步中每一步的狀態(tài)是在圖形中的點(diǎn),每一步可以移動(dòng)到任何一個(gè)相鄰的點(diǎn),在這里移動(dòng)到每一個(gè)點(diǎn)的概率都是相同的(無(wú)論之前漫步路徑是如何的)。

隱馬可夫鏈示意

隱馬可夫鏈示意


1 評估問(wèn)題

給定觀(guān)測序列O=O1O2O3…Ot和模型參數λ=(A,B,π),怎樣有效計算某一觀(guān)測序列的概率,進(jìn)而可對該HMM做出相關(guān)評估。例如,已有一些模型參數各異的HMM,給定觀(guān)測序列O=O1O2O3…Ot,我們想知道哪個(gè)HMM模型最可能生成該觀(guān)測序列。通常我們利用forward算法分別計算每個(gè)HMM產(chǎn)生給定觀(guān)測序列O的概率,然后從中選出最優(yōu)的HMM模型。

這類(lèi)評估的問(wèn)題的一個(gè)經(jīng)典例子是語(yǔ)音識別。在描述語(yǔ)言識別的隱馬爾科夫模型中,每個(gè)單詞生成一個(gè)對應的HMM,每個(gè)觀(guān)測序列由一個(gè)單詞的語(yǔ)音構成,單詞的識別是通過(guò)評估進(jìn)而選出最有可能產(chǎn)生觀(guān)測序列所代表的讀音的HMM而實(shí)現的。

 

2 解碼問(wèn)題

給定觀(guān)測序列O=O1O2O3…Ot和模型參數λ=(A,B,π),怎樣尋找某種意義上最優(yōu)的隱狀態(tài)序列。在這類(lèi)問(wèn)題中,我們感興趣的是馬爾科夫模型中隱含狀態(tài),這些狀態(tài)不能直接觀(guān)測但卻更具有價(jià)值,通常利用Viterbi算法來(lái)尋找。

這類(lèi)問(wèn)題的一個(gè)實(shí)際例子是中文分詞,即把一個(gè)句子如何劃分其構成才合適。例如,句子發(fā)展中國家是劃分成發(fā)展--國家,還是發(fā)展-中國-。這個(gè)問(wèn)題可以用隱馬爾科夫模型來(lái)解決。句子的分詞方法可以看成是隱含狀態(tài),而句子則可以看成是給定的可觀(guān)測狀態(tài),從而通過(guò)建HMM來(lái)尋找出最可能正確的分詞方法。

 

3 學(xué)習問(wèn)題

HMM的模型參數λ=(A,B,π)未知,如何調整這些參數以使觀(guān)測序列O=O1O2O3…Ot的概率盡可能的大。通常使用Baum-Welch算法以及Reversed Viterbi算法解決。

目錄瀏覽
一级做受毛片免费大片_国产精品亚洲综合一区在线观看_亚洲免费黄片基地_欧美 亚洲 图色 另类