高效、務(wù)實(shí)、嚴謹、敬業(yè)
技術(shù)服務(wù)
技術(shù)專(zhuān)題
聯(lián)系我們

聯(lián)系我們

廣州賽誠生物科技有限公司
廣州市天河區黃埔大道中124號2705室
電話(huà):020-29031124
手機:18102256923
Email:servers@gzscbio.com
Fax:020-85625352
QQ:2913120624
基因芯片聚類(lèi)分析

      基因表達數據主要來(lái)自于兩個(gè)方面:(1)基因芯片,這是最主要的表達數據來(lái)源,利用基因芯片技術(shù)可以大規模并行獲取基因轉錄結果mRNA的數據;(2)表達系列分析SAGE和差異顯示、蛋白質(zhì)芯片等是快速檢測蛋白質(zhì)及其含量的另一類(lèi)技術(shù)。

      通過(guò)分析基因表達數據,發(fā)現與疾病直接相關(guān)的基因,以及發(fā)現這些基因的活動(dòng)規律。

      聚類(lèi)分析是模式識別中一種非常有吸引力的方法,特別適用于模式分類(lèi)數不知道的情況?;虮磉_數據聚類(lèi)分析一般包括以下幾個(gè)步驟:(1)確定基因表達的數據;(2)計算相似性矩陣,各個(gè)矩陣元素代表兩個(gè)基因的表達是否相似;(3)選擇算法進(jìn)行聚類(lèi)分析;(4)顯示分析結果。對數據進(jìn)行聚類(lèi)分析之前,必須將包含在基因表達矩陣中的數據進(jìn)行相似程度分析,并且對分析結果進(jìn)行量化。通常情況下,相似往往被賦于一個(gè)較大的量化的值,而不相似則由一個(gè)較小的量化的值來(lái)表示。在實(shí)際計算中,往往以距離代替相似的概念,相似性度量被轉化為兩個(gè)基因表達模式之間的距離。距離越小,表達模式越相近,反之,則表達模式差異大。

表達模式的關(guān)系

圖1  表達模式的關(guān)系

 

      幾種常用的聚類(lèi)方法:

      1、簡(jiǎn)單聚類(lèi)

      假設有n個(gè)基因,表達數據向量分別為X1, X2,…, XN;令任意一個(gè)基因的表達向量為第一個(gè)聚類(lèi)的中心,依次處理其它基因。

      在處理第i個(gè)基因時(shí),首先計算該基因的表達數據向量與現有各類(lèi)中心的距離;假設與第j類(lèi)的距離Dij最小,并且Dij<T,則將基因i分配到第j類(lèi);否則生成一個(gè)新類(lèi),該類(lèi)的中心為第i個(gè)基因的表達向量。

      2、層次式聚類(lèi)

層次式聚類(lèi)


      3、K平均聚類(lèi)

      任意選取K個(gè)基因表達向量作為初始聚類(lèi)中心

                   Z1, Z2,…, Zk

      反復迭代計算;如果||X-Zj(l)||< ||X-Zi(l)||(i=1,2,…,K,i?j),則將X所代表的基因歸于第j類(lèi)。按照上述辦法處理所有的基因;經(jīng)過(guò)上述處理,聚類(lèi)可能發(fā)生變化,因此需要重新計算K個(gè)新聚類(lèi)中心:

K平均聚類(lèi)

      對于所有的聚類(lèi)中心,如果Zj(l+1)=Zj(l)(j=1,2,…,K),則迭代結束,得到最后的聚類(lèi)結果;否則繼續進(jìn)行迭代計算。

      4、自組織映射神經(jīng)網(wǎng)絡(luò )

SOM結構圖

圖3  SOM結構圖

SOM聚類(lèi)結果

圖4  SOM聚類(lèi)結果

 

      5、模糊聚類(lèi)分析方法

      主要過(guò)程:

      (1)建立模糊相似矩陣

      (2)生成模糊等價(jià)矩陣

      (3)構建動(dòng)態(tài)聚類(lèi)圖

       6、聚類(lèi)分析結果的樹(shù)圖表示

聚類(lèi)分析結果樹(shù)圖

圖5  聚類(lèi)分析結果樹(shù)圖

      基因調控網(wǎng)絡(luò )分析,一個(gè)基因網(wǎng)絡(luò )由一組生物分子(如基因、蛋白質(zhì))以及它們之間的相互作用構成,這些生物分子共同完成一些特定的細胞功能任務(wù)。在實(shí)際分析過(guò)程中,往往以圖這種數據結構表示基因網(wǎng)絡(luò ),圖中的節點(diǎn)代表基因或者蛋白質(zhì),而節點(diǎn)之間的連線(xiàn)代表基因、蛋白質(zhì)之間的相互作用?;蚓W(wǎng)絡(luò )描述了特定細胞或組織中的功能路徑,如代謝、基因調控,信號傳導等。

      基因表達實(shí)際上是細胞、組織、器官受遺傳和環(huán)境影響的結果。一個(gè)基因的轉錄和表達由細胞的生化狀態(tài)所決定,在一個(gè)基因的轉錄過(guò)程中,一組轉錄因子作用于該基因的啟動(dòng)子區域,控制該基因轉錄,而這些轉錄因子本身又是其它基因的產(chǎn)物。當一個(gè)基因通過(guò)轉錄、翻譯形成功能基因產(chǎn)物后,它將改變細胞的生化狀態(tài),從而直接或間接地影響其它基因的表達,甚至影響自身的表達。多個(gè)基因的表達不斷變化,使得細胞的生化狀態(tài)不斷地變化。

      一個(gè)基因的表達受其它基因的影響,而這個(gè)基因又會(huì )影響其它基因的表達,這種相互影響、相互制約關(guān)系構成了復雜的基因表達調控網(wǎng)絡(luò )?;虮磉_數據之中隱含基因之間的相互作用關(guān)系,因而可以通過(guò)分析基因表達數據,構建基因調控網(wǎng)絡(luò )。

幾種基因調控網(wǎng)絡(luò )模型:

      1、布爾網(wǎng)絡(luò )模型

 

布爾網(wǎng)絡(luò )模型

圖6  布爾網(wǎng)絡(luò )模型

 

節點(diǎn)C真值表

表1  節點(diǎn)C真值表


作用規則與系統運行軌跡

圖7  作用規則與系統運行軌跡

 

布爾網(wǎng)絡(luò )模型狀態(tài)轉換

圖8  布爾網(wǎng)絡(luò )模型狀態(tài)轉換

 

      2、線(xiàn)性組合模型

      線(xiàn)性組合模型是一種連續網(wǎng)絡(luò )模型,在這種模型中,一個(gè)基因的表達值是若干個(gè)其它基因表達值的加權和?;颈硎拘问綖椋?/span>

線(xiàn)性組合模型


      3、加權矩陣模型

      加權矩陣模型與線(xiàn)性組合模型相似,在該模型中,一個(gè)基因的表達值是其它基因表達值的函數。

加權矩陣模型

目錄瀏覽
一级做受毛片免费大片_国产精品亚洲综合一区在线观看_亚洲免费黄片基地_欧美 亚洲 图色 另类