最新公告 暑假放假安排

杂志信息

主编:张选群,马建忠

执行副主编:张力

常务副主任兼责任编辑:徐光
外联部主任:张赛
编辑出版:《数理医药学杂志》编辑部
网址:http://www.slyyx.com
邮箱:slyyzz@126.com(投稿邮箱)
电话:027-87210457
地址:武汉大学医学院,430071

近期优秀文章

基因表达调控互作网络模型的研究

发布时间:2015-9-7      来源:admin      阅读次数:675

基因表达调控互作网络模型的研究

刘正龙1,杨艳梅2,王洪平3,罗玉军1

  • 川北医学院计算机与数学教研室  四川 637000;2.西华师范大学数学与信息学院  四川 637002;3.南充职业技术学院信息管理系  四川 南充  637007)

摘  要:随着基因组学研究的进展,获得的基因表达的生物信息在短时间内产生海量的数据,揭示了相关基因及其产物的研究之间的关系,基因表达的调控是不是孤立的,单一的,而是相互制约,相互联系,构成了复杂的基因调控网络。单个基因的基因网络调控的影响几乎是所有细胞功能和活性的体现,分离和表达几乎完全不能准确反映生活本身的现象及其内在规律。本文研究了几种经典的调控网络模型的构建的基本原理和算法,讨论各种模型的优缺点及其适用条件,对不同的基因网络模型的比较与分析,从而揭示生命的本质和疾病发生机制,对复杂疾病的治疗提供理论依据。

关键词:基因表达调控;布尔网络模型;加权矩阵模型;微分方程模型;贝叶斯网络模型

Study of Interaction Network Model Based on Gene Expression Regulatory

Liu Zhenglong1,Yang Yanmei2, Wang Hongping3, Luo Yujun1

(1.Department. of Mathematics and Computer, North-SiChuan Medical College; 2.Mathematics & Information College, West China Normal Unvisersity; 3. Department of information management, Nanchong Professional Technic College, NanChong, SiChuan,China 637007)

Abstract: With the development of genomics, gene expression data obtained organisms in a short time, it reveals the relationship between genes and their products for research and, the regulation of gene expression is not a single, isolated, but interrelated, restrict each other, form a complex network of gene expression regulation. Cell activity and function of almost all were affected by gene regulation network, the study of single gene isolated and its expression is almost completely can not accurately reflect the phenomenon of life itself and the inherent law. The basic principle and algorithm of this paper study several models of classical control network, advantages and disadvantages and applicable conditions of various models, comparative study and analysis of the various gene network model, in order to clarify the mechanism of disease occurrence of nature and life.

Key words: Gene expression regulation; the Boolean network model; weighted matrix model; differential equation model; Bayesian network model


 

1 引言 

基因调控互作网络是生物学、数学、计算机信息科学交叉渗透形成的生物信息学,利用生物信息学手段的来研究基因调控复杂网络关系的数据分析,在细胞周期调控的存在,组织特异性,这些特定基因表达的外部信号反应的特殊差异性,基因表达调控机制研究的重要理论基础和应用价值是把复杂而有序的调控机制在生物细胞内实现表达调控[1]。在特定的细胞调转状态下,哪些基因的高表达了发生?他们的表达量的值是多少?他们是通过那种方法调控的?这些基因的调控表达产物对细胞生理活动周期的影响是什么?针对以上四个问题的研究是重要解决目标,这些问题的处理将指导临床实践,揭示生命科学的奥秘,这个表达调控过程是通过蛋白质与蛋白质,蛋白质和核酸互作实现,其中包括基因表达的基因激活转录调控和染色体结构变化, mRNA加工和运输,翻译和蛋白质修饰的,mRNA的降解整个过程[2]。因此,连接的网络是通过基因表达下调对互作和代谢过程研究形成的相互网络 [3]。

如果用一个有向图表示,顶点代表蛋白质或核酸,这样可以抽象成一个数学问题,和边缘代表的互动。每一个顶点反映互作网络的动态特征是一个状态的调换或基因物质浓度的变化差异将影响整个系统稳定状态,状态最终可达到相对平衡可由每个顶点表示[2]。要理解细胞的基因表达调控的过程就必须全面系统地对细胞的各种物质的测量和考虑各种材料变化引起构建调控网络表达的复杂性。当作为整个互作网络系统的特征可能是一个稳定的状态,或混合状态具有多点吸引子。目前不能得到所有的生物大分子的数据和有关物质是鉴于生物大分子检测技术手段,所以,我们对分子生物学网络进行研究为网络的理论和计算性能建立这样一个大型网络也是一种挑战,原因是基因中大量的数据在细胞中的蛋白质和其他物质中,在这一阶段仍然存在数据缺乏的问题[4][5]。

2 基因表达调控拓扑网络的构建

   海量的基因表达数据来源于cDNA微阵列技术的广泛应用,基因表达的基因转录的环节中也起着非常重要的角色是基因转录的调控机制体现在细胞数内mRNA相对或绝对的数量基础上。一个基因调控通路的形成基因调控通路(GRP, Gene Regulatory Pathway) [6][7]过程是基因的转录过程,基因的表达产物可能是一种转录因子,激活基因的转录,它可以激活或抑制其它基因的转录,转录因子(蛋白质)与DNA结合。一个基因的表达调控水平在路径有一定的相关性,例如,通过调节基因表达的往往是相同的转录因子调控,这些生物的知识可以用来指导构建基因的调控通路。从分析表达谱数据,从而可以建立一个基因互作网络模型,被称为反向工程(RE, Reverse Engineering),如图1所示。基因表达调控互作网络常用的模型式有基因调控布尔网络模型,线性拟合模型,加权矩阵数学模型,微分方程模型,贝叶斯网络模型这五种模型。

                           图1  反向工程原理

在图2中,有方向图G=(V,F)表示布尔网络模型定义,假设一个A顶基因表达,B顶点基因不表达,C顶点基因表达。每个顶点代表一个基因,或代表对环境的干扰,其中V是一个图的顶点集。将影响的基因调控网络的表达通常有环境干扰与生物,物理或化学因素有关,这些并不是一个基因或者是基因的产物,虽然F是有方向集的边,在每条边上代表基因之间的互作关系。

3 基因表达调控拓扑网络模型

 3.1 布尔网络模型

图2表示了布尔网络模型,从起点状态开始,经过一系列的状态转换后,最终达到形成稳定状态的网络系统,相对稳定性状态是不同的重点状态对应于细胞 [7]。

         

 

 

 

 

 

图2    布尔网络模型                        图3 布尔网络模型状态转换

如果在一个稳定的布尔网络状态中,状态的所有基因并没有改变,那么稳定状态是“吸引点”;假设一个固定的网络有多个周期轮换状态,然后固定状态为“浮动态吸引子点”,因此,网络系统是一个相对固定的状态[9][11]。具体分析,稳定状态分为两类,一类是单稳态,即系统状态不再变化。如图3(a),有两类状态,一类是多稳定状态,即系统状态也没有绝对的稳定性,是相对稳定的,系统在循环链里移动多个状态之间的切换,另一类是单态,系统状态 (1,0,0)作为起点,通过一系列的中间状态变化,达到单态后,系统停留在状态(0,0,0)。如图3(b),系统达到相对稳定状态之后,在状态(1,1,0)和状态(0,0,1)之间的改变。

研究准确描述逻辑基因调控网络原理对基因的转录和表达是同各国布尔网络描述他们的顺式调控系统,在给定环境和条件下的Endol模拟。基因调控系统的结构和功能被Arnone和Davidson[1][3总结了一些研究结果,认为调控互作网络模型的采用顺式调控系统的直接分析方法。

3.2线性拟合模型 

一个基因表达值是其他几个基因表达的权值相加的结果可以通过一个线性拟合的数学互作网络模型,基本表示:

D+w                       (1)

在式(1)中在基因互作关系表示中为了趋近基因表达调控的实际水平,可以添加其它数据值,基因i在时刻的表达水平是代表基因j的表达水平影响基因i,基因j在t时刻的表达水平。如果在(1)式中可以增加一个常数值A,其中(2)式将表示一个没有其它调控输入下的基因表达水平:

                           (2)

根据式子(2),输入一系列基因表达水平的实验数据之后,即每个基因的时间序列,计算中用每个基因表达分析的微分方程可以通过使用多因子分析方法或最小二乘法来解决系统的微分方程,确定方程中给定的参数,即确定。实验结果证实,基因表达通过该模型能较好地拟合实验数据。

D’haeseleer[11]等人通过解微分方程迭代计算采用鼠脊髓和海马区域的基因表达数据进行研究,精确地复制网络调控的变化轨迹,包含脊髓发育,海马回发育到损伤。

3.3 加权矩阵模型

   一个基因表达值是其它基因表达值的函数是把线性拟合模型和加权矩阵模型结合形成的,含n维空间向量表示用n个基因表达状态,中每个元素代表一个加权矩阵W在时间t基因表达水平的基因之间相互作用的表示,代表基因 j 的表达水平对基因 i 的影响。在时刻 t ,调控输入为 j的表达水平(即)乘以 j 对 i的调控影响深度,基因表达i 的总调控输入为:

   (3)

   通过式(3)在初始阶段时有未知的矩阵的加权值,根据基因表达数据中估算的加权矩阵的所有元素值,也可以使用机器学习的方法。

可以利用成熟的线性代数方法和神经网络方法分析求解这样的一个数学模型,在这个数学模型中添加新函数变量应对模拟环境条件变化对基因表达水平的影响程度。实验结果表明该模型具有稳定周期和稳定的基因表达水平,与实际的生物仿真系统具有一致性。

从基因的表达谱开始,构建基因调控网络是对基因表达数据的整合与分析,而无需考虑的影响的实验过程中的噪声和其他因素对建模干扰外,最大的问题是维数,布尔网络模型描述以上变量(基因数)的增加,数据是指数级的增长,计算复杂性也快速增长。基因网络推理的N基因,需要许多数据点?如果它是完全没有约束,完全连接的布尔网络模型,需要测量所有的规模。为了解决这个问题,一个有效的方法是减少网络的大小,即,减少模型中节点之间的链接的数目[12]。许多研究表明,对于基因调控网络,蛋白质-蛋白质相互作用网络,代谢网络,不需要构建网络结构的完全连接,这些网络的无标度网络( Scale-free network ),即具有  条边的节点分布几率 满足泊松分布公式(4):

   (4)

3.4微分方程模型

   Chen[13]在早些时候使用线性常微分方程来描述网络系统模型作为基因调控互作网络,Y eung[12]等在此基础上发展了Chen 的方法,对给定的微分方程的一般形式:

  (5)

  在式(5)中,表示噪声,表示外部刺激,N 表示系统中的基因数目,表示第 i 个基因在t 时刻的表达水平,表示自降解速率,  的意义与线性组合模型的相同。K ikuchi[15]等利用遗传算法优化系统参数优化微分方程系统的 system模型,G ouze[10],De Jong[13]等在此基础之上采用了分步线性微分方程模型,该模型是一种非线性常微分方程系统:

 (6)

其中(6)式右边的而后一项表示所有使  减少和前一项表示所有使  增加的因素,Maki 等[14]进一步把system模型和布尔网络结合起来描述和处理等探讨了右端是任意函数形式的微分方程系统:

  (7)

方程(7)式作为一个模型的基因调控网络,更为复杂,描述的基因网络的复杂关系适用于周期性的基因表达,引入偏微分方程模型来求解基因调控网络数学模型。

3.5 贝叶斯网络模型

Friedman[6]等人在2000年提出了用贝叶斯网络模型的概率图模型对基因表达数据分析,局部概率乘积近似的高维复杂的概率分布是其最基本的思想。通常采用贝叶斯网络模型的可用数对节点,G为一有向无圈图, 表示,图中节点对应随机过程变量 ,表示基因的表达向量采用cDNA微阵列数据分析,D为B中的一部分,表示一组条件概率分布。调控网络模型偏差的构建,根据俄罗斯科学家隐马尔可夫提出假设:每个变量之间相互独立是在给定G中的父结点前提下,联合概率分布下得到随机变量,这种研究方是隐马尔可夫链描述变量之间的关联互动和向无环图模型的贝叶斯网络。

  (8)

在公式(8)中 的父结点集合用 表示,需要确定各种条件下出现的概率的计算公式是为了确定的联合概率分布,通过这种条件独立关系将被解释为因果关系是偏置网络的核心用条件概率用D表示,也是用来表示基因之间的相互调控关系。

基因表达谱数据确定为一组,分解一个评分函数利用条件独立性的条件打分函数使分数的增加利用路径局部搜索方法,最后被确定为得分最大的网络结构的基因调控网络结构和参数:

 (9)

动态贝叶斯网络模型(DBNs) 被Smith 等人还提出,在式(9),动态贝叶斯网络模型和贝叶斯网络模型之间的区别是,它将两个节点代表表达载体的时间点之前和同一基因后,可以将控制负反馈和延迟考虑是这种模式的优势,一个无环图的问题缺陷被普通贝叶斯网络克服。这种模型被Husmeier和Ong[16]等人用在微阵列数据分析中,该模型是用于构建基因调控网络所使用的微阵列数据 [12][14]。

4 基因表达网络模型分析

    前面使用布尔网络模型描述了基因和基因网络之间复杂的相互作用提供一个基础框架,却是一个相对较粗的数据模拟在对基因表达调控网络的比较分析,从生物学意义的特征,如模型的整体的复杂性,冗余度,自组织性等,可以在权重矩阵模型中不考虑这些自然特征。基因相互作用的线性模型近似为线性关系,相关性往往是非线性基因与实际不符,因此改进模型。广泛的定性分析方法的加权矩阵模型中使用布尔网络模型,通过生物过程的定量描述,数学分析,可以得到贝叶斯网络的筛选方法有其局限性,但是可以看作是两个模型之间的一种折衷选用贝叶斯网络模型。生物体的生命周期现象和有向无环结构的网络模型与假设并不符合。其次,网络结构非常复杂的,计算量也非常大在贝叶斯网络学习过程中。基因表达的动态行为描述是用微分方程模型是由其他基因的外部环境因素与功能变化的表达水平来表示,有充分理由来模拟基因调控网络。在与其它模型相比较的前提条件下适用于研究基因网络的复杂关系采用微分方程模型可以用在非常强大和灵活复杂基因表达调控互作网络模型。

生命数据挖掘的重要手段和方法采用基因表达网络分析,但在现阶段有各种数学工具,海量的数据网络模型源源不断引入其中,但有许多方面仍在尝试和探索阶段中,同时也为网络调控模型奠定了坚实的数学理论知识基础[15]。为了提高基因调控网络建模数据的准确性,需要进一步提高数据质量和基因表达数据的不断扩大,对生命科学中的基因互作网络模型研究是在伴随着后基因组学的不断发展与改进算法中发挥更大的作用。

5 结论

   加权矩阵首次应用于基因网络的表达调控方法的背景,是基于基因调控网络通路是一个非常复杂的系统,难以用简单的数学模型来进行描述,存在问题主要是;搜索网络非常耗时,却无法实现有成千上万个基因,也不能准确地描述基因之间的调控关系。用一种很典型的方法是生态相关的数学模型研究生命学科的因果关系,但该方法也无法预测下一时点的调控网络,也不能作为提供一个因果关系的理论依据。处于初始阶段的还是对基因调控网络的整体结构数学模型研究,却不能描述单个基因之间的因果关系,是由于筛选功能相似的基因簇采用聚类分析方法进行分析。从某一个方面描述实际的基因表达调控网络的许多模型中,并没有一个完整的应用软件包。对基因组学研究有一个效的突破将发挥重要的作用是随着计算机运算速度提高,非线性技术的算法不断改进,也对研究基因表达调控网络互作模型具有一定的可行性和有效性,本文针对不同的基因调控互作网络模型的比较与分析研究,从而揭示生命的本质和疾病发生机制,对复杂疾病的治疗提供重要的理论依据。

参  考  文  献

  • M Eisen , P S pellman , P Brown, et al . Cluster analysis anddisplay of genomewide expression patterns[J]. Proceedings ofthe National Academy of Sciences of the United States of Amer2ica, 1998,95 (25) :14 863-14 868.
  • S Chu , J DeRisi , M Eisen , et al . The transcriptional programof sporulation in budding yeast [J] . Science , 1998 , 282(5 389) :699-705.
  • P Smolen,D A Baxter,J H Byrne. Mathematical modeling ofgene networks[J] . Neuron , 2000 , 26 (3) :567-580.
  • C Yuh , H Bolouri , E Davids on. G enomiccis regulatory logic :Experimental and computational analysis of a sea urchin gene[J] . Science , 1998 , 279 (5 358) :1 896-1 902.
  • T Akutsu , S Miyano , S Kuhara. In ferring qualitative relationsin genetic networks and metabolic pathways [J ]. Bioin formatics , 2000 , 16 (8) :727-734.
  • I Shmulevich, E Dougherty , S K im , et al . Probabilistic Boolean networks: a rule2based uncertainty model for gene regulatory networks[J] . Bion formatics , 2002 , 18 (2) :261-274.
  • H De Jong , J G ouze , C Hernandez , et al . Qualitative s imulationof genetic regulatory networks us ing piecewise2linear models[J].Bulletin of Mathematical Biology , 2004 , 66(2) :301-340.
  • S K ikuchi , D T ominaga , MArita , et al . Dynamic modeling ofgenetic networks using genetic alg orithm and S 2system[J] .Bioinformatics, 2003, 19 (5) :643-650.
  • B Ren , F Robert , J J Wyrick , et al . G enome2wide locationand function of DNA binding proteins [J]. Science , 2000 ,290 (5 500) :2 306-2 309.
  • G J Hannon. RNA inter ference [J] . Nature , 2002 , 418(6 894) :244~251.
  • R B I rby , R L Malek , G Bloom , et al . I terative microarrayand RNA inter ference2based interrogation of the Src2inducedinvasive phenotype [J] . Cancer Research , 2005 , 65 ( 5) : 814-1821.
  • M Zou, S D Conzen. A new dynamic Bayesian network(DBN) approach for identifying gene regulatory networks fromtime course microarray data [J] . Bioinformatics , 2005 ,21 (1) :71-79.
  • 李霞,李亦学,廖飞.生物信息学[M].北京,人民卫生出版社,2010.172-204.
  • 徐肖江,王连水,丁达夫. 从酵母表达时间序列估计基因调控网络[J].生物化学与生物物理学报, 2003 ,35(8) :707-716.
  • 张晗,宋满根,陈国强. 一种改进的多元回归估计基因调控网络的方法[J].上海交通大学学报, 2005,39 (2) :270-274.
  • 雷耀山, 史定华, 王翼飞. 基因调控网络的生物信息学研究[J ] . 自然杂志 , 2004 , 26 (1) :7-12.
返回>>Top︿

地址:武汉大学医学院《数理医药学杂志》编辑部 技术支持:武汉云思达信息科技有限公司
邮政编码:430071 联系电话:027-87210457 传 真:(027)87210457
投稿咨询:1209807661杂志合作:1209807661