最新公告 通知:8月16日至8月21日编辑部无人值守,有事可给我方发邮件。敬请谅解!

杂志信息

主编:张选群,马建忠

执行副主编:张力

常务副主任兼责任编辑:徐光
外联部主任:张赛
编辑出版:《数理医药学杂志》编辑部
网址:http://www.slyyx.com
邮箱:slyyzz@126.com(投稿邮箱)
电话:027-87210457
地址:武汉大学医学院,430071

近期优秀文章

基于加权马尔科夫链疟疾发病趋势的预测

发布时间:2015-9-22      来源:admin      阅读次数:1015

范志成1,张华勋2*,程猛3,夏咏1

(1.湖北省襄阳市襄州区疾病预防控制中心 ,湖北襄阳 441104;2.湖北省疾病预防控制中心,湖北武汉 430079;3. 湖北省襄阳市疾病预防控制中心,湖北襄阳 441021)

[摘要] 目的 探讨加权马尔科夫链模型在疟疾发病趋势预测中的应用效果,为疟疾防治工作提供科学依据。方法 以襄阳市襄州区1980—2013年不同时段的疟疾疫情资料为样本,采用加权马尔科夫链分别对来年的发病情况进行预测。结果  利用襄阳市襄州区1980—2011年和1980~2012 年的疟疾发病率资料分别预测2012年和2013年疟疾发病情况,预测结果与实际发病情况均一致;以1980—2013年疟疾发病资料预测2014年发病趋势,结果与前2年疟疾发病实际情况相同;经检验疟疾发病序列符合马尔科夫性(χ2=23.6274 >χ0.052(9)=16.919),但序列的长期趋势具有不平稳性。结论  襄州区目前已消除疟疾在当地的传播和流行,在未来几年将继续保持无本地病例感染状态。今后,加强输入性疟疾防控及做好消除疟疾的考核验收工作是该区疟防工作的主要任务。

 [关键词] 加权马尔科夫;间日疟;预测

Based on the weighted markov chain to predicte the malaria situation in Xiangzhou district

FAN Zhi-Cheng1,ZHANG Hua-Xun2*, CHENG Meng3,XIA Yong1

(1. Xiangzhou District Center for Disease Control and Prevention, Xiangyang 441104;2.Hubei 

Provincial Center for Disease Control and Prevention, Wuhan 430079;3. XiangYang city 

Center for Disease Control and Prevention, Xiangyang 441021 Hubei Province, China)

[abstract] Objective To discuss the application effect of the weighted markov chain model

 in malaria incidence trend prediction, provide the scientific basis for malaria prevention and 

control. Methods To forecast the incidence by using the weighted markov chain respectively 

for Xiangzhou district at different times from 1980 to 2013 with malaria epidemic situation 

data. Results Through the malaria epidemic data in the two stages of 1980-2011 and 1980

2012 to forecast the malaria incidence in 2012 and 2013 respe ctively, we found that the 

prediction results  were consistent with the actual incidence; Through the malaria epidemic

 data of 1980-2013 to forecast the malaria incidence in 2014, we found that the prediction 

result was consistent with  that in the two years before. So the Malaria test sequences are 

consistent with markov property(χ2=23.6274 >χ0.052(9)=16.919), but the long-term

 trend is not stable. Conclusion The spread and popular of malaria in Xiangzhou district are 

eliminated, and in the next few years it will keep no local infection malaria cases.To 

strengthen the imported malaria control and pass the elimination malaria check and 

acceptance will be the main task in the present and future work.

 [key words] Weighted markov chain;Plasmodium vivax; forecasting

疟疾主要是经过人-蚊传播的寄生虫传染病。一个地区疟疾发病的高低取决于当地传疟按蚊的密度、传染源的数量和人蚊接触的机会多少[1]。由于气象条件的多样性,特别是温度的变化影响了疟蚊孶生和活动,而人类生产和生活方式的差异性又导致了人蚊接触机会的不同。假设上述状况是在一个随机状态下发生,那么疟疾的传播过程是一个随机过程,因此形成的依时间变化(年、季、月)的疟疾发病率序列也是一个随机变量序列。马尔科夫过程是随机过程的一个分支,它的最基本的特征是“无后效性”(也称“马氏性”),即在已知随机过程“现在”状态的条件下,其“将来”的状态与“过去”的状态无关,状态和时间均离散的马尔可夫过程称马尔可夫链[2]。马尔可夫链预测是根据事件的目前状态预测其未来时刻变动状态的一种预测方法[3]。运用传统的马氏链预测疟疾的发病趋势诸见报道[4-6],而应用加权马尔科夫链预测未见报道,现以襄阳市襄州区1980-2013本地感染疟疾发病率资料,采用加权马尔科夫链进行预测,探讨其可行性。

1 资料和方法

1.1  资料  疟疾疫情资料来源于襄州区疾控中心,人口资料来源于襄州区统计局,根据各年的人口资料获得襄州区1980—2013年疟疾发病率(1/万)。

1.2  方法  应用加权马尔科夫链法[7-8],在Excel上进行计算处理。现以襄阳市襄州区1980-2011疟疾发病率数据,对2012年发病状态进行预测,介绍其计算方法和步骤:

1.2.1 确定各年疟疾发病率所处的状态

在spss软件上对1980-2011疟疾发病率进行系统聚类分析,初步划分疟疾发病率所处的初状态分级,结合我国《疟疾控制和消除标准(GB26345-2010)》的控制、基本消除和消除指标,将发病率的取值范围划分为4种状态。即状态1:0≤x<1;状态2:1≤x<5;状态3:5≤x<10;状态4:10≤x(x为疟疾发病率),确定各年疟疾发病率所处的状态(见表1)。

1.2.2  根据各年疟疾发病率所处的状态,统计计算1980-2011疟疾发病率状态的初始状态概率和各时段不同滞时(步长)的一阶转移概率矩阵。

从表1统计1980-2011疟疾发病率各状态的频数,除以总频数,得到该时段各个状态的初始状态概率,记为p.j;再计算该时段一阶转移概率矩阵。如状态1的频数为12,其转向状态1、2、3、4的频数分别是9、2、0、0,但状态1中最后一个发病率状态转向不明,故从频数12中减去1,得到状态1转移到状态1、2、3、4的概率分别为p11=9/11,p12=2/11,p13=0/11,p14=0/11。依次类推,求出状态2、3、4 分别转移各个状态的一阶转移频数及概率(见表2),并记一阶转移频数矩阵为fij ,转移概率矩阵为pij(1)。同理,可求出1980年分别至2010年、2009年、2008年不同时段的滞时(步长)一阶转移概率矩阵,记为pij(2) pij(3) pij(4) 。

表1          1980—2013年襄阳市襄州区疟疾发病率及其状态(1/万)

 

发病率

状态

发病率

状态

发病率

状态

1980

64.91 

4

1992

1.36 

2

2004

5.58 

3

1981

100.40 

4

1993

0.56 

1

2005

3.59 

2

1982

81.00 

4

1994

0.53 

1

2006

4.14 

2

1983

28.90 

4

1995

0.73 

1

2007

4.05 

2

1984

25.74 

4

1996

0.51 

1

2008

1.65 

2

1985

6.40 

3

1997

0.41 

1

2009

0.66 

1

1986

4.71 

2

1998

0.56 

1

2010

0.30 

1

1987

2.63 

2

1999

0.54 

1

2011

0.04 

1

1988

1.80 

2

2000

0.53 

1

2012

0.00 

1

1989

0.89 

1

2001

1.18 

2

2013

0.00 

1

1990

1.63 

2

2002

7.30 

3

 

 

 

1991

2.43 

2

2003

5.63 

3

 

 

 

    表2    1980—2011年疟疾发病率初始状态概率、状态转移频数和转移概率计算表

 

初始状态概率(p.j)

一阶转移频数(fij)

一阶转移概率(pij)

状态

频数

概率

状态

1

2

3

4

状态

1

2

3

4

1

12

12/32

1

9

2

0

0

1

9/11

2/11

0/11

0/11

2

11

11/32

2

3

7

1

0

2

3/11

7/11

1/11

0/11

3

4

4/32

3

0

2

2

0

3

0/4

2/4

2/4

0/4

4

5

5/32

4

0

0

1

4

4

0/5

0/5

1/5

4/5

        9/11 2/11 0/11 0/11                    8/10 2/10 0/10 0/10

pij(1)=   3/11 7/11 1/11 0/11           pij(2)=    3/11 7/11 1/11 0/11

        0/4  2/4  2/4  0/4                     0/4  2/4  2/4  0/4

0/5  0/5  1/5  4/5                      0/5  0/5  1/5  4/5

         7/9  2/9  0/9  0/9                      7/9  2/9  0/9  0/9

pij (3)=   3/11 7/11 1/11 0/11            pij(4)=    3/10 6/10 1/10 0/10

        0/4  2/4  2/4  0/4                       0/4  2/4  2/4  0/4

        0/5  0/5  1/5  4/5                       0/5  0/5  1/5  4/5  

1.2.3 检验疟疾发病率状态序列的马氏性,计算公式为:

      m  m                                     

χ2= 2∑∑ fij  |logpij/ p.j |

      i=1j=1                       

式中,fij为一阶转移频数,pij为一阶转移概率,p.j为初始状态概率又称边际概率。当序列n较大时,统计量服从自由度为((m-1)2)的χ2分布,给定显著性水平α,查表可得分位点χα2((m-1)2)的值,计算统计量χ2 的值。若χ2>χα2((m-1)2),则可以认为序列符合马氏性。利用表2的数据进行计算并检验(见表3)。

表3         1980—2011年疟疾发病率序列马氏检验计算表

 

状态

fi1|logpi1/ p.j|

fi2|logpi2/ p.j|

fi3|logpi3/ p.j|

fi4|logpi4/ p.j|

合计

1

2.6838 

0.7100 

0

0

3.3938 

2

0.2226 

2.0565 

0.5513 

0

2.8304 

3

0

1.2568 

1.2568 

0

2.5136 

4

0

0

0.1335 

2.9424 

3.0759 

合计

2.9064 

4.0233 

1.9416 

2.9424 

11.8137 

χ2=2×11.8137=23.6274 >χ0.052((4-1)2)=16.919,疟疾发病率序列检验符合马氏性。

1.2.4 计算各阶自相关系数并规范化

                        n-k                  n

各阶自相关系数计算式:rk=∑ (xL- x)( xl+k- x)/ ∑(xL- x)2

                            L=1                   L=1

式中:rk 表示第k 阶(滞时为k 年的)自相关系数;xL 表示第L年的疟疾发病率;x表示年均发病率,n 表示年疟疾发病率序列的长度。

                                      m

对各阶自相关系数规范化计算式:wk=|rk|/∑|rk|

                                     K=1

以此作为各种滞时(步长)的马尔可夫链的权重(m为按预测需要计算到的最大阶数),计算结果(见表4)。

    表4    1980—2011年疟疾发病率序列各阶自相关系数和各种步长的马尔可夫链权重

 

k

1

2

3

4

rk

0.7881

0.5253

0.1846

0.1152

wk

0.4885

0.3256

0.1144

0.0714

1.2.5 通过1980—2011年疟疾发病率状态序列对2012年发病状态进行预测

将同一状态的各预测概率加权和作为2012年疟疾发病状态的预测概率,计算式为:

        m

    Pi=∑ wk pij (k)

      K=1

max{Pi}所对应的i 即为该年疟疾发病率的预测状态。结果(见表5)。

2  结果

表5中,2011年状态1、2、3、4的转移概率来源于矩阵pij(1) 的第1行,依次类推,…,2008年转移概率来源于矩阵pij(4) 的第2行。由表5可知,对pi加权求和后,max{Pi}=0.7598,此时i=1,对应的发病率状态为0≤x<1。2012年实际发病率为0,状态为1,预测准确。

 

表5                   2012年襄阳市襄州区疟疾发病率预测

初始年

状态

滞时/年

权重

状态

概率来源

1

2

3

4

2011

1

1

0.4885

0.8182

0.1818

0

0

pij(1)

2010

1

2

0.3256

0.8000

0.2000

0

0

pij(2)

2009

1

3

0.1144

0.7000

0.2000

0

0

pij(3)

2008

2

4

0.0714

0.2727

0.5455

0.0909

0

pij(4)

pi加权求和

0.7598

0.2158

0.0065 

0

 

   同理,以1980~2012 年的疟疾发病资料预测2013 年的发病情况,重复上述1.2.1—1.2.5计算过程,预测结果与实际发病情况一致(见表6);再以1980~2013年的资料预测2014年的疟疾发病情况,预测结果仍为状态1(见表7)。 

 

表6                  2013年襄阳市襄州区疟疾发病率预测

初始年

状态

滞时/年

权重

状态

概率来源

1

2

3

4

2012

1

1

0.4850

0.8333

0.1667

0

0

p(1)

2011

1

2

0.3245

0.8182

0.1818

0

0

p(2)

2010

1

3

0.1164

0.8000

0.2000

0

0

p(3)

2009

1

4

0.0741

0.7000

0.2000

0

0

p(4)

pi加权求和

0.8147

0.1779

0

0

 

表7                 2014年襄阳市襄州区疟疾发病率预测

初始年

状态

滞时/年

权重

状态

概率来源

1

2

3

4

2013

1

1

0.4816

0.8462

0.1538

0

0

p(1)

2012

1

2

0.3234

0.8333

0.1667

0

0

p(2)

2011

1

3

0.1184

0.8182

0.1818

0

0

p(3)

2000

1

4

0.0766

0.8000

0.2000

0

0

p(4)

pi加权求和

0.8352

0.1648

0

0

 

      3 讨论

马尔科夫链对疾病发生趋势的预测,主要是对疾病的发病状态或性质的准确性和可靠性进行预测,其预测值是一个区间,也可是一个病原体的流行毒株和分型[9]。加权马尔科夫链对疾病的预测是以若干阶的自相关系数为权重,用各种步长的马尔可夫链加权和来预测未来发病状态,与传统的马尔可夫链预测方法相比,能更充分、更合理地利用信息[10]。应用加权马尔科夫链模型对襄阳市襄州区2012年和2013年疟疾发病情况进行预测,获得了满意的效果;对2014年进行预测,其状态1的概率也较大。显示,襄阳市襄州区未来几年疟疾发病态势仍然保持在无本地病例感染状态。

利用1980年-2013年疟疾发病状态的一阶转移概率矩阵,计算其二阶转移概率矩阵,结果是一个非正规矩阵。根据马尔科夫遍历性定义,其多阶转移概率矩阵不存在极限分布,状态序列为非平稳性序列 [11]。表明,近10年来襄阳市襄州区随着全球基金疟疾项目和中国消除疟疾行动计划的实施,抗疟措施力度得到了不断加强,该区2012年和2013年疟疾发病率降至为0,消除了疟疾在当地的传播和流行,原来疟疾发病的固有状态被打破。

     0.8462 0.1538    0    0                 0.7579  0.2281 0.0140   0

P1=  0.2727 0.6364  0.0909  0     →     P2=  0.4043  0.4924 0.1033   0

      0      0.5    0.5    0                  0.1364  0.5682 0.2955   0

      0      0     0.2   0.8                  0      0.1    0.26   0.64

随机序列的初始状态概率和转移概率的分布是依据状态的划分而确定,合理、有效的划分序列的状态是提高马尔科夫链预测效果的基础。其划分方法有区间定量法和定性法[9]。其中区间定量方法主要有经验法[11]、组间距法[4,6]、均数-标准差法[7]、指标法[10]、灰色比值法[12]、聚类法[8]和分段函数法[13]等,具体应用时应根据时间序列数据的特征及相关模型的适用情况进行选择。

于此同时,影响马尔科夫链模型预测效果还与序列的长度、序列是否过于波动、预测时期的长短等有关。时间序列长度不够,信息量少,将会导致状态转移概率的分布不够充分、明朗,影响到预测结果的准确性[14];马尔科夫链模型虽然适用于波动序列的预测,但序列值波动过大,同样会影响到预测的效果[6];由于马尔科夫链模型预测结果取决于一阶转移概率矩阵,而这个矩阵是不会一成不变的,因此对近期预测效果较好,在进行预测时,还要随时根据新的资料对转移概率矩阵不断进行调整[14]。如果这些因素未加以考虑,无论序列状态如何划分,同样达不到应有的预测效果。

参 考 文 献

[1] 卫生部疾病预防控制局.疟疾防治手册[M]. 3版.北京:人民卫生出版社,2007:86-94. 

[2] 孙志才,张戈,林学钰. 加权马尔可夫链在降水枯丰状况预测中的应用[J].系统工程理论与实践,2003,(4):100-105.

[3] 方积乾,陆盈.现代医学统计学[M].北京:人民卫生出版社,2002:645.

[4] 巴剑波,方旭东,徐雄利,等.马尔科夫模型在海军疟疾疫情预测中的应用[J]. 解放军预防医学杂志,2001,19(2):114-116.

[5] 王伟明,金小林,周华云,等. Markov模型在疟疾发病趋势预测中的应用[J]. 中国热带医学,2006,6(10):1780-1781.

[6]樊雯婧,陆群,邹立巍,等.Markov模型在合肥市疟疾发病趋势预测中的应用[J]. 中国热带医学,2013,13(7): 819-820.

[7] 夏乐天,朱元甡,沈永梅.加权马尔可夫链在降水状况预测中的应用[J]. 水利水电科技进展,2006,26(6):20-23.

[8] 彭志行,鲍昌俊,赵杨,等. 加权马尔科夫链在传染病发病情况预测分析中的应用[J]. 数学的实践与认识,2009,39(23): 92-99.

[9]吴昊澄,林君芬,何凡,等. 流感优势毒株马尔可夫模型预测分析[J]. 中国预防医学杂志,2014,15(3):170-172.

[10] 夏乐天.梅雨强度的指数权马尔可夫链预测[J]. 水利学报,2005,36(8):1-8.

[11] 赵亮,吴艳乔,彭丹,等. 运用马尔科夫链对我国霍乱发病率的预测[J].现代预防医学,2010,37(5):809-810.

[12] 严薇荣,徐勇,杨小兵,等.基于灰色马尔可夫模型的伤寒副伤寒发病率预测[J].数理医药学杂志,2008,21(2):137-139. 

[13] 杨飞雨,俞茹.灰色-马尔柯夫模型预测模型在股指预测中的应用[J].经济管理,2009,20(5):53-54.

[14] 王丙刚,曲波,郭海强,等. 传染病预测的数学模型研究[J]. 中国卫生统计,2007,24(5):536-540.

返回>>Top︿

地址:武汉大学医学院《数理医药学杂志》编辑部 技术支持:武汉云思达信息科技有限公司
邮政编码:430071 联系电话:027-87210457 传 真:(027)87210457
投稿咨询:1209807661杂志合作:1209807661