为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 甲型肝炎风险预测中Apriori关联规则应用

甲型肝炎风险预测中Apriori关联规则应用

2011-10-24 2页 pdf 183KB 18阅读

用户头像

is_509973

暂无简介

举报
甲型肝炎风险预测中Apriori关联规则应用 表 2  不同民族学龄儿童血铅水平前 10 位影响因素 位次 汉族    维吾尔族     哈萨克族     1 母亲从事涉铅职业 母亲从事涉铅职业 父亲从事涉铅职业 2 房屋建造年代距今较近 父亲从事涉铅职业 吃东西前不洗手 3 食用罐头食品饮料 住所周围有涉铅工厂 较少服用钙、锌、铁剂 4 玩具很少清洗 经常咬铅笔 爱吃爆米花 5 父亲从事涉铅职业 食用膨化食品 房屋建造年代距今较近 6 吃东西前不洗手 儿童居室有人吸烟 儿童居室有人吸烟 7 同居住者有从事涉铅职业 父亲使用染发剂 食用膨化食品 8 食用...
甲型肝炎风险预测中Apriori关联规则应用
表 2  不同民族学龄儿童血铅水平前 10 位影响因素 位次 汉族    维吾尔族     哈萨克族     1 母亲从事涉铅职业 母亲从事涉铅职业 父亲从事涉铅职业 2 房屋建造年代距今较近 父亲从事涉铅职业 吃东西前不洗手 3 食用罐头食品饮料 住所周围有涉铅工厂 较少服用钙、锌、铁剂 4 玩具很少清洗 经常咬铅笔 爱吃爆米花 5 父亲从事涉铅职业 食用膨化食品 房屋建造年代距今较近 6 吃东西前不洗手 儿童居室有人吸烟 儿童居室有人吸烟 7 同居住者有从事涉铅职业 父亲使用染发剂 食用膨化食品 8 食用膨化食品 住所有装修 户外活动时间较长 9 洗手时很少用肥皂或洗手液 食用松花蛋 住所有装修 10 住所有装修 房屋内有墙皮/漆皮/涂料脱落 父亲使用染发剂   汉族、维吾尔族、哈萨克族儿童社会经济状况 ( SES) 、饮 食习惯、家庭居住环境、家庭装修情况、不良生活习惯等是儿 童铅中毒的主要影响因素。社会经济状况是反映父母亲职 业、文化程度和家庭经济状况的综合指标 ,研究发现 ,儿童的 血铅水平与 SES 密切相关〔5〕。本次研究尤其是父母的职业 与以往相同。家庭装修及装饰材料的使用对儿童铅中毒影响 较大 ,控制装修材料中铅含量 ,可降低儿童铅中毒。不良卫生 饮食习惯如啃铅笔头、餐前不洗手、玩具不经常清洗 ;食用松 花蛋等含铅食品均可导致体内血铅升高 ,应引起老师家长高 度关注。儿童多食用乳制品和钙锌铁剂 ,少在马路逗留 ,避免 被动吸烟也可以减少铅对机体的损害。通过决策树分析进入 到各民族模型中的影响因素基本相同 ,只是顺位有差异 ,这可 能与民族生活习俗有关。也有一些因素差异 ,例如哈萨克族 母亲的职业史未进入模型 ,这可能与少数民族教育文化背景 以及民族习惯有关。不同民族铅水平的高低是否与这些因素 的不同作用或者不同民族遗传易感性有关 ,有待于进一步研 究。 参考文献 〔1〕 沈晓明 ,郭迪 ,吴圣楣 ,等. 我国儿童铅中毒的现状[J ] . 临床儿科 杂志 ,1996 ,14 (3) :200 - 202. 〔2〕 Pirkle JL ,Brody DJ , Gunter EW ,et al. The decline in blood lead levels in the United States[J ] . JAMA ,1994 ,272 :284 - 291. 〔3〕 颜崇怀 ,沈晓明 ,章依文 ,等. 上海市儿童血铅水平及其影响因素 的流行病学研究[J ] . 中华儿科杂志 ,1998 ,36 :142 - 144. 〔4〕 张帅明 ,戴耀华 ,谢晓桦 ,等. 中国 15 城市儿童血铅水平及影响 因素现况调查[J ] . 中华流行病学杂志 ,2005 ,26 (9) :653. 〔5〕 沈晓明 ,郭迪 ,许积德 ,等. 铅对儿童智力发育的影响 :单因素和 多因素分析[J ] . 实用儿科临床杂志 ,1991 ,6 :271 - 274. 收稿日期 : 2006206217 (郑新编辑 赵淑艳校对) 3 基金项目 : 国家自然科学基金 (70503028)  作者单位 : 11 中国医科大学公共卫生学院流行病学教研室 ,沈阳 110001 ; 21 中国卫生统计编辑部 ; 31 中国医科大学附属第一医院计算机 室 ; 41 中国医科大学基础医学院数学教研室  作者简介 : 关鹏 (1976 - ) ,女 ,满族 ,辽宁沈阳人 ,讲师 ,博士 ,主要从事流行病学方法学研究。  通讯作者 : 黄德生 文章编号 : 100120580 (2007) 0220162202   中图分类号 : R 73011   文献标志码 : A 【论   著】 甲型肝炎风险预测中 Apriori 关联规则应用 3 关鹏1 ,曲波2 ,何苗3 ,黄德生4 ,周宝森1   摘  要 : 目的  进行甲型肝炎疫情风险数据挖掘并形成关联规则。方法  传染病资料来源于辽宁省朝阳市疾病 预防控制中心 ,收集该市 1981~1994 年的甲型肝炎发病率数据。气象资料由该市气象站提供 ,内容包括各年相应的 13 项月气象指标。首先将气象指标和传染病数据离散化为计数资料 ,分别为高、中和低水平 ,将源数据库映射为挖掘 数据库 ;然后设置最小支持度为 011 ,最小置信度为 018 ,利用 Apriori 算法进行关联规则挖掘 ,最后由公共卫生专家解 释及检验所产生的规则。结果  共形成 203 个强关联规则 ,这些强关联规则中蕴含着甲型肝炎发病与季节、气温、气 压、降水量、蒸发量等影响因素之间的关联关系。结论  本方法有利于将抽象的数理统计理论转变为实用的关联规则 来指导疾病预防控制实践 ,具有一定的推广应用价值。 关键词 : 甲型肝炎 ;风险 ;关联规则 ;Apriori Application of apriori association rules to risk prediction of hepatitis A  GUA N Peng , QU Bo , HE Miao , et al . Depart2 ment of Epidemiology , School of Public Health , China Medical U niversity ( S henyang 110001 , China) Abstract : Objective  To detect potential factors which may cause the outbreaks of hepatitis A and estimate their risk and tendency. Methods  The meteorological data and hepatitis A surveillance data were collected. Database for mining were constructed by mapping from source data to spreadsheet format file ,and then the method of apriori algorithm was applied to find all the strong association rules by setting support as 0. 1 and confidence as 0. 8. Results  These obtained associations re2 vealed the relation between risk of infectious disease and influencing factors such as season ,air pressure ,temperature ,precipi2 tation and amount of evaporation. Conclusion  The association rules method is proved to be helpful in decision - making for infectious disease prediction and control. Key words : hepatitis A ;risk ;association rule ;apriori 261 中国公共卫生 2007 年 2 月第 23 卷第 2 期  Chin J Public Health Feb 2007 V ol . 23 No. 2   甲型病毒性肝炎是由甲型肝炎病毒 ( HAV) 引起的一种 肠道传染病 ,甲型肝炎的流行是我国的重要公共卫生问题之 一。国内外研究发现 ,全球气候变化及其引发的生态环境的 改变 ,是传染病发病率上升、流行区域扩大、流行季节延长的 重要原因〔1 ,2〕。研究气象因素与甲型肝炎发病之间的关系 , 对于预测甲型肝炎流行趋势和制定有效的防治措施有重要的 理论价值和实践意义。本研究旨在探索应用关联规则对原始 气象数据和甲型肝炎发病数据进行数据挖掘 ,提取其中潜在 有用的信息和知识 ,为疾病预防控制专业人员决策提供帮助。 1  材料与方法 111  资料来源  甲型肝炎发病资料来源于辽宁省朝阳市疾 病预防控制中心 ,共收集 1981~1994 年的甲型肝炎疫情数据 和其他法定传染病的发病数据。气象资料由该市气象站提 供 ,内容包括各年相应的 13 项月气象指标 ,具体为平均气压、 平均气温、平均降水量和平均蒸发量、日照百分率、无降水日 数、最高地面温度、平均最低地面温度、平均地温、月均最高气 温、月均最低气温、日照时数、最大降水量。按照 25 % ,75 % 分位数将气象资料和传染病月发病率连续性的样本数据离散 为 3 个等级 ,分别为高、中和低水平的计数资料 ,其中每年 12 个月低的比例为 3 :6 :3。指标聚类分析后 ,所收集到的 气象数据归类为 5 种指标 :温度、降水量、蒸发量、日照百分比 和气压 ,数据维度大大减少。按照季节划分为春季 (3~ 5 月) 、夏季 (6~8 月) 、秋季 (9~11 月) 和冬季 (12、1~2 月) ,由 此将源数据库映射成 1 个单独的挖掘数据库。 112  方法   11211  关联规则的定义〔3 ,4〕 公共卫生相关数据库中关联 规则的挖掘定义为 :设 I = {i1 ,i2 , ⋯im}是所有项目的集合 ,即 数据库中的所有字段 ;D 是所有事务的集合 ,即数据库 ;每个 事务 T 是一些项目的集合 , T 包含在 I 中 ,每个事务可以用唯 一标识符 TID 来表示。设 X为某些项目的集合 ,如果 X Α T , 则称事务 T 包含 X ,此关联规则表示为 : ( X < T) X ] ( Y < T) Y ;其中 X < I , Y < I , X ∩Y = <。 11212  关联规则的指标判定  通过支持度和置信度 2 个阈 值来进行关联规则的判定 ,因为支持度反映关联规则在数据 库中的重要性 ,置信度用于衡量关联规则的置信程度。如果 某条规则同时满足最小支持度和最小置信度则称其为强关联 规则。 11213  关联规则的实现  关联规则的实现通过统计软件 R (Version 2121 ,Vienna ,Austria)来完成 ,软件 R 采用 Apriori 算 法 ,根据预先设定的最小支持度和置信度产生规则。主要确 定最小支持度和最小置信度这 2 个参数来产生规则的项集最 大数目 ,此处设定最小支持度为 0110 ,最小置信度为 018。输 出结果中包含满足要求的所有规则以及每条规则的支持度、 置信度、作用度 (置信度与期望置信度的比值) 。 2  结  果 甲型肝炎发病与气象因素和其他传染病发病的关系 (表 1)  设置支持度为 0110 ,置信度为 018 后 ,共形成 203 个强关 联规则 ,并创建交易树。研究结果表明 ,朝阳市甲型肝炎以秋 季高发 ,此时平均气压低 ,气温中等 ,该时期流行性脑脊髓膜 炎低发 ,而斑疹伤寒则与甲型肝炎具有同时高发的特点。 表 1  Apriori 算法所形成的关联规则 编号 形成的规则    支持度 置信度 作用度 1 〔流行性脑脊髓膜炎 =低 ,斑疹伤寒 =高〕= >〔甲型肝炎 =高〕 0111 0185 3140 2 〔季节 =秋季 ,流行性出血热 =高〕= >〔甲型肝炎 =高〕 0113 0187 3148 3 〔季节 =秋季 ,斑疹伤寒 =高〕= >〔甲型肝炎 =高〕 0116 0181 3123 4 〔平均气温 =中 ,斑疹伤寒 =高〕= >〔甲型肝炎 =高〕 0116 0181 3123 5 〔平均最低地面温度 =中 ,斑疹伤寒 =高〕= >〔甲型肝炎 =高〕 0116 0181 3123 6 〔平均地温 =中 ,斑疹伤寒 =高〕= >〔甲型肝炎 =高〕 0116 0181 3123 7 〔月均最高气温 =中 ,斑疹伤寒 =高〕= >〔甲型肝炎 =高〕 0116 0181 3123 8 〔月均最低气温 =中 ,斑疹伤寒 =高〕= >〔甲型肝炎 =高〕 0116 0181 3123 9 〔细菌性痢疾 =中 ,斑疹伤寒 =高〕= >〔甲型肝炎 =高〕 0112 0183 3130 10 〔百日咳 =高 ,猩红热 =中〕= >〔甲型肝炎 =中〕 0110 0180 1160 ⋯ ⋯ ⋯ ⋯ ⋯ 203 〔平均地面温度 =中 ,斑疹伤寒 =高〕= >〔甲型肝炎 =高〕 0116 0181 3120 3  讨  论 本研究发现 ,当地甲型肝炎在秋季平均气压低 ,气温中等 的情况下高发 ,该时期流行性脑脊髓膜炎低发 ,而斑疹伤寒则 与甲型肝炎具有同时高发的特点。 通过上述实例可见 ,关联规则挖掘能够带给我们一些有 用的信息 ,而这些信息用传统的数据分析方法很难发现。本 研究采用的关联规则用于数据挖掘具有很多优点 : (1)它可以 产生清晰有用的结果 ; (2)它支持间接数据挖掘 ; (3)可以处理 变长的数据 ; (4)它的计算的消耗量是可以预见的。和其他领 域不同的是 ,其他领域不要求弄懂隐含其中的规则的确切含 义 ,只需要获得最大利益就行 ,而公共卫生管理与疾病控制领 域内的预测存在这样几个问题 : (1)模型的合理性应该在一个 时间和地点相对独立的其他样本上进行检验。(2) 模型收集 资料尽量全面 ,应该注意数据的质量。(3) 模型应该是透明 的 ,这样才能方便管理者进行决策。(4)数据挖掘一般是建立 在相同的训练集和检验集基础之上 ,模型独立检验条件一般 不满足。(5)得到的关联规则不被当前医学知识所普遍接受 时如何处理。此时可以使用假设检验的思想 ,包括专家知识 来检验规则的正确性。 传染病发病是一个很复杂的行为 ,除了季节、气象因素之 外 ,还受到其他很多因素的制约与影响。1994 年以来辽宁省 内各市甲肝疫苗接种量逐年增加 ,1994 年全省接种约 10 万 人份 ,1996 年接种约 30~50 万人份〔5〕。因此 ,本研究选用 1994 年以前的数据 ,以消除预防接种所带来的影响。今后我 们将收集更加全面而丰富的数据进行关联规则分析 ,以期能 够更好地为公共卫生决策服务。 (特别感谢辽宁省朝阳市疾病预防控制中心和朝阳市气象站对本 项目的大力支持和配合) 参考文献 〔1〕 Staropoli J F. The public health implications of global warming[J ] . JAMA ,2002 ,287 (17) :2282. 〔2〕 Patz JA , Kovats RS. Hotspots in climate change and human health [J ] . BMJ ,2002 ,325 (7372) :1094 - 1098. 〔3〕 潘福铮. 数据挖掘中的关联规则 [J ] . 湖北大学学报 :自然科学 版 ,2002 ,24 (4) :304 - 308. 〔4〕 胡吉明 ,鲜学丰. 挖掘关联规则中 Apriori 算法的研究与改进 [J ] . 计算机技术与发展 ,2006 ,16 (4) :99 - 101 ,104. 〔5〕 谢强 ,刘敏. 辽宁省病毒性肝炎的流行病学分析[J ] . 中国公共卫 生 ,1997 ,13 (11) :661 - 662. 收稿日期 : 2006207228 (文涛编辑 赵淑艳校对) 361中国公共卫生 2007 年 2 月第 23 卷第 2 期  Chin J Public Health Feb 2007 V ol . 23 No. 2
/
本文档为【甲型肝炎风险预测中Apriori关联规则应用】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索