为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

用Excel实现模糊聚类分析

2012-01-13 3页 pdf 151KB 258阅读

用户头像

is_684141

暂无简介

举报
用Excel实现模糊聚类分析 安徽农业科学,Journal of Anhui Agn.Sci.2005,33(4):740—742 责任编辑 朱永和 责任校对 朱永和 用 Excel实现模糊聚类分析 许永安,徐恒玉 (周口职业技术学院,河南周口466001) 摘要 简述 了模 糊聚类分析的基本原理和 主要 步骤 ,通过一个具体 实例说 明 了用 Exce1进行模糊聚 类分析 的方法。 关键 词 Excel;聚类分析 ;模糊 聚类分析 中图分类号 TP317.3 文献标识码 A 文章编号 0517—661 1(2005)04—0740—03...
用Excel实现模糊聚类分析
安徽农业科学,Journal of Anhui Agn.Sci.2005,33(4):740—742 责任编辑 朱永和 责任校对 朱永和 用 Excel实现模糊聚类分析 许永安,徐恒玉 (周口职业技术学院,河南周口466001) 摘要 简述 了模 糊聚类分析的基本原理和 主要 步骤 ,通过一个具体 实例说 明 了用 Exce1进行模糊聚 类分析 的方法。 关键 词 Excel;聚类分析 ;模糊 聚类分析 中图分类号 TP317.3 文献标识码 A 文章编号 0517—661 1(2005)04—0740—03 Fuzzy Cluster Analysis with Excel XU Yong-an et al (Zhoukou Vocational and Technical College,Zhoukou,Henan 466001) Abstract The basisc concept and key step were introduced,the method of fuzzy c I uster analysis with Excel was showed with an example from a previous study. Keywords Excel;Cluster analysis;Fuzzy cluster analysis 模糊聚类分析是多元数据分析引进到分类中的模糊数 学方法 ,广泛应用在各种事物或现象的分类上,其分析过程 通常借助于专业分析软件。Excel是 Microsoft公司的一个电 子格软件 ,应用普遍。用 Excel进行模糊聚类分析 ,人工 输入数据的工作量很少,方法简便 ,结果准确度高。 1 模糊聚 类分析的基本原理和 主要步骤 聚类分析的基本思想是用相似性尺度来衡量事物之间 的亲疏程度,并以此来实现分类。模糊聚类分析的实质就是 根据研究对象本身的属性来构造模糊矩阵。在此基础上根 据一定的隶属度来确定其分类关系lll。 1.1 确定分类对象及样本数据标准化 设有 n个待分类 样品,每一个样品由m个样品指标来表征 ,则数据矩阵可表 示 为: 由于 m个指标的量纲和数量级都不同.直接利用原始 数据进行计算 .就可能突出某些数量级特别大的特性指标 对分类的作用,而降低甚至排斥某些数量级较小的特性的 作用。导致一个指标只要改变一下单位 ,也会改变分类结 果。所以,必须对原始数据进行无量纲化处理,使每一指标 值统一于某种共同的数据特性范围。样本数据标准化的方 法很多,如标准差规格化法 、极大值规格化法、极差规格化 法、均值规格化法等 。本例采用标准差法,其模型是 : 式中:互 ,为第 个指标的平均值,Js,为第 个指标的标准差 , i=1,2,⋯ ,n√=1,2,⋯ ,m。 1.2 建立模糊相似 关系 相似 关系 R是衡量样本 间相似 程度的一种模糊度量方法 ,它是一个模糊相似矩阵。 作者简介 许 永安(1963一),男,河南商水人 ,高级讲师。从事生物统计 和遗传育种教学和科研工作。 收稿日期 2o0l5.叭.17 确定 r 值的方法很多,可参见文献[2】[3】。本例采用欧氏距离 法.其数学模型为: 厂 ——一 — — 1一c、/∑( : - k=l 式中:c为可使 0≤ ≤1的一个常数,i,j--i,2,⋯,n。 1.3 求取模糊等价矩阵 一般情形下,模糊相似关系矩阵 仅满足 自反性与对称性 。然而要聚类 R必须是模糊等价关 系才行 ,即要满足传递性 。为此需要对 R进行改造。改造的 方法是将 R自乘 : RoR=R R20R=尺 ,⋯ 如此下去 。直至某一步出现 R 尺 ,R 则便是一个模糊 等价关系 t(R)。 1.4 聚类分析 得到模糊等价关系 t(R)后 ,可在适当水平 上截取 t(R),将模糊等价关系中大于值 的元素归为一类。 2 模糊 聚 类分 析 的 Excel实 现 为 J,具体说明模糊聚类分析的 Excel实现方法,笔者以 刘维信等人对不结球白菜品种资源进行的研究为例 ,选取 前 10个品种的观察数据进行分析。把每个品种的7个性状 观测值填入 Excel工作表 A1:G10工作区(表 1)。 表 1 10个品种的 7个性状观测值 F G 2.1 对样本 数据标准化 处理 2.1.1 计算各性状(列)的均值和标准差。均值和标准差分 别用 AVERAGE()和 STDEV()函数求得。选取 All单元格 , 输入公式=AVERAGE(A1:A14),得到第 1列数据的均值,然 后在 A11:GI1应用数据填充求得其他各列均值。 选取 A12单元格 ,输入公式=STDEV(A1:A14),得到第 1列数据的标准差,其他各列用数据填充求得。结果如表 2。 2.1.2 取得标准化数据矩阵。选取 A21单元格,输入公式 = (A1一AS10)/AS1l,得到 然后在 A21:G30区域应用数据 填充.结果如表 3。 5 3 3 8 3 5 躬舛" %B 5 5 7 5 6 3 6 5 7 7 6 7 O O 5 8 4 7 ” 3 4 2 6 6 4 E 一8 3 2 8 7 7 8 9 8 0 —2 3 7 3 5 9 3 4 5 【 2 4 5 8 4 9 4 7 6 3 : 一3 9 8 3 9 8 7 一M" m"4 加 ¨ 7 4 5 4 3 8 9 9 一 如弘 如 儿 5 2 3 8 4 9 6 加 勰 l 2 3 4 5 6 7 8 9 0 一 一 一 II R 维普资讯 http://www.cqvip.com 2.2 求取模糊相似矩阵 厂 ————一 2.2.1 计算西=\/∑ z。选取A31单元格,输入公 T k = 1 式=SQRT((A$21-A21)^2+(B$21-B21)^2+(C$21-C21)^2+(D$21- D21) 2+(E$21-E21) 2+(F$21-F21) 2+(G$21-G21) 2),求得dl2。 选取 B3 1单元格 ,输入公式:SQRT((A$22一A21) 2+(B $22-B21f2+(C$22-C21) 2+(D$22-D21) 2+(E$22-E21) 2+(F 表 4 $22-F21) 2+(G$22-G21) 2),求得 dl2。 如 此在 C31、D31、E31、F31、G31、H31、I31、J31分 别输 入公式 ,求出d值。 然后分别在 A3l:A40、B3l:B40、J3l:J40各区域应用数 据填充 ,求得 d值矩阵(A31:J40)。 2.2.2 建立模糊相似矩阵。令 C为 d值矩阵中元素的最大 值,即 MAX($A$31:$J$40),则 d值矩阵可转换 为模糊相似 模糊相似矩阵 R 0.683 6 83 0.683 6 83 0.46l 6 36 O.521 O 84 0.460 5 46 0.730 3 0l 0.722 3 51 0.722 3 5l 0.730 3 Ol O.8Ol l 07 0.46l 6 36 O.52l O 84 0.460 5 46 0.683 6 83 0.683 6 83 0.683 6 83 0.683 6 83 0.801 l O7 1 0.46l 6 36 O.521 O 84 0.460 5 46 0.683 6 83 0.683 6 83 0.683 6 83 0.683 6 83 3 3 0.461 6 36 0.460 5 46 0.46l 6 36 0.46l 6 36 0.46l 6 36 0.46l 6 36 0.460 5 46 0.460 5 46 0.460 5 46 0.460 5 46 0.460 5 1 46 O.52l 0 0.460 5 84 46 0.52l 0 0.460 5 84 46 0.52l 0 0.460 5 84 46 0.52l 0 0.460 5 84 46 0.683 6 83 0.683 6 83 0.46l 6 36 O.521 O 84 0.460 5 46 l 0.722 3 5l 0.722 3 5l 0.763 9 66 0.683 6 83 0.683 6 83 0.46l 6 36 O.52l O 84 0.460 5 46 0.722 3 5l l 0.849 7 55 0.722 3 51 0.683 6 83 0、683 6 83 0.46l 6 36 O.52l O 84 0.460 5 46 0.722 3 5l 0.849 7 55 l 0.722 3 51 0.683 6 83 0.683 6 83 0.46l 6 36 O.52l O 84 0.460 5 46 0.763 9 66 0.722 3 5l 0.722 3 5l O O 6 2 2 6 5 5 4 O 4 O 4 O 6 8 8 3 6 6 l l 6 6 4 4 O 6 O 6 ● 2 3 4 5 6 7 8 9 “ 维普资讯 http://www.cqvip.com 742 安徽农业科学 2005血 矩 阵 R。方 法是 :选取 A41单 元格 ,输入 公式=1-A31/MAX f$A$31:$J$40),求得 rll,然后在 A41:J50区域中应用数据填 充得到模糊相似矩阵 R(表 4)。 2.3 求取模糊等价矩阵 为操作方便 ,把上述模糊相似矩 阵R复制到一新的工作表的 A1:J10区域。在单元格 A12 中输入公式:MAX(MIN($A1,AS1),MIN($B1,A$2),MIN($C1,A $31,MIN($D1,A$4),MIN($E1,A$5),MIN($F1,A$6),MIN($G1,A $71,MIN($H1,A$8),MIN($I1,A$9),MIN($J1,A$10)) 然后在 A12:J21区域应用数据填充,得到 R 。重复执行 “复制”、“输入”和“填充”,即可得到 R 、R 、R 、⋯ ,直到出 现 Rk=R 。本例 k为 4时,R :R ,R 则便是一个模糊等价 关 系 t(R)(表 5)。 2.4 取不同的 值进行聚类 在模糊等价矩阵 t(R)中,求 取不同的 A(0≤ ≤1)水平的截距阵。例如当 k=0.7时 ,在 A11单元格中输入公式=IF(A1>=0.7,1,0),然后在区域 A11: J20应用数据填充,即得 =0.7水平下的截距阵(表 6)。 从 表 6可 得 :当 =0.7时 ,白菜 品种 可分 为 5类{1,7, 8,9,10}、{2,3}、{4}、{5}、{6}。 表 6 模糊等价矩阵t(R)的截距阵 (X---0.7) 参考文献 l 谢季坚.刘承平.模糊数学方法及其应用『M1.武汉:毕中科技大 学 出版社 。2001. 2 庄恒扬.沈新平.陆建飞,等.模糊聚类计算方法的理论分析【JJ_ 江苏农学院学报.1998,19(3):37—41. 3 王新 l’舒海翅.模糊相似矩阵的构造⋯.吉首大学学报(自然科 学版 ),2003,24(3):37—41. 4 刘维信 ,申玉梅,丁世飞,等.不结球 白菜品种资源的模糊聚类 分析⋯.山东农业大学学报,1998,29(3):289—293. (上接 第 731页) 机.下一步应引进热带 、亚热带种质来提高抗病 、抗虫能力 , 扩大适应范围。现在 ,国内引进的热带种质资源中抗病 、抗 虫并不少.但还没能在这些材料中选 出综合性状好的 高产材料。山东农科院玉米研究所对该所扩增保存的热带 资源做了较多的利用评估 ,证明能被利用的可占 10%以上。 这些资源多来源于围际玉米小麦改良中心 (CIMMYT)。国 外用热带种质对温带种质的有目标的杂交、重组和渗透的改良 方法。也应同样适用于中国,尤其可为华北玉米区所借鉴。 在改良方法上 .顶交 、回交等传统手段仍是主要方法。 山东农科院玉米研究所近几年这方面的工作取得了一些成 效 。 目前 .对通过改造选育 出的改 良 自交 系进行组 配 ,已初 选出一些有希望的组合。这些组合普遍的优点是营养生长 强盛 、抗病 、抗虫、秸秆坚韧、根系发达 、抗倒,籽粒产量已与 推广品种持平或高出;共性的缺点是植株过于高大,超出推 广品种常规可接受的高度。相信经过进一步的改造,将会有 更加理想的材料和杂交组合出现。 参考文献 l 王懿波,王报华,王永普,等.中国玉米丰 种质杂 『尤势利用 模式研究⋯.中国农业科学,1997,30(4):l6—24. 2 张世煌.玉米育种研究的发展方向⋯ 乍物杂志,1997,(5):5—8. 3 张世煌.玉米育种 目标的诱导创新因素【J1_玉米科学,2000,8(3): 3—7. 4 番兴明 ,谭静 ,杨峻芸.热带 、亚热带外爿∈玉米种质利用【J1.西南 农业学报 ,2000,l3(1):107一ll1. 5 刘治先.玉米育种新技术⋯.玉米科学,1995,3(4):12一l5. 6 安学丽,蔡一林.玉米种质资源贫乏的原凼与对策⋯.玉米科学, 2003,ll(增刊 ):39—41. 7 王侠礼,崔良国.突破玉米“种质瓶颈 ,加快新优势群开发⋯. 中国种业。2003,98(5):24—25. (上接 第 739页) 手全程多功能化 ,然后再服务 于农 业全程机械化 。 2.3.3 应用型向开发型转变。随着农机具科技含量的提高, 新工艺 、新技 能 的运 用和 发展 ,农 机手不 能仅停 留在会开 、 能修的浅层次上。因此,对于爱钻研的农机手,企业要尽可 能创造工作条件。当农机手的技术革新得到支持和鼓励时, 便会有更多的改进 、发明和创造。这种激励是对人的社会价 值和工作价值双重承认 ,能起到由点带面的激励作用。 3 对后勤 队伍的管理 后勤保障主要是农机具的修配和企业日常运转的后勤 服务。多年来,一直有一个认识误区,认为后勤保障相对清 闲,工作量不大,重要性不明显,是附属行业。所以建立客观 评价体系势在必行。 3.1 正确判断后勤人员工作量大小 后勤人员T作时间 长短,工作量的大小不能草率定性 ,因为,农机保养工作量 与农机手的技能和后勤人员的保养水平有关。有的农机作 业企业农机具状况较好 ,机手技能高 ,保养到位,农机具故 障低,后勤保障往往出现等车来修,后勤人员田间巡诊无活 可干,达到良性循环。因此。应对相同性能指标的农机具修 复后。保持完好性的周期长短进行 比较。功能全面的后勤保 障队伍在市场配件无法正常供应的时候,他们会通过机械 加工 。修配出替代品,不误农活 :而一般的后勤服务只有等 米下锅。所以保障有力,服务及时,修理省时高质量,修复后 使用周期长.二次故障率低等是一支良好的后勤队伍的必 备素质。 3.2 客观 评 价配 件供 应 配件 供应 是后 勤 的另 一项 重要 T作 内容。有的人能把不同的农机具 ,不同的作业内容,易 损易耗件说得清楚明白;有的人连螺帽大小都无法确认。前 者提供配件准确及时。后者拿着修理T提供的配件单忙了 半天 ,还是张冠李戴 ,不仅影响修理时间 ,也容易造成农机 具二次故障。遇到需要配件互代 ,内行很快就能找到,事半 功倍:外行只好翻书找资料打电话 ,结果是事倍功半。 人的管理 是系统和动态 的 。我 们不能 片面 和静 止地看 问题 ,只有综合评价,客观分析研究,充分发挥企业 内各层 次人员的主动性和能动性。才会真正发挥团体协作 ,优化高 效,真正实现小农机服务大农业。 维普资讯 http://www.cqvip.com
/
本文档为【用Excel实现模糊聚类分析】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索