用Excel实现模糊聚类分析
安徽农业科学,Journal of Anhui Agn.Sci.2005,33(4):740—742 责任编辑 朱永和 责任校对 朱永和
用 Excel实现模糊聚类分析
许永安,徐恒玉 (周口职业技术学院,河南周口466001)
摘要 简述 了模 糊聚类分析的基本原理和 主要 步骤 ,通过一个具体 实例说 明 了用 Exce1进行模糊聚 类分析 的方法。
关键 词 Excel;聚类分析 ;模糊 聚类分析
中图分类号 TP317.3 文献标识码 A 文章编号 0517—661 1(2005)04—0740—03...
安徽农业科学,Journal of Anhui Agn.Sci.2005,33(4):740—742 责任编辑 朱永和 责任校对 朱永和
用 Excel实现模糊聚类分析
许永安,徐恒玉 (周口职业技术学院,河南周口466001)
摘要 简述 了模 糊聚类分析的基本原理和 主要 步骤 ,通过一个具体 实例说 明 了用 Exce1进行模糊聚 类分析 的方法。
关键 词 Excel;聚类分析 ;模糊 聚类分析
中图分类号 TP317.3 文献标识码 A 文章编号 0517—661 1(2005)04—0740—03
Fuzzy Cluster Analysis with Excel
XU Yong-an et al (Zhoukou Vocational and Technical College,Zhoukou,Henan 466001)
Abstract The basisc concept and key step were introduced,the method of fuzzy c I uster analysis with Excel was showed with an example from a
previous study.
Keywords Excel;Cluster analysis;Fuzzy cluster analysis
模糊聚类分析是多元数据分析引进到分类中的模糊数
学方法 ,广泛应用在各种事物或现象的分类上,其分析过程
通常借助于专业分析软件。Excel是 Microsoft公司的一个电
子
格软件 ,应用普遍。用 Excel进行模糊聚类分析 ,人工
输入数据的工作量很少,方法简便 ,结果准确度高。
1 模糊聚 类分析的基本原理和 主要步骤
聚类分析的基本思想是用相似性尺度来衡量事物之间
的亲疏程度,并以此来实现分类。模糊聚类分析的实质就是
根据研究对象本身的属性来构造模糊矩阵。在此基础上根
据一定的隶属度来确定其分类关系lll。
1.1 确定分类对象及样本数据标准化 设有 n个待分类
样品,每一个样品由m个样品指标来表征 ,则数据矩阵可表
示 为:
由于 m个指标的量纲和数量级都不同.直接利用原始
数据进行计算 .就可能突出某些数量级特别大的特性指标
对分类的作用,而降低甚至排斥某些数量级较小的特性的
作用。导致一个指标只要改变一下单位 ,也会改变分类结
果。所以,必须对原始数据进行无量纲化处理,使每一指标
值统一于某种共同的数据特性范围。样本数据标准化的方
法很多,如标准差规格化法 、极大值规格化法、极差规格化
法、均值规格化法等 。本例采用标准差法,其模型是 :
式中:互 ,为第 个指标的平均值,Js,为第 个指标的标准差 ,
i=1,2,⋯ ,n√=1,2,⋯ ,m。
1.2 建立模糊相似 关系 相似 关系 R是衡量样本 间相似
程度的一种模糊度量方法 ,它是一个模糊相似矩阵。
作者简介 许 永安(1963一),男,河南商水人 ,高级讲师。从事生物统计
和遗传育种教学和科研工作。
收稿日期 2o0l5.叭.17
确定 r 值的方法很多,可参见文献[2】[3】。本例采用欧氏距离
法.其数学模型为:
厂 ——一 — —
1一c、/∑( :
- k=l
式中:c为可使 0≤ ≤1的一个常数,i,j--i,2,⋯,n。
1.3 求取模糊等价矩阵 一般情形下,模糊相似关系矩阵
仅满足 自反性与对称性 。然而要聚类 R必须是模糊等价关
系才行 ,即要满足传递性 。为此需要对 R进行改造。改造的
方法是将 R自乘 :
RoR=R R20R=尺 ,⋯
如此下去 。直至某一步出现 R 尺 ,R 则便是一个模糊
等价关系 t(R)。
1.4 聚类分析 得到模糊等价关系 t(R)后 ,可在适当水平
上截取 t(R),将模糊等价关系中大于值 的元素归为一类。
2 模糊 聚 类分 析 的 Excel实 现
为 J,具体说明模糊聚类分析的 Excel实现方法,笔者以
刘维信等人对不结球白菜品种资源进行的研究为例 ,选取
前 10个品种的观察数据进行分析。把每个品种的7个性状
观测值填入 Excel工作表 A1:G10工作区(表 1)。
表 1 10个品种的 7个性状观测值
F G
2.1 对样本 数据标准化 处理
2.1.1 计算各性状(列)的均值和标准差。均值和标准差分
别用 AVERAGE()和 STDEV()函数求得。选取 All单元格 ,
输入公式=AVERAGE(A1:A14),得到第 1列数据的均值,然
后在 A11:GI1应用数据填充求得其他各列均值。
选取 A12单元格 ,输入公式=STDEV(A1:A14),得到第
1列数据的标准差,其他各列用数据填充求得。结果如表 2。
2.1.2 取得标准化数据矩阵。选取 A21单元格,输入公式
= (A1一AS10)/AS1l,得到 然后在 A21:G30区域应用数据
填充.结果如表 3。
5 3 3 8 3 5 躬舛" %B
5 5 7 5 6 3 6 5
7 7 6 7 O O 5 8 4 7 ”
3 4 2 6 6 4
E 一8 3 2 8 7 7 8 9 8 0
—2 3 7 3 5 9 3 4 5
【 2 4 5 8 4 9 4 7 6 3
:
一3 9 8 3 9 8 7 一M" m"4 加 ¨
7 4 5 4 3 8 9 9 一 如弘 如 儿
5 2 3 8 4 9 6 加 勰
l 2 3 4 5 6 7 8 9 0
一 一 一
II
R
维普资讯 http://www.cqvip.com
2.2 求取模糊相似矩阵
厂 ————一
2.2.1 计算西=\/∑ z。选取A31单元格,输入公 T k
= 1
式=SQRT((A$21-A21)^2+(B$21-B21)^2+(C$21-C21)^2+(D$21-
D21) 2+(E$21-E21) 2+(F$21-F21) 2+(G$21-G21) 2),求得dl2。
选取 B3 1单元格 ,输入公式:SQRT((A$22一A21) 2+(B
$22-B21f2+(C$22-C21) 2+(D$22-D21) 2+(E$22-E21) 2+(F
表 4
$22-F21) 2+(G$22-G21) 2),求得 dl2。
如 此在 C31、D31、E31、F31、G31、H31、I31、J31分 别输
入公式 ,求出d值。
然后分别在 A3l:A40、B3l:B40、J3l:J40各区域应用数
据填充 ,求得 d值矩阵(A31:J40)。
2.2.2 建立模糊相似矩阵。令 C为 d值矩阵中元素的最大
值,即 MAX($A$31:$J$40),则 d值矩阵可转换 为模糊相似
模糊相似矩阵 R
0.683 6
83
0.683 6
83
0.46l 6
36
O.521 O
84
0.460 5
46
0.730 3
0l
0.722 3
51
0.722 3
5l
0.730 3
Ol
O.8Ol l
07
0.46l 6
36
O.52l O
84
0.460 5
46
0.683 6
83
0.683 6
83
0.683 6
83
0.683 6
83
0.801 l
O7
1
0.46l 6
36
O.521 O
84
0.460 5
46
0.683 6
83
0.683 6
83
0.683 6
83
0.683 6
83
3
3
0.461 6
36
0.460 5
46
0.46l 6
36
0.46l 6
36
0.46l 6
36
0.46l 6
36
0.460 5
46
0.460 5
46
0.460 5
46
0.460 5
46
0.460 5 1
46
O.52l 0 0.460 5
84 46
0.52l 0 0.460 5
84 46
0.52l 0 0.460 5
84 46
0.52l 0 0.460 5
84 46
0.683 6
83
0.683 6
83
0.46l 6
36
O.521 O
84
0.460 5
46
l
0.722 3
5l
0.722 3
5l
0.763 9
66
0.683 6
83
0.683 6
83
0.46l 6
36
O.52l O
84
0.460 5
46
0.722 3
5l
l
0.849 7
55
0.722 3
51
0.683 6
83
0、683 6
83
0.46l 6
36
O.52l O
84
0.460 5
46
0.722 3
5l
0.849 7
55
l
0.722 3
51
0.683 6
83
0.683 6
83
0.46l 6
36
O.52l O
84
0.460 5
46
0.763 9
66
0.722 3
5l
0.722 3
5l
O O 6
2 2 6
5 5 4
O 4 O 4 O 6
8 8 3
6 6
l l 6 6
4 4
O 6 O 6 ●
2 3 4 5 6 7 8 9 “
维普资讯 http://www.cqvip.com
742 安徽农业科学 2005血
矩 阵 R。方 法是 :选取 A41单 元格 ,输入 公式=1-A31/MAX
f$A$31:$J$40),求得 rll,然后在 A41:J50区域中应用数据填
充得到模糊相似矩阵 R(表 4)。
2.3 求取模糊等价矩阵 为操作方便 ,把上述模糊相似矩
阵R复制到一新的工作表的 A1:J10区域。在单元格 A12
中输入公式:MAX(MIN($A1,AS1),MIN($B1,A$2),MIN($C1,A
$31,MIN($D1,A$4),MIN($E1,A$5),MIN($F1,A$6),MIN($G1,A
$71,MIN($H1,A$8),MIN($I1,A$9),MIN($J1,A$10))
然后在 A12:J21区域应用数据填充,得到 R 。重复执行
“复制”、“输入”和“填充”,即可得到 R 、R 、R 、⋯ ,直到出
现 Rk=R 。本例 k为 4时,R :R ,R 则便是一个模糊等价
关 系 t(R)(表 5)。
2.4 取不同的 值进行聚类 在模糊等价矩阵 t(R)中,求
取不同的 A(0≤ ≤1)水平的截距阵。例如当 k=0.7时 ,在
A11单元格中输入公式=IF(A1>=0.7,1,0),然后在区域 A11:
J20应用数据填充,即得 =0.7水平下的截距阵(表 6)。
从 表 6可 得 :当 =0.7时 ,白菜 品种 可分 为 5类{1,7,
8,9,10}、{2,3}、{4}、{5}、{6}。
表 6 模糊等价矩阵t(R)的截距阵 (X---0.7)
参考文献
l 谢季坚.刘承平.模糊数学方法及其应用『M1.武汉:毕中科技大
学 出版社 。2001.
2 庄恒扬.沈新平.陆建飞,等.模糊聚类计算方法的理论分析【JJ_
江苏农学院学报.1998,19(3):37—41.
3 王新 l’舒海翅.模糊相似矩阵的构造⋯.吉首大学学报(自然科
学版 ),2003,24(3):37—41.
4 刘维信 ,申玉梅,丁世飞,等.不结球 白菜品种资源的模糊聚类
分析⋯.山东农业大学学报,1998,29(3):289—293.
(上接 第 731页)
机.下一步应引进热带 、亚热带种质来提高抗病 、抗虫能力 ,
扩大适应范围。现在 ,国内引进的热带种质资源中抗病 、抗
虫
并不少.但还没能在这些材料中选 出综合性状好的
高产材料。山东农科院玉米研究所对该所扩增保存的热带
资源做了较多的利用评估 ,证明能被利用的可占 10%以上。
这些资源多来源于围际玉米小麦改良中心 (CIMMYT)。国
外用热带种质对温带种质的有目标的杂交、重组和渗透的改良
方法。也应同样适用于中国,尤其可为华北玉米区所借鉴。
在改良方法上 .顶交 、回交等传统手段仍是主要方法。
山东农科院玉米研究所近几年这方面的工作取得了一些成
效 。 目前 .对通过改造选育 出的改 良 自交 系进行组 配 ,已初
选出一些有希望的组合。这些组合普遍的优点是营养生长
强盛 、抗病 、抗虫、秸秆坚韧、根系发达 、抗倒,籽粒产量已与
推广品种持平或高出;共性的缺点是植株过于高大,超出推
广品种常规可接受的高度。相信经过进一步的改造,将会有
更加理想的材料和杂交组合出现。
参考文献
l 王懿波,王报华,王永普,等.中国玉米丰 种质杂 『尤势利用
模式研究⋯.中国农业科学,1997,30(4):l6—24.
2 张世煌.玉米育种研究的发展方向⋯ 乍物杂志,1997,(5):5—8.
3 张世煌.玉米育种 目标的诱导创新因素【J1_玉米科学,2000,8(3):
3—7.
4 番兴明 ,谭静 ,杨峻芸.热带 、亚热带外爿∈玉米种质利用【J1.西南
农业学报 ,2000,l3(1):107一ll1.
5 刘治先.玉米育种新技术⋯.玉米科学,1995,3(4):12一l5.
6 安学丽,蔡一林.玉米种质资源贫乏的原凼与对策⋯.玉米科学,
2003,ll(增刊 ):39—41.
7 王侠礼,崔良国.突破玉米“种质瓶颈 ,加快新优势群开发⋯.
中国种业。2003,98(5):24—25.
(上接 第 739页)
手全程多功能化 ,然后再服务 于农 业全程机械化 。
2.3.3 应用型向开发型转变。随着农机具科技含量的提高,
新工艺 、新技 能 的运 用和 发展 ,农 机手不 能仅停 留在会开 、
能修的浅层次上。因此,对于爱钻研的农机手,企业要尽可
能创造工作条件。当农机手的技术革新得到支持和鼓励时,
便会有更多的改进 、发明和创造。这种激励是对人的社会价
值和工作价值双重承认 ,能起到由点带面的激励作用。
3 对后勤 队伍的管理
后勤保障主要是农机具的修配和企业日常运转的后勤
服务。多年来,一直有一个认识误区,认为后勤保障相对清
闲,工作量不大,重要性不明显,是附属行业。所以建立客观
评价体系势在必行。
3.1 正确判断后勤人员工作量大小 后勤人员T作时间
长短,工作量的大小不能草率定性 ,因为,农机保养工作量
与农机手的技能和后勤人员的保养水平有关。有的农机作
业企业农机具状况较好 ,机手技能高 ,保养到位,农机具故
障低,后勤保障往往出现等车来修,后勤人员田间巡诊无活
可干,达到良性循环。因此。应对相同性能指标的农机具修
复后。保持完好性的周期长短进行 比较。功能全面的后勤保
障队伍在市场配件无法正常供应的时候,他们会通过机械
加工 。修配出替代品,不误农活 :而一般的后勤服务只有等
米下锅。所以保障有力,服务及时,修理省时高质量,修复后
使用周期长.二次故障率低等是一支良好的后勤队伍的必
备素质。
3.2 客观 评 价配 件供 应 配件 供应 是后 勤 的另 一项 重要
T作 内容。有的人能把不同的农机具 ,不同的作业内容,易
损易耗件说得清楚明白;有的人连螺帽大小都无法确认。前
者提供配件准确及时。后者拿着修理T提供的配件单忙了
半天 ,还是张冠李戴 ,不仅影响修理时间 ,也容易造成农机
具二次故障。遇到需要配件互代 ,内行很快就能找到,事半
功倍:外行只好翻书找资料打电话 ,结果是事倍功半。
人的管理 是系统和动态 的 。我 们不能 片面 和静 止地看
问题 ,只有综合评价,客观分析研究,充分发挥企业 内各层
次人员的主动性和能动性。才会真正发挥团体协作 ,优化高
效,真正实现小农机服务大农业。
维普资讯 http://www.cqvip.com
本文档为【用Excel实现模糊聚类分析】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑,
图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。