为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 智能检测理论与技术

智能检测理论与技术

2020-03-22 65页 ppt 5MB 9阅读

用户头像 个人认证

不系舟红枫

从教近30年,经验丰富,教学水平较高

举报
智能检测理论与技术第四章内容回顾一、状态估计和辨识概述二、基于状态估计的智能检测三、基于参数辨识的智能检测第五章基于模式识别的智能检测 模式识别 随机事件是普遍存在的,在对这种事件的研究过程中常把被观察的对象称为样本。 每个样本可能会有很多个观察数据,这些观察数据的综合便称为模式。 获得观察数据的过程称为模式采集,所有样本的观察数据的集合构成模式空间。 模式空间的维数由观测过程中所选择的观察变量的个数所决定。第五章基于模式识别的智能检测 模式识别 被选择的观察变量可能有多个,常选择其中最能揭示样本本质属性的若干观察量作为主要特征,从而构成观察样...
智能检测理论与技术
第四章回顾一、状态估计和辨识概述二、基于状态估计的智能检测三、基于参数辨识的智能检测第五章基于模式识别的智能检测 模式识别 随机事件是普遍存在的,在对这种事件的研究过程中常把被观察的对象称为样本。 每个样本可能会有很多个观察数据,这些观察数据的综合便称为模式。 获得观察数据的过程称为模式采集,所有样本的观察数据的集合构成模式空间。 模式空间的维数由观测过程中所选择的观察变量的个数所决定。第五章基于模式识别的智能检测 模式识别 被选择的观察变量可能有多个,常选择其中最能揭示样本本质属性的若干观察量作为主要特征,从而构成观察样本的特征空间。这种由模式空间到特征空间的变换过程称为特征提取。 众多观测样本根据特征进行分类,进而把特征空间转变为类型空间。 某一观察样本经历模式采集、特征提取而被判别属于具体类型空间的过程称为模式识别。 模式识别是一种常用的智能检测方法,广泛应用于工业、农业、气象、医疗等各领域。第五章基于模式识别的智能检测 模式识别:判别分析和聚类分析 判别分析和聚类分析是两种不同目的的分类方法,它们所起的作用是不同的。 判别分析方法假定组(或类)已事先分好,判别新样品应归属哪一组,对组的事先划分有时也可以通过聚类分析得到。 聚类分析方法是按样品(或变量)的数据特征,把相似的样品(或变量)倾向于分在同一类中,把不相似的样品(或变量)倾向于分在不同类中。第五章基于模式识别的智能检测 判别分析的基本概念 判别分析是根据表明事物特点的变量值和它们所属的类求出判别函数,根据判别函数对未知所属类别的事物进行分类的一种分析方法,它需要已知一系列反映事物特性的数值变量及其变量值。 判别分析就是在已知研究对象分为若干类型(组别)并已经取得各种类型的一批已知样品的观测数据基础上,根据某些准则,建立起尽可能把属于不同类型的数据区分开来的判别函数,然后用它们来判别未知类型的样品应该属于哪一类。第五章基于模式识别的智能检测 判别分析的基本概念 判断分析按判别的总体数来区分,有两个总体判别分析和多总体判别分析;按判别时所处理的变量方法不同,有逐步判别和序贯判别等。判别分析可以从不同角度提出问题,因此有不同的判别准则,如马氏距离最小准则、Fisher准则、平均损失最小准则、最小平方准则、最大似然准则、最大概率准则等等。 判别分析的关键一步是定义合适的判别函数,判别函数有线性和非线性之分,而非线性判别函数一般可通过变量替换转变成线性判别函数。第五章基于模式识别的智能检测 判别分析的一般步骤第五章基于模式识别的智能检测 判别分析的一般步骤 判别分析通常都要建立一个判别函数,然后利用此判别函数来进行判别。 为了建立判别函数就必须有一个训练样本。判别分析的任务就是向这份样本学习,学出判断类别的规则,并作多方考核。 训练样本的质量与数量至为重要。每一个体所属类别必须用“金”予以确认;解释变量(简称为变量或指标)X1,X2,…,Xp必须确实与分类有关;个体的观察值必须准确;个体的数目必须足够多。第五章基于模式识别的智能检测 判别分析的一般步骤训练样本的数据内容与符号───────────────────────────────────解释变量个体号───────────────────────类别变量(Y)X1X2…Xj…XP───────────────────────────────────1X11X12…X1j…X1Py12X22X22…X2j…X2Py2……………………iXi1Xi2…Xij…XiPy3……………………nXn1Xn2…Xnj…XnPyP────────────────────────────────────第五章基于模式识别的智能检测 判别分析常用方法 最大似然法该法是建立在概率论中独立事件乘法定律的基础上,适用于各指标是定性的或半定量的情况。Fisher判别分析用于两类或两类以上间判别,但常用于两类间判别。Bayes判别分析用于两类或两类以上间判别,要求各类内指标服从多元正态分布。第五章基于模式识别的智能检测 判别分析常用方法 逐步判别分析建立在Bayes判别分析基础上,它象多元逐步回归分析一样,可以在众多指标中挑选一些有显著作用的指标来建立一个判别函数,使方程内的指标都有显著的判别作用而方程外的指标作用都不显著。logistic判别常用于两类间判别,它不要求多元正态分布的假设,故可用于各指标为两值变量或半定量的情况。第五章基于模式识别的智能检测 Fisher判别分析 Fisher判别法是1936年提出来的,该方法的主要思想是通过将多维数据投影到某个方向上,投影的原则是将总体与总体之间尽可能的放开,然后再选择合适的判别规则,将新的样品进行分类判别。第五章基于模式识别的智能检测Fisher判别分析第五章基于模式识别的智能检测 Bayes判别分析:最大后验概率准则 设有k个组,且组的概率密度为,样品来自组的先验概率为,满足。则x属于的后验概率为最大后验概率准则是采用如下的判别规则: 已知分类的训练样本 未知样品判别归类 判别分析方法 判别函数 建立判别准则 考核 从个总体中抽取具有个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数其中系数确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。有了线性判别函数后,对于一个新的样品,将它的个指标值代入上式线性判别函数中求出值,然后根据一定的判别规则,就可以判别新的样品属于哪个总体。_1170098149.unknown_1202400785.unknown_1202400786.unknown_1170098445.unknown_1170098092.unknown第五章基于模式识别的智能检测 影响判别函数判决效果的因素 判别分析效果的好坏取决于判别函数的判决能力,针对同一判别分析问题可以定义多个判别函数,但它们的判别效果是不同的,最优的判别函数能根据被判对象的观察值最大限度地把它的所属类与其他类区别开。 各种工业过程中存在许多可观察变量,很难准确确定选择哪些变量作为特征变量;一般应从过程机理分析入手,选择对被判对象具有显著影响的变量作为观察量,以取得较好的判别分析效果。第五章基于模式识别的智能检测 工业过程测量数据中过失误差的侦破工业过程的控制和优化依赖于测量数据的质量。而由于测量过程中仪表失灵、系统偏差以及不完全或是不正确的过程模型等均会引起过失误差。这些过失误差的存在会严重破坏测量数据的统计特性,导致过程辨识、控制和优化的失败。侦破过失误差具有相当重要的意义。第五章基于模式识别的智能检测 工业过程测量数据中过失误差的侦破 有两种常用方法侦破过失误差,一种是测量检验法,另一种方法为节点检验法。 1975年,Almasy和Sztano提出了测量检验法,该法利用测量值与其校正值之间的相对大小来判断是否存在显著误差。该方法可直接检测各个测量变量,因而可直接定位显著误差,但是由于该方法在使用最小二乘法计算校正值时会把失误误差传播到所有的数据上,因而可能出现“虚警”错误,将不存在显著误差的测量数据判断成含有显著误差。第五章基于模式识别的智能检测 工业过程测量数据中过失误差的侦破 有两种常用方法侦破过失误差,一种是测量检验法,另一种方法为节点检验法。 1963年,Reilly提出了节点检验法,该法是针对每一个约束方程的残差构建一个检验统计量,并将其与临界值进行比较。如果该统计量大于临界值,则说明该约束方程中涉及的变量含有显著误差。但是由于每个节点中含有多个测量数据,因而无法准确判断出那个测量数据含有显著误差。第五章基于模式识别的智能检测 工业过程测量数据中过失误差的侦破 有两种方法侦破过失误差,一种是测量检验法,另一种方法为节点检验法,单独使用这两种方法均存在不足之处,为克服缺陷,发挥两者的优点,常将这两种方法组合使用。 首先用测量检验法来找出含有过失误差的测量数据,然后使用节点检验法进一步证实其中确实含有过失误差的数据,恢复被误判含有过失误差数据的本来面目。 反复进行上述过程,直到侦破所有过失误差的测量数据为止。第五章基于模式识别的智能检测 算法侦破蒸汽系统流量数据中存在的过失误差第五章基于模式识别的智能检测 算法侦破蒸汽系统流量数据中存在的过失误差最终校正结果:第五章基于模式识别的智能检测 间歇精馏塔塔板效率的在线软测量 塔板效率是反应精馏塔传质效率的一个重要指标,由于受塔的结构参数、板上流体的力学特性以及负荷变化等因素的影响,很难准确估计精馏塔的塔板效率。 将塔板的平均效率看作为一个服从正态分布的随机变量,建立塔板效率的软测量模型,对塔板效率进行在线测量。 软测量过程中,根据Bayes公式,采用相邻区域的似然比作为判别函数。第五章基于模式识别的智能检测 聚类分析定义 聚类分析(Clusteranalysis)又称集群分析,它是研究“物以类聚”的一种数理统计方法。聚类分析可将一些观察对象依据某些特征加以归类。聚类分析时总体中各类别的划分是不清楚的,甚至到底应分成几类也不知道,用于聚类分析的原始数据中没有类别变量,所以是无师可循的统计分析方法。第五章基于模式识别的智能检测 聚类分析定义聚类分析是对观察对象进行分类的一种方法,它依据于各观察样本间的相似性,按着一定的聚类准则判别各个样本的类别,达到对众多样本进行分类的目的。主要介绍样本的相似性度量、聚类准则、聚类算法及聚类分析的应用。第五章基于模式识别的智能检测 样本间的相似性度量和聚类准则函数经常采用两个样本在特征空间中的距离来度量两个样本间的相似性,这种距离有多种计算算法,常用的有: 契比雪夫距离绝对值距离欧氏距离第五章基于模式识别的智能检测 特征量纲对聚类结果的影响财富(万)510年龄6030财富(十万)年龄6030510第五章基于模式识别的智能检测 距离测度对聚类结果的影响数据的粗聚类是2类,细聚类为4类第五章基于模式识别的智能检测 样本间的相似性度量和聚类准则函数 各特征变量的单位并不一致,致使所计算距离的量纲没有意义。 度量单位的变化会严重影响各特征变量在距离计算中所起的作用,以致影响聚类效果。 所以在计算距离前有必要对各变量的数据进行归一化。 大多数聚类准则为寻求一个函数的极大或是极小,这个函数用来描述各类样本的特征,所以聚类过程一般是按着聚类准则进行寻优的一个迭代过程,聚类结果的各个类使得聚类准则函数取极值。第五章基于模式识别的智能检测 两种主要的聚类准则函数简介 误差平方和准则JC 采用个各类内样本的总误差平方和JC来衡量聚类的质量。总误差平方和JC定义为:采用JC达到最小作为聚类合理与否的准则,控制聚类迭代过程,也称为最小方差聚类。第五章基于模式识别的智能检测 两种主要的聚类准则函数简介 加权平均平方距离和准则Jl 当可获得样本分类的先验知识时,可以预先估计不同的类在聚类准则函数中的重要程度,并附以相应的权值,从而得到加权平均平方距离和准则。其中类内样本间平均平方距离第五章基于模式识别的智能检测 聚类准则函数 上述数据聚类准则函数中,误差平方和准则适用于各类样本在模式空间或特征空间中的分布较为集中,而且各类样本数目比较接近的情况。 当样本数目相差较为悬殊时,应采用加权平均平方距离和准则。 还有多种其他方法来评价聚类效果,可根据具体问题的需要灵活定义聚类准则函数。第五章基于模式识别的智能检测 聚类算法 简单聚类方法算法运行中模式的类别及类的中心一旦确定将不会改变(根据相似性阈值和最小距离原则) 层次聚类法算法运行中,两类合并为一类,不断重复进行,也称为谱系聚类法。(按最小距离原则不断进行两类合并) 动态聚类法算法运行中,类心不断地修正,各模式的类别的指定也不断地更改。这类方法有—基于试探的聚类算法、K均值法、ISODATA法等。(依据准则函数)第五章基于模式识别的智能检测简单聚类算法简单聚类图例初始条件不同的简单聚类结果初始中心不同样本顺序不同1234512345123451234510981098876876116711679101191011第五章基于模式识别的智能检测 动态聚类算法 聚类分析是一个反复寻优的迭代过程,对每一种可能的分类结果进行试探,看相应分类状态下聚类准则函数是否达到极值,聚类分析往往是个试探的过程。 采用最近邻规则的聚类算法 最大最小聚类算法 K-均值法 ISODATA算法第五章基于模式识别的智能检测 采用最近邻规则的聚类算法:初始样本 选择距离阈值T,任取一个样本作为第一个聚合中心Z1,如计算样本x2到Z1的距离D21,若D21≤T,则令x2∈Z1,否则令D2={x2}为第二个聚合中心;计算x3到Z1和Z2的距离D31和D32,若D31≥T和D32≥T,则令D3={x3}为第三个聚合中心,否则令,将x3加到Zk中;依次类推,把所有样本分到各自的类中。按照某种聚类准则函数评价聚类效果,若不满足要求,则重新选择阈值和初始聚类中心,并执行上述过程,直到满足要求为止。第五章基于模式识别的智能检测 最大最小聚类算法:初始样本 给定一个常数θ,0<θ<1,任取一个样本作为第一个聚合中心Z1。 寻找新的聚合中心:计算其他所有样本到Z1的距离Di1,若Dk1=maxDi1,则取xk作为第二个聚合中心Z2,然后计算所有其他样本到Z1和Z2的距离Di1和Di2,即若Dl>θD12(D12为Z1和Z2间的距离),则取xl作为第三个聚合中心Z3。第五章基于模式识别的智能检测 最大最小聚类算法:初始样本 如果Z3存在,则计算若有Dj>θD12,则取xj作为第四个聚合中心Z4;依次类推,直到最大最小距离不大于θD12,结束寻找聚合中心的计算。按照最近邻原则把所有样本归属于距离最近的类型。按照某种聚类准则评价聚类结果,若不满足要求,则重新选择θ和第一个聚合中心,重新执行上述过程。第五章基于模式识别的智能检测 算法优点 上述算法突出优点是简单,但这些算法对初始聚合中心和阈值的选取具有很大的依赖性,如果具有样本分布的先验知识来指导正确选择初始聚合中心和阈值,它们将很快的收敛到理想的聚类效果。 其他聚类算法 应用简单的聚类算法的思想,采用不同的聚类准则函数,可派生出多种聚类算法如K-均值法,ISODATA算法等,还可将模糊数学应用于聚类分析,派生出模糊K-均值等聚类算法。第五章基于模式识别的智能检测 K-均值法类的数目K是事先取定的。(0,0.5)���开始�选择K个中心Z1,Z2,…,Zk�所有样本分到K个聚类中心计算新的聚类中心聚类中心不变?�结束YN(1.25,1.13)(7.67,7.33)���开始�选择K个中心Z1,Z2,…,Zk�所有样本分到K个聚类中心计算新的聚类中心聚类中心不变?�结束YN第五章基于模式识别的智能检测 ISODATA法IterativeSelf-OrganizingDataAnalysisTechniquesAlgorithm迭代自组织数据分析 特点:启发性推理、分析监督、控制聚类结构及人机交互。 条件及约定:设待分类的模式特征矢量为,算法运行前需设定7个初始参数。 算法思想:在每轮迭代过程中,样本重新调整类别之后计算类内及类间有关参数,并和设定的门限比较,确定是两类合并为一类还是一类分裂为两类,不断地“自组织”,以达到在各参数满足设计要求条件下,使各模式到其类心的距离平方和最小。第五章基于模式识别的智能检测 ISODATA法IterativeSelf-OrganizingDataAnalysisTechniquesAlgorithm迭代自组织数据分析第五章基于模式识别的智能检测 运用模糊聚类分析评价石油产品质量 对于参评的石油产品,虽然测得了多项指标值,但这些指标值在评比中所起的作用是不一样的。在评比之前常聘请同行专家根据各项指标在产品中所起的作用赋以一定的加权系数,然后用该加权系数修正获得的隶属度。 用模糊聚类分析方法建立石油产品等级分类的软测量模型,将产品分成四类:“好”、“较好”、“一般”和“较差”。第五章基于模式识别的智能检测 流化床内颗粒尺寸的在线软测量 主要采用离线分析法检验流化床内颗粒质量的大小,这种方法耗时较多,滞后时间较长,基于光学原理的检测方法因环境限制无法应用,可采用模糊式分类进行流化床内颗粒尺寸的在线软测量。结果表明,采用同样的方法对不同流化速度及不同平均直径的颗粒进行分类,从上表中可以看出,最大误差为2.9%,能够满足工业应用要求。第五章基于模式识别的智能检测 基于模式识别的智能检测 采用模式识别的方法对工业过程的操作数据进行处理,从中提取系统的特征,构成以模式描述分类为基础的模式识别模型。 与传统的数学模型不同,它是一种以系统的输入、输出数据为基础,通过对系统特征提取而构成的模式描述为模型。 该方法的优势在于它适用于缺乏系统先验知识的场合,可利用日常操作数据来实现智能检测建模。 在实际应用中,该种方法常常和人工神经网络以及模糊技术结合在一起。第五章基于模式识别的智能检测 SPSS软件介绍 SPSS(StatisticalProductandServiceSolutions),“统计产品与服务解决”软件。最初软件全称为“社会科学统计软件包”(StatisticalPackagefortheSocialSciences),但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为“统计产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。第五章基于模式识别的智能检测 SPSSStatistics软件介绍 SPSSStatistics统计分析软件是一款在调查统计行业、市场研究行业、医学统计、政府和企业的数据分析应用中久负盛名的统计分析工具,是世界上最早的统计分析软件,由美国斯坦福大学的三位研究生于1968年研制。 在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。http://www.spss.com.cn第五章基于模式识别的智能检测 SPSSStatistics软件介绍 SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS也有专门的绘图系统,可以根据数据绘制各种图形。祝同学们学习进步、学业有成!政策倾向和趋势新型智慧城市产生的原因新型智慧城市与传统相比”新“在何处?新型智慧城市建设的”六个一“工程新型智慧城市的建设行动目标新型智慧城市的评价指标*自2008年IBM提出“智慧地球”的概念以来,建设智慧城市,以应对城镇化发展过程中带来的人口增长、环境污染、交通拥堵等各类“城市病”,促进城市健康、安全和可持续发展,已经成为全球城市发展的共同诉求和大势所趋。据统计,截至2016年6月,全国95%的副省级以上城市、超过76%的地级城市,超过500座城市,明确提出或正在建设智慧城市,我国已经成为世界智慧城市建设的“试验场”。*从“智慧城市”到“新型智慧城市”我国首次提到智慧城市是2012年1月颁布的《国务院关于印发工业转型升级规划(2011-2015年)的通知》,该通知从推进物联网应用的角度,明确了智慧城市的应用领域。2014年3月,中共中央、国务院印发《国家新型城镇化规划(2014-2020年)》,提出利用大数据、云计算、物联网等新一代信息技术,推动智慧城市发展,首次把智慧城市建设引入国家战略规划,并提出到2020年,建成一批特色鲜明的智慧城市。2014年8月,经国务院同意,国家发展改革委等八部委联合印发了《关于促进智慧城市健康发展的指导意见》。*从“智慧城市”到“新型智慧城市”2015年,新型智慧城市被首次写入政府工作;2016年,国家“十三五”规划纲要明确提出“建设一批新型示范性智慧城市”。同时相关部门提出在“十三五”时期,将有针对性地组织100个城市开展新型智慧城市“试点”,同时开展智慧城市建设效果评价工作。2016年10月,习近平在政治局集体学习中强调“以推行电子政务、建设新型智慧城市等为抓手,以数据集中和共享为途径,建设全国一体化的国家大数据中心,推进技术融合、业务融合、数据融合,实现跨层级、跨地域、跨系统、跨部门、跨业务的协同管理和服务。”进一步对我国新型智慧城市的建设和发展提出了要求。*为什么要提出“新型智慧城市”传统的智慧城市建设侧重于技术和管理,忽视了“技术”与“人”的互动、“信息化”与“城市有机整体”的协调,导致了“信息烟囱”“数据孤岛”,重技术轻应用、重投入轻实效,公共数据难以互联互通,市民感知度较差等问题。*智慧城市从1.02.0的演进*关键在于打通传统智慧城市的各类信息和数据孤岛,实现城市各类数据的采集、共享和利用,建立统一的城市大数据运营平台。*新型智慧城市是一个复杂的系统,需要遵循体系建设规律,运用系统工程方法,构建开放的体系架构;通过“强化共用、整合通用、开放应用”的思想,指导各类新型智慧城市的建设和发展。为了实现城市的精确感知、信息系统的互联互通和惠民服务的无处不在,要构建一张天地一体化的城市信息服务栅格网,夯实新型智慧城市建设的基础。为有效管理城市基础信息资源,提高系统的使用效率,要构建一个通用功能平台,实现各类信息资源的调度管理和服务化封装,进而支撑城市管理与公共服务的智慧化。海量数据是新型智慧城市的特有产物,要建立一个开放共享的数据体系,通过对数据的规范整编和融合共用,实现并形成数据的“总和”,进而有效提高决策支持数据的生产与运用,进一步提升城市治理的科学性和智能化水平。为更好对城市的市政设施、公共安全、生态环境、宏观经济、民生民意等状况有效掌握和管理,需要构建新型智慧城市统一的运行中心,实现城市资源的汇聚共享和跨部门的协调联动。标准化是新型智慧城市规范、有序、健康发展的重要保证,需要通过政府主导,结合各城市特色,分类规划建设内容及核心要素,建立健全涵盖“建设、改革、评价”三方面内容的标准体系。**客观指标自选指标主观指标主观指标自选指标*中国电科华为 提出“六个一”的思路:“一个开放的体系架构、一个共性基础网、一个通用功能平台、一个数据体系、一个高效的运行中心、一套统一的标准体系”; 与国内外19家企业和3所高校共同发起成立“新型智慧城市”建设企业联盟。*THANKS谢谢聆听*************
/
本文档为【智能检测理论与技术】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索