为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 关于李德毅院士抄袭本人研究成果的情况说明

关于李德毅院士抄袭本人研究成果的情况说明

2012-04-06 13页 pdf 642KB 277阅读

用户头像

is_184321

暂无简介

举报
关于李德毅院士抄袭本人研究成果的情况说明 1 王立新 《关于李德毅院士抄袭本人研究成果的情况说明》 一、时间表: 1. 2010年 5月 19日:本人应李德毅院士的邀请,参加在北京京通宾馆召开的“不确 定表示的数学基础研讨会”,会上第一次听到“云模型” (早年由李院士提出)。 由于会期紧,没有学习“云模型”的细节。 2. 会后至 2011年 7月:参加由李院士主导、主要由参加研讨会的成员组成的网上讨 论。 3. 2010年 11月 8日下午 15时 33分:收到由李院士的学生发来的“云模型”的算法 细节,开始对其进行研究。 4...
关于李德毅院士抄袭本人研究成果的情况说明
1 王立新 《关于李德毅院士抄袭本人研究成果的情况说明》 一、时间表: 1. 2010年 5月 19日:本人应李德毅院士的邀请,参加在北京京通宾馆召开的“不确 定表示的数学基础研讨会”,会上第一次听到“云模型” (早年由李院士提出)。 由于会期紧,没有学习“云模型”的细节。 2. 会后至 2011年 7月:参加由李院士主导、主要由参加研讨会的成员组成的网上讨 论。 3. 2010年 11月 8日下午 15时 33分:收到由李院士的学生发来的“云模型”的算法 细节,开始对其进行研究。 4. 2010年 11月 9日下午 20时 51分:将一天来的研究心得写成“高斯云的定义与数 学特性”一文(见下面附件 1),发给全体讨论组成员。 5. 2011年 4月:李德毅院士作为第一作者,在《中国科学》(2011, 13(4): 20-23)发表文章“正态云模型的重尾性质证明”(见下面附件 2),其核心结果 (定理 1的证明)完全抄袭本人“高斯云的定义与数学特性”一文中的定理 4(请 读者比较下面附件 1定理 4的证明与附件 2定理 1的证明)。 二、想要说的话: 1. 将研究成果首先发给同行学者,这在国际学术界是通行的做法。收到成果的人将成 果作为自己的成果去发表,只字不提原创者,这是极其严重的抄袭行为。 2. 李德毅院士是国内信息科学界德高望重的学者,李院士是中国人工智能学会理事 长,国家自然科学基金委员会信息科学部主任,软件工程国家重点实验室学术 委员会主任,973首席科学家,……。 3. 本人于 92年获美国南加州大学电机工程系博士学位,93至 07年任教于香港科技 大学电机与电子工程系。07年从工作了 14年、具有终身(到 65岁)的香港 科大辞职,移居北京,大隐于繁华,以“独立研究者”之身份向科学的高峰攀登。 本人的研究成果在国际学术界的影响可上 google scholar或 SCI搜 lx wang。 王立新 2012年 4月 1日(愚人节)于北京 2 确定度 年龄 Ex 3En He 附件 1: 高斯云的定义及数学特性 李老师说过云模型是在概率的基础上通过计算机算法实现的,是基于泛高斯分布形成的认 知模型。所以我想高斯云的生成算法是李老师云模型理论的出发点与核心。下面我从高斯 云的生成算法出发,按顺序做以下几件事: 1. 反推出高斯云的数学定义; 2. 证明高斯云主要的几个数学特性; 3. 给出从采样数据求得高斯云三个参数的具体算法与详细公式; 4. 简单说明云综合的一些方法; 5. 最后以一个笑话结束。 先引用李老师的高斯云生成算法,如下: 算法 1 :正态云模型 输入 表示定性概念 A 的 3 个数字特征值 Ex, En, He,云滴数 N。 输出 N个云滴的定量值,以及每个云滴代表概念 A的确定度。 (1) 以 En为期望值,He为差的一个正态随机数 En; (2) 生成以 Ex为期望值,abs (En)为标准差的正态随机数 x; (3) 令 x为定性概念 A ~ 的一次具体量化值,称为云滴; (4) 计算 y = exp [(xEx)2/2(En)2],令 y为 x能够代表定性概念 A的确定度; (5) 重复 Step 1至 Step 4,直到产生 N个云滴。 通过三个数字特征生成的云图 根据以上算法 1,我们反推出高斯云的数学定义,如下: 定义 1:(高斯云的数学定义) 考虑两个论域 U和 V。在 U上定义均值为 Ex、标准差为 y的 高斯随机变量 X,即 X的密度函数为 3 (1) 在 V上定义均值为 En、标准差为 He的高斯随机变量 Y,即 Y的密度函数为 (2) 通过函数 g(x,y)=x(可以理解为 g(x,y)=1*x+0*y)定义二维论域 上的随机变量 (3) 设 X和 Y相互独立,则 Z的密度函数为 (4) 这样定义的 Z称作高斯云。 从定义 1可以看出高斯云 Z是定义在二维论域 上的一个随机变量,如果要获得 Z的 一个实现(采样)需要分别在 V和 U上各进行一次独立的随机数产生过程,这正是算法 1 所完成的。具体地讲,先根据密度函数(2)在论域 V上产生随机变量 Y的一个实现 y=En’,然后根据密度函数(1)在论域 U上产生随机变量 X的一个实现 x(暂且忽略算法 1中 abs(En’)的影响),这样的 x就是算法 1第 3步产生的云滴。 下面给出高斯云 Z的几个基本数学特性(定理 1到定理 4)。 定理 1:高斯云 Z的均值等于 Ex,即 (5) 证明:根据定义 (6) 将式(4)的 f(z)代入式(6),并进行积分次序的互换,我们得到 (7) ■ 4 定理 2:高斯云 Z的方差 (8) 证明:类似于定理 1的证明,并利用定理 1的结果 E{Z}=Ex,我们有 (9) ■ 定理 3:高斯云 Z的三阶中心矩(central moment)等于零,即 (10) 证明:用前面同样的方法,我们有 (11) ■ 定理 4:高斯云 Z的四阶中心矩 + + (12) 证明:运用同样的积分互换方法,并注意到对均值为零、方差为σ2的高斯随机变量 X我 们有 ,得 5 (13) ■ 根据定理 1-4,我们可以进行如下讨论。常说 He用来衡量高斯云偏离正态分布的程度, 现在有了精确的公式定理 1-4,我们看看这种说法是否正确。为此我们来构建一个与高斯 云 Z尽可能接近的高斯随机变量 X’,这里“尽可能接近”的含义是 Z和 X’的各阶中心矩 要尽可能地相等,这个构建的高斯随机变量 X’的密度函数为 (14) 因为 X’的均值、方差及三阶中心矩分别为 Ex,En2+He2和 0,这与高斯云 Z的完全相同, 所不同的是 X’的四阶中心矩为 (15) 比较式(15)和(12),我们发现高斯云 Z的四阶中心矩要比 X’的四阶中心矩大 6He 4 +12He 2 En 2,据此我们得出结论:定性地讲 He确实可以用来衡量高斯云 Z偏离正态分布 的程度,而这个偏离程度的更准确的定量指标是 6He4+12He2En2的大小。 下面我们看看如何从采样数据求得高斯云 Z的三个参数 Ex,En和 He。由于有了定理 1-4 的具体公式,我们将会到这些参数的求取是非常方便的。给定高斯云 Z的 N个采样值 z1,z2,…,zN,先算出其样本均值 (16) 样本方差 = (17) 及样本四阶中心矩 = (18) 然后根据定理 1、2、4(式(5)、(8)、(12)),我们有 6 (19) = (20) + + = (21) 联立求解(20)和(21),我们得到 (22) (23) 于是我们有了下面的算法: 算法 2:逆向正态云算法 输入 高斯云 Z的 N个采样值 z1,z2,…,zN 。 输出 高斯云 Z的三个参数 Ex,En和 He的样本估计值。 (1) 根据式(16),(17)和(18)算出样本均值,样本方差及样本四阶中心矩; (2) 根据式(19),(22)和(23)求得高斯云 Z的三个参数 Ex,En和 He的样本估计值。 由于式(22)和(23)中涉及求四阶及二阶平方根,大家会问如果 或者 怎么办?一种简单(且粗暴)的解决方法是如果这种情况发生,就说该组数据 不适合用高斯云模型来描述。或者哲学点地说就是该组数据不能形成一个云概念。 下面简要地说说云综合。设 Z1、Z2是二维论域 上两朵美丽的高斯云,如何用这两朵 云合成出更美丽的云朵呢?由于 Z1、Z2 说到底是随机变量,所以最基本的合成无非是加、 减、乘、除,再加上取最大、最小及圆周化,等等。具体地讲,合成出的云 Z可以是: 7 等等。由于 Z1、Z2的密度函数已知(见式(4)),以上合成后的 Z的密度函数可以用教 科书上的方法求得,这里不再多述。 写了这么多数学公式,最后应该轻松一下。都说云模型是认知模型,我没有研究过认知理 论,感觉好像是介于科学和哲学之间的一个学科吧?由此想到一个关于科学家(工程师)、 经济学家和哲学家的经典故事,这里说来和大家一起乐一乐。 一天,一个科学家(工程师)、一个经济学家、和一个哲学家来到一间黑屋子的门口,看 见一只黑猫跑进了黑屋子。科学家二话没说一头扎进黑屋子里去寻找黑猫。经济学家想了 想,觉得在黑屋子里抓黑猫太难,于是假设黑猫没有在黑屋子里,写了一篇论文,提出一 套在阳光下抓黑猫的理论。哲学家环顾四周,发现旁边有一间没有黑猫的黑屋子,于是走 进去,然后没过多久就大喊道:“我抓住了!我抓住了!” 如果这时又来了一位认知学家,会发生什么呢?会不会捧过经济学家的论文,然后向哲学 家的喊声奔去? (初稿没有细查,有错请朋友们更正。) 8 附件 2: 正态云模型的重尾性质证明 李德毅 1,刘常昱 2,淦文燕 2 (1 中国电子系统工程研究所,北京,100840 2 解放军理工大学指挥自动化学院,南京,210007) 摘要:正态分布和重尾分布在概率研究中具有非常重要的地位,二者具有完全不同的数学 形式和物理意义。正态分布的密度函数以指数函数衰减至 0,服从正态分布的随机变量, 其绝大多数取值在其期望附近,偏离期望很大的取值很少。而服从重尾分布的随机变量, 其尾分布函数具有重尾特性,密度函数以幂指数衰减至 0。本文证明了正态云模型是具有 均值的重尾分布,是介于正态分布与重尾分布之间的中间状态,正态云模型的参数超熵 He 是可以实现正态分布向重尾分布转换的桥梁。 关键词:正态分布,重尾分布,正态云模型,峰度 中图分类号:TP182 1、 引言 在概率论与随机过程的研究中,正态分布的地位举足轻重。正态分布的密度函 数和分布函数具有比较简单的数学形式和一些很好的数学性质。正态分布是许多重 要概率分布的极限分布,许多非正态的随机变量是正态随机变量的函数,这些都使 得正态分布在理论和实际中应用非常广泛。 中心极限定理从理论上阐述了产生正态分布的条件,中心极限定理简单直观的 阐述是:如果决定某一随机变量结果的是大量微小的、独立的随机因素之和,并且 每一随机因素的单独作用相对均匀的小,没有一种因素可起到压倒一切的主导作用, 那么这个随机变量一般近似服从于正态分布。正态分布广泛存在于自然现象、社会 现象、科学技术以及生产活动中,在实际中遇到的许多随机现象都服从或者近似服 从正态分布。例如正常生产条件下的产品质量指标,随机测量误差,同一生物群体 的某种特征,某地的年平均气温等等。 通常在讨论有关概率问题时,分布函数 F(x)起着非常重要的作用,其尾分布函 数 1-F(x)在实际中的应用尤为重要。例如,在有关可靠性的分布中,可靠性与失效 率等概念都同尾分布函数有关。自上世纪 60 年代以来,国外出现了大量重尾分布 的研究文献[1][2][3]。但是究竟什么是重尾分布?至今仍未有一个确切统一的定义来 描述,甚至名称也没有完全统一。不同文献中,重尾分布(heavy-tailed distributions) 9 也被称为胖尾(fat-tailed),厚尾(thick-tailed)或者长尾(long-tailed)分布。在本文中, 把这些名词当作同义词,在不引起混淆的情况下,统称为重尾分布。 重尾分布在分支过程、排队论和可靠性的研究中,特别是近年来在金融工程, 数量经济和保险精算等研究领域都有广泛应用。特别是 1998 年 BA 模型的提出[4], 使全世界不同领域的众多学者对幂律分布产生了极大的兴趣和热情。而幂律分布就 是一类重尾分布。由于优胜劣汰的竞争在生物界、人类社会等诸多领域中都或 多或少的存在,因此,越来越多的研究者倾向于认为,重尾分布具有不亚于正态分 布的意义。 无论从产生条件、数学形式还是物理意义而言,重尾分布都和正态分布截然不 同。那么,二者之间到底有无内在联系?有无转换桥梁?这将是本文所要论述的中 心问题。 2、 正态分布与重尾分布 定义 1 若随机变量 X的概率分布函数形式为:   uuxF x d 2 )( exp π2 1 ,, 2 2 2               。 或者概率密度函数为: f (x; ,  2) = (2)1/2 1exp [(x)2/2 2] 则称 X为正态分布,记为 X~N( , 2)。其中, 和 2分别是正态分布的期望 和方差,分别表征随机变量的最可能取值以及一切可能取值的离散程度。 重尾分布则有很多等价的数学定义,其中 Embrechts的定义应用最为广泛[1]。 定义 2 称随机变量 X是重尾分布,如果它不存在指数阶矩,即对任意λ>0, 有    )( 0 xdFeEe xX  。其中 F(x)是 X的分布函数。 还有一种定义是相对于正态分布而言,以四阶中心矩为基础的。四阶中心矩具 有峰度(kurtosis)的含义,峰度是统计中描述分布状态的一个重要特征值,用以 判断概率密度函数曲线相比于正态分布的尖平程度。如果将正态分布视为常峰态, 密度函数曲线的形状比正态分布更高更瘦的称为高峰态,否则称为低峰态。 定义 3[5] 随机变量 X称为是重尾的,如果 3] )( [ 4 4    X E ,其中μ,σ分别为 X的期望和标准差。 10 正态分布的峰度为 3,因此该性质被称为超过或大于峰度。但是,该定义只适 用于四阶矩存在的情况。 另一种是判断重尾分布较为直观的定义。 定义 4[1] 如果密度函数是以幂指数衰减至 0的,则该分布函数为重尾的;如果 密度函数是以指数函数衰减至 0的,称该分布函数为轻尾的。 形象而言,重尾分布就是密度函数”尾巴”比较长的分布。在应用领域,它的 物理意义可以解释为极端事件的概率不为 0。如保险业的大额索赔问题,在 N次索 赔中有一次索赔的额度非常大,以至于其它 N-1次索赔相对于这次索赔而言是微不 足道的,这类大额索赔问题就需要用重尾分布来处理。这类问题就是所谓的极端事 件问题,如地震、洪水、股灾等。这类问题研究在现实中有很强的应用价值,尤其 是 911事变后,大量保险公司破产,极端事件的研究更成为新的前沿研究热点。因 此,重尾分布的研究也受到越来越多学者的关注。 3、 云模型——超熵与重尾分布 云模型是利用三个数字特征,结合特定算法实现的定性概念及其定量表示之 间的转换模型。其三个数字特征及具体算法定义如下[6]。 期望 Ex:云滴在论域空间分布的期望。即最能够代表定性概念的点。 熵 En:代表定性概念的粒度,熵越大,概念越宏观。 超熵 He:熵的不确定性度量,即熵的熵。 定义 5:设 U 是一论域,C 是 U上的定性概念,(Ex, En, He)为 C的数字特 征。若定量值 xU是定性概念 C的一次随机实现,x满足: x~N(Ex, En' 2 ), 其中,En'~N(En, He2), N(En, He2)表示期望为 En,方差为 He 2的正态分布。 x对 C 的确定度 y 根据下式计算: 2 2 )'2( )( e En Exx y    那么 x在论域 U 上的分布 X称为正态云。 容易计算,正态云 X的概率密度函数为         dye yHe xf He Eny y Exx X 2 2 2 2 2 )( 2 )( 2 1 )(  。 文献[6]已经证明,正态云模型的期望和方差分别为 Ex和 En2+He2。其概率密度 函数以 Ex为中心左右对称。接下来,我们将证明,正态云 X还具有重尾特性。 定理 1:当 He>0时,正态云模型为重尾分布。 11 证明:正态云模型 X的四阶中心矩为 dxxfExxXEXE )(][})]({[ 4 4     =           dye He dxe y Exx He Eny y Exx 2 2 2 2 2 )( 2 )( 4 2 1 ] 2 1 )([  = dye He y He Eny 2 2 2 )( 4 2 1 3     = dye He EnEny He Eny 2 2 2 )( 4 2 1 ])[(3      = dye He EnEnEnyEnEnyEnEnyEny He Eny       2 2 2 )( 432234 2 1 ])(4)(6)(4)[(3  = )63(3 4224 EnEnHeHe  由于正态云 X的方差 22 HeEn  ,故正态云模型的峰度为 222 4224 222 4 )( )63(3 )( )]([ )( HeEn EnEnHeHe HeEn XEXE XK       = 3 )1( 6 9 2 2 2    En He 故由定义 3,当 He>0时,正态云模型为重尾分布。 根据定理 1,我们可以很容易看出超熵 He的物理意义。当 He=0时,正态云模 型退化为正态分布。随着 He的增大,云滴分布将由正态分布向重尾分布转换。可 以说,正态云模型的数字特征超熵 He是正态分布与重尾分布之间的桥梁。 4、 结束语 大量的随机因素作用会导致正态分布,在自然界,完全由大量随机因素主导的 现象会比较多,因此,在处理自然现象时,正态分布可能会发挥比较好的作用。而 在人类社会或者有生命存在的地方,通常会存在不同程度的竞争、适者生存等因素, 12 优先依附的在很多情况下适用,因此幂律分布这类重尾分布也受到了不同领域 研究者的青睐。但是,人类社会中的诸多现象或者人类行为,既不会完全由随机因 素主宰,因为人类会理智思考,选择最利己的行动。也不会任由富者越富,大小通 吃,因为会有类似国家政府的干预等因素。因此,真实的社会中,更多的现象是既 存在极端事件,也有大量中间成分,是介于正态分布(平均主义)与幂律这样的重 尾分布(完全不平衡)之间的中间状态:有期望的重尾分布。可以说云模型,就是 介于正态与重尾之间的中间分布。 通过本文的研究,证明了正态云模型是一类有期望值的重尾分布。这类有平均 值的重尾分布具有何种数学性质?其在数学领域的诸多性质证明,与其它重尾分布 的比较研究,其内在形成机制的阐述证明,以及其在极端事件预测等领域的应用研 究等,都将是下一步的重点关注问题。 参考文献 [1]Embrechts P, Klupperberg C, Mikosch T.Modelling Extremal Events for Insurance and Finance[M].Berlin:Springer-Verlag,1997 [2]Mandjes M. Overflow behavior in Queues with Many Long-tailed Inputs[J].J Appl Probab,2002,37:1150-1167 [3] Baltrunas A. Some Asymptotic Results for Transient Random Walks with Applications to Insurance Risk[J].J Appl Probab, 2001,38:108-121 [4] Albert R, Barabasi Al,Emergence of scaling in random networks[J].Science 286(5439):12- 19.1999 [5] Thomas Werner, Christian Upper. Time Variation in the Tail Behavior of Bund Futures Returns. http://www.bundesbank.de/download/volkswirtschaft/dkp/2002/200225dkp.pdf http://www.ecb.europa.eu/pub/pdf/scpwps/ecbwp199.pdf [6]李德毅,刘常昱。论正态云模型的普适性。中国工程科学,2004,6(8):28-34 Proof of the Heavy-tailed Property of Normal Cloud Model Deyu Li 1 , Changyu Liu 2 , Wenyan Gan 2 (1 Institute of Electronic System Engineering,Beijing ,China,100039 2 Institute of Command Automation,PLA University of Science and Technology 13 Nanjing, China 210007) Abstract:Normal distributions and heavy-tailed distributions are very important in probability theories. They have very different mathematical forms and physical meanings. The probability density function of a normal distribution decay exponentially to 0. And the majority of a normal random variable values around the mathematical expectation. And obey the heavy-tailed random variable, it means a heavy-tailed characteristics, the probability density function decay a power exponentially to 0.In this paper, we proved that the normal cloud model is a heavy-tailed distribution and its mathematical expectation exists.It is a intermediate between notmal distributions and heavy-tailed distributions. The parameter He(hyper-entropy) of the normal cloud model is the bridge from normal distributions to heavy-tailed distributions. Keyword:Normal distribution, Heavy-tailed distribution, Normal cloud model, Kurtosis
/
本文档为【关于李德毅院士抄袭本人研究成果的情况说明】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索