为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 正态分布-标准差

正态分布-标准差

2012-07-14 22页 pdf 609KB 101阅读

用户头像

is_808084

暂无简介

举报
正态分布-标准差 常態分佈 維基百科,自由的百科全書 常態分佈(normal distribution)又名高斯分佈(Gaussian distribution),是 一個在數學、物理及工程等領域都非常重要的機率分佈,在統計學的許多方 面有著重大的影響力。 若隨機變量X服從一個數學期望為μ、標準方差為σ2的高斯分佈,記為: 則其機率密度函數為 常態分佈的期望值μ決定了其位置,其標準差σ決定了分佈的幅度。因其曲線 呈鐘形,因此人們又經常稱之為鐘形曲線。我們通常所說的標準常態分佈是 μ = 0,σ = 1的...
正态分布-标准差
常態分佈 維基百科,自由的百科全書 常態分佈(normal distribution)又名高斯分佈(Gaussian distribution),是 一個在數學、物理及工程等領域都非常重要的機率分佈,在統計學的許多方 面有著重大的影響力。 若隨機變量X服從一個數學期望為μ、標準方差為σ2的高斯分佈,記為: 則其機率密度函數為 常態分佈的期望值μ決定了其位置,其標準差σ決定了分佈的幅度。因其曲線 呈鐘形,因此人們又經常稱之為鐘形曲線。我們通常所說的標準常態分佈是 μ = 0,σ = 1的常態分佈(見右圖中綠色曲線)。 常態分佈 機率密度函數 綠線代表標準常態分佈 累積分佈函數 目錄 n 1 概要 n 1.1 歷史 n 2 常態分佈的定義 n 2.1 機率密度函數 n 2.2 累積分佈函數 (分佈函數) Page 1 of 14常態分佈 - 維基百科,自由的百科全書 2009-6-14http://zh.wikipedia.org/w/index.php?title=%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83&variant=zh-tw&printable=yes 顏色與機率密度函數同 參數 μ location (real) σ2 > 0 squared scale (real) 支撐集 機率密度函 數 累積分佈函 數 期望值 μ 中位數 μ 眾數 μ 方差 σ2 偏度 0 峰度 3 信息熵 動差生成函 數 特性函數 n 2.3 生成函數 n 2.3.1 矩生成函數 n 2.3.2 特徵函數 n 3 性質 n 3.1 標準化正態隨機變量 n 3.2 矩(英文:moment) n 3.3 生成正態隨機變量 n 3.4 中心極限定理 n 3.5 無限可分性 n 3.6 穩定性 n 3.7 標準偏差 n 4 正態測試 n 5 相關分佈 n 6 參量估計 n 6.1 參數的極大似然估計 n 6.1.1 讓人驚訝的推廣(概念一般化) n 6.2 參數的矩估計 n 7 常見實例 n 7.1 光子計數 n 7.2 計量誤差 n 7.3 生物標本的物理特性 n 7.4 金融變量 n 7.5 壽命 n 7.6 測試和智力分佈 n 8 計算統計應用 n 8.1 生成常態分佈隨機變數 Page 2 of 14常態分佈 - 維基百科,自由的百科全書 2009-6-14http://zh.wikipedia.org/w/index.php?title=%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83&variant=zh-tw&printable=yes 概要 常態分佈是自然科學與行為科學中的定量現象的一個方便模型。各種各樣的心理學測試分數和物理現象比如光子 計數 都被發現近似地服從常態分佈。儘管這些現象的根本原因經常是未知的, 理論上可以證明如果把許多小作用加起來看 做一個變量,那麼這個變量服從常態分佈(在R.N.Bracewell的Fourier transform and its application中可以找到一種簡單的 證明)。常態分佈出現在許多區域統計: 例如, 採樣分佈均值是近似地正態的,既使被採樣的樣本總體並不服從常態分 佈。另外,常態分佈信息熵 在所有的已知均值及方差的分佈中最大,這使得它作為一種均值以及方差已知的分佈的自 然選擇。常態分佈是在統計以及許多統計測試中最廣泛應用的一類分佈。在機率論, 常態分佈是幾種連續以及離散分佈 的極限分佈。 歷史 常態分佈最早是棣莫佛在1734年發表的一篇關於二項分佈文章中提出的。拉普拉斯在1812年發表的《分析機率論》 (Theorie Analytique des Probabilites)中對棣莫佛的結論作了擴展。現在這一結論通常被稱為棣莫佛-拉普拉斯定理。 拉普拉斯在誤差分析試驗中使用了常態分佈。勒讓德於1805年引入最小二乘法這一重要;而高斯則宣稱他早在 1794年就使用了該方法,並通過假設誤差服從常態分佈給出了嚴格的證明。 「鐘形曲線」這個名字可以追溯到Jouffret 他在1872年首次提出這個術語"鐘形曲面",用來指代二元常態分佈(bivariate normal). 常態分佈這個名字還被Charles S. Peirce, Francis Galton, Wilhelm Lexis在1875分佈獨立的使用。這個術語是不幸 的,因為它反應和鼓勵了一種謬誤,即很多機率分佈都是正態的。 (請參考下面的"實例") 這個分佈被稱為「正態」或者「高斯」正好是Stigler名字由來法則的一個例子,這個法則說「沒有科學發現是以它最初 的發現者命名的」。 n 9 參見 n 10 引用條目 n 11 外部連接 Page 3 of 14常態分佈 - 維基百科,自由的百科全書 2009-6-14http://zh.wikipedia.org/w/index.php?title=%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83&variant=zh-tw&printable=yes 常態分佈的定義 有幾種不同的方法用來說明一個隨機變量。最直觀的方法是機率密度函數,這種方法能夠表示隨機變量每個取值有多 大的可能性。累積分佈函數是一種機率上更加清楚的方法,但是非專業人士看起來不直觀(請看下邊的例子)。還有一些 其他的等價方法,例如cumulant、特徵函數、動差生成函數以及cumulant-生成函數。這些方法中有一些對於理論工作非 常有用,但是不夠直觀。請參考關於機率分佈的討論。 機率密度函數 常態分佈的機率密度函數 均值為 μ 方差 為σ2 (或標準差 σ) 是高斯函數的一 個實例: (請看 指數函數 以及 π.) 如果一個隨機變量X 服從這個分佈,我們寫作 X ~ N(μ,σ2). 如果 μ = 0 並且 σ = 1, 這個分佈被稱為標準常態分佈, 這個分佈能夠簡化為 右邊是給出了不同參數的常態分佈的函數圖。 常態分佈中一些值得注意的量: n 密度函數關於平均值對稱 四個不同參數集的機率密度函數(綠色線代 表標準常態分佈) Page 4 of 14常態分佈 - 維基百科,自由的百科全書 2009-6-14http://zh.wikipedia.org/w/index.php?title=%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83&variant=zh-tw&printable=yes n 平均值是它的眾數(statistical mode)以及中位數(median) n 函數曲線下68.268949%的面積在平均值左右的一個標準差範圍內 n 95.449974%的面積在平均值左右兩個標準差2σ的範圍內 n 99.730020%的面積在平均值左右三個標準差3σ的範圍內 n 99.993666%的面積在平均值左右四個標準差4σ的範圍內 n 反曲點(拐點)(inflection point)在離平均值的距離為標準差之處 累積分佈函數 (分佈函數) 累積分佈函數是指隨機變量X小於或等於x的機率,用密度函數表示為 標準常態分佈的累積分佈函數習慣上記為Φ,它僅僅是指μ = 0,σ = 1時的 值, 標準常態分佈的累積分佈函數能夠被一個叫做誤差函數的特殊函數表示, 它的反函數被稱為反誤差函數,為: 上圖所示的機率密度函數的累積分佈函數 Page 5 of 14常態分佈 - 維基百科,自由的百科全書 2009-6-14http://zh.wikipedia.org/w/index.php?title=%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83&variant=zh-tw&printable=yes 該分位數函數有時也被稱為probit函數。probit函數已被證明沒有初等原函數。 常態分佈的分佈函數Φ(x) 沒有解析表達式,它的值可以通過數值積分、泰勒級數或者漸進序列近似得到。 生成函數 矩生成函數 矩生成函數 被定義為exp(tX)的期望值。 常態分佈的矩生成函數如下: 可以通過在指數函數內配平方得到。 特徵函數 特徵函數被定義為exp(itX)的期望值,其中 i是虛數單位. 對於一個常態分佈來講,特徵函數是: Page 6 of 14常態分佈 - 維基百科,自由的百科全書 2009-6-14http://zh.wikipedia.org/w/index.php?title=%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83&variant=zh-tw&printable=yes 把矩生成函數中的t換成it就能得到特徵函數。 性質 常態分佈的一些性質: 1. 如果 X˜N(μ,σ2) 且 a 與 b 是 實數, 那麼 (參見 期望值 和 方差). 2. 如果 與 是 統計獨立的正態隨機變量, 那麼: n 它們的和也滿足常態分佈 (proof). n 它們的差也滿足常態分佈 . n U 與 V 兩者是相互獨立的. 3. 如果 和 是獨立正態隨機變量,那麼: n 它們的積 XY 服從機率密度函數為p的分佈 其中K0 是貝塞爾函數(modified Bessel function) n 它們的比符合柯西分佈,滿足 . 4. 如果 為獨立標準正態隨機變量,那麼 服從自由度為n的 卡方分佈. 標準化正態隨機變量 矩(英文:moment) 一些常態分佈的一階動差如下: Page 7 of 14常態分佈 - 維基百科,自由的百科全書 2009-6-14http://zh.wikipedia.org/w/index.php?title=%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83&variant=zh-tw&printable=yes 常態分佈的所有二階以上的累積量為零. 生成正態隨機變量 中心極限定理 常態分佈有一個非常重要的性質:在特定條件下,大量統計獨立的隨機變 量的和的分佈趨於常態分佈,這就是中心極限定理。中心極限定理的重要 意義在於,根據這一定理的結論,其他機率分佈可以用常態分佈作為近 似。 n 參數為n和p的二項分佈,在n相當大而且p不接近1或者0時近似於常態 分佈(有的參考書建議僅在np與n(1 − p)至少為5時才能使用這一近 似)。 近似常態分佈平均數為 μ = np 且方差為σ2 = np(1 − p). n 一泊松分佈帶有參數λ 當取樣樣本數很大時將近似常態分佈 λ. 階數 原點矩 中心矩 Cumulant 0 1 0 1 μ 0 μ 2 μ2 + σ2 σ2 σ2 3 μ3 + 3μσ2 0 0 4 μ4 + 6μ2σ2 + 3σ4 3σ4 0 Page 8 of 14常態分佈 - 維基百科,自由的百科全書 2009-6-14http://zh.wikipedia.org/w/index.php?title=%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83&variant=zh-tw&printable=yes 近似常態分佈平均數為μ = λ 且方差為σ2 = λ. 這些近似值是否完全充分正確取決於是用者的使用需求 無限可分性 常態分佈是無限可分的機率分佈. 穩定性 常態分佈是嚴格穩定的機率分佈. 標準偏差 在實際應用上,常考慮一組數據具有近似於常態分佈的機率分佈。若其 假設正確,則約 68% 數值分佈在距離平均值有 1 個標準差之內的範圍, 約 95% 數值分佈在距離平均值有 2 個標準差之內的範圍,以及約 99.7% 數值分佈在距離平均值有 3 個標準差之內的範圍。稱為 "68-95-99.7法 則"或"經驗法則". 正態測試 相關分佈 n R˜Rayleigh(σ)是瑞利分佈,如果 ,這裏 X˜N(0,σ2) 和 Y˜N(0,σ2) 是兩個獨立常態分佈。 n 是卡方分佈 具有ν自由度,如果 這裏 Xk˜N(0,1) 常態分佈的機率密度函數,參數為μ = 12, σ = 3,趨近於n = 48、p = 1/4的二項分佈的 機率質量函數。 深藍色區域是距平均值小於一個標準差之內的 數值範圍。在常態分佈中,此範圍所佔比率為 全部數值之 68%。根據常態分佈,兩個標準差 之內(藍,棕)的比率合起來為 95%。根據常 態分佈,三個標準差之內(深藍,橙,黃)的 Page 9 of 14常態分佈 - 維基百科,自由的百科全書 2009-6-14http://zh.wikipedia.org/w/index.php?title=%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83&variant=zh-tw&printable=yes 其中 是獨立的. n Y˜Cauchy(μ = 0,θ = 1) 是 柯西分佈,如果Y = X1 / X2,其中 X1˜N(0,1) 並 且 X2˜N(0,1) 是兩個獨立的常態分佈。 n Y˜Log-N(μ,σ2) 是對數常態分佈 如果Y = eX 並且 X˜N(μ,σ2). n 與Lévy skew alpha-stable分佈相關: 如果 因而 . n 截斷常態分佈. 如果 , 在A以下和B以上截取 X 將產生一個平均值 這裏 , 是一個標準正態隨機變數的密度函數 n 如果X是一個常態分佈的隨機變數, Y = | X | , 那麼Y 具有摺疊常態分佈. 參量估計 參數的極大似然估計 讓人驚訝的推廣(概念一般化) 多元常態分佈的協方差矩陣的估計的推導是比較難於理解的。它需要瞭解譜原理(spectral theorem) 以及為什麼把一個標 量看做一個1×1 matrix的trace而不僅僅是一個標量更合理的原因。請參考協方差矩陣的估計(estimation of covariance matrices). 參數的矩估計 常見實例 光子計數 比率合起來為 99% 。 Page 10 of 14常態分佈 - 維基百科,自由的百科全書 2009-6-14http://zh.wikipedia.org/w/index.php?title=%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83&variant=zh-tw&printable=yes 計量誤差 《飲料裝填量不足與超量的機率》 某飲料公司裝瓶嚴謹,每罐飲料裝填量符合平均600毫升,標準差3毫升的常態分配法則。隨機選取一罐,容量超 過605毫升的機率?容量小於590毫升的機率 容量超過605毫升的機率 = p ( X > 605)= p ( ((X-μ) /σ) > ( (605 – 600) / 3) )= p ( Z > 5/3) = p( Z > 1.67) = 0.0475 容量小於590毫升的機率 = p (X < 590) = p ( ((X-μ) /σ) < ( (590 – 600) / 3) )= p ( Z < -10/3) = p( Z < -3.33) = 0.0004 《6-標準差(6-sigma或6-σ)的品質管制標準》 6-標準差(6-sigma或6-σ),是製造業流行的品質管制標準。在這個標準之下,一個標準常態分配的變數值出現在正負三 個標準差之外,只有2* 0.0013= 0.0026 (p (Z < -3) = 0.0013以及p(Z > 3) = 0.0013)。也就是說,這種品質管制標準的產品 不良率只有萬分之二十六。假設例 3-16的飲料公司裝瓶流程採用這個標準,而每罐飲料裝填量符合平均600毫升,標準 差3毫升的常態分配法則。預期裝填容量的範圍應該多少? 6-標準差的範圍 = p ( -3 < Z < 3)= p ( - 3 < (X-μ) /σ < 3) = p ( - 3 < (X- 600) / 3 < 3)= p ( -9 < X – 600 < 9) = p (591 < X < 609) 因此,預期裝填容量應該介於591 至 609毫升之間。 生物標本的物理特性 金融變量 壽命 測試和智力分佈 《計算學生智商高低的機率》 Page 11 of 14常態分佈 - 維基百科,自由的百科全書 2009-6-14http://zh.wikipedia.org/w/index.php?title=%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83&variant=zh-tw&printable=yes 假設某校入學新生的智力測驗平均分數與變異數分別為100與12。那麼隨機抽取50個學生,他們智力測驗平均分數大於 105的機率?小於90的機率? 本例沒有常態分配的假設,還好中央極限定理提供一個可行解,那就是當隨機樣本長度超過30,樣本平均數xbar近似於 一個常態變數,因此標準常態變數 Z = (xbar –μ) /σ/ √n。 平均分數大於105的機率 = p(Z> (105 – 100) / (12 /√50))= p(Z> 5/1.7) = p( Z > 2.94) = 0.0016 平均分數小於90的機率 = p(Z< (90 – 100) / (12 /√50))= p(Z < 5.88) = 0.0000 計算統計應用 生成常態分佈隨機變數 在計算機模擬中,經常需要生成常態分佈的數值。最基本的一個方法是使用標準的正態累積分佈函數的反函數。除此 之外還有其他更加高效的方法,Box-Muller變換就是其中之一。另一個更加快捷的方法是ziggurat演算法。下面將介紹 這兩種方法。一個簡單可行的並且容易編程的方法是: 求12個在(0,1)上均勻分佈的和,然後減6(12的一半)。這種方法可 以用在很多應用中。這12個數的和是Irwin-Hall分佈;選擇一個方差12。這個隨即推導的結果限制在(-6,6)之間,並且密 度為12,是用11次多項式估計常態分佈。 Box-Muller方法是以兩組獨立的隨機數U和V,這兩組數在(0,1]上均勻分佈,用U和V生成兩組獨立的標準常態分佈隨即 變數X和Y: 這個方程的提出是因為二自由度的卡方分佈(見性質4)很容易由指數隨機變數(方程中的lnU)生成。因而通過隨機變數V 可以選擇一個均勻環繞圓圈的角度,用指數分佈選擇半徑然後變換成(常態分佈的)x,y坐標。 Page 12 of 14常態分佈 - 維基百科,自由的百科全書 2009-6-14http://zh.wikipedia.org/w/index.php?title=%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83&variant=zh-tw&printable=yes 參見 n 中心極限定理 n 機率論 n 伽瑪分佈 引用條目 n John Aldrich. Earliest Uses of Symbols in Probability and Statistics. 網上材料,2006年6月3日存在.(See "Symbols associated with the Normal Distribution".) n Abraham de Moivre (1738年). The Doctrine of Chances. n Stephen Jay Gould (1981年). The Mismeasure of Man. First edition. W. W. Norton. ISBN 0-393-01489-4. n R. J. Herrnstein and Charles Murray (1994年). The Bell Curve: Intelligence and Class Structure in American Life. Free Press. ISBN 0-02-914673-9. n Pierre-Simon Laplace (1812年). Analytical Theory of Probabilities. n Jeff Miller, John Aldrich, et al. Earliest Known Uses of Some of the Words of Mathematics. In particular, the entries for "bell-shaped and bell curve", "normal" (distribution), "Gaussian", and "Error, law of error, theory of errors, etc.". 網上材 料,2006年6月3日存在 n S. M. Stigler (1999年). Statistics on the Table, chapter 22. Harvard University Press. (History of the term "normal distribution".) n Eric W. Weisstein et al. Normal Distribution at MathWorld. 網上材料,2006年6月3日存在。 n Marvin Zelen and Norman C. Severo (1964年). Probability Functions. Chapter 26 of Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables, ed, by Milton Abramowitz and Irene A. Stegun. National Bureau of Standards. 外部連接 Page 13 of 14常態分佈 - 維基百科,自由的百科全書 2009-6-14http://zh.wikipedia.org/w/index.php?title=%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83&variant=zh-tw&printable=yes n Interactive Distribution Modeler (incl. Normal Distribution). n basic tools for sixsigma n PlanetMath: normal random variable n GNU Scientific Library – Reference Manual – The Gaussian Distribution n Distribution Calculator – Calculates probabilities and critical values for normal, t, chi-square and F-distribution. n Inverse Cumulative Standard Normal Distribution Function n Public Domain Normal Distribution Table n Is normal distribution due to Karl Gauss? Euler, his family of gamma functions, and place in history of statistics n Maxwell demons: Simulating probability distributions with functions of propositional calculus n Normal distribution table 取自"http://zh.wikipedia.org/w/index.php?title=%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83&variant=zh-tw" 1個分類: 連續機率分佈 1個隱藏分類: 需要專業人士關注的頁面 n 本頁面最後修訂於2009年5月19日 (星期二) 22:16。 n 本站的全部文字在GNU自由文檔許可證之條款下提供(詳情)。 Wikipedia®和維基百科標誌是維基媒體基金會的註冊商標;維基™是維基媒體基金會的商標。 維基媒體基金會是在美國佛羅里達州登記的501(c)(3)免稅、非營利、慈善機構。 Page 14 of 14常態分佈 - 維基百科,自由的百科全書 2009-6-14http://zh.wikipedia.org/w/index.php?title=%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83&variant=zh-tw&printable=yes 差 维基百科,自由的百科全 标准差,在概率统计中最常使用做为统计分布程度(statistical dispersion)上的测量。标准差定义为方差的算术平方 根,反映组内个体间的离散程度。测量到分布程度的结果,原则上具有两种性质: 1. 为非负数值, 2. 与测量资料具有相同单位。 一个总量的标准差或一个随机变量的标准差,及一个子集合样品数的标准差之间,有所差别。其公式如下所列。 标准差的观念是由卡尔·皮尔逊 ( Karl Pearson ) 引入到统计中。 目录 n 1 阐述及应用 n 2 标准差的定义及简易计算公式 n 2.1 标准计算公式 n 2.2 简化计算公式 n 2.3 随机变量的标准差计算公式 n 2.4 样本标准差 n 2.5 连续随机变量的标准差计算公式 n 2.6 标准差的性质 n 3 范例 n 4 正态分布的规则 n 5 标准差与平均值之间的关系 n 6 几何学解释 n 7 外部链接 Page 1 of 8标准差 - 维基百科,自由的百科全书 2009-6-14http://zh.wikipedia.org/w/index.php?title=%E6%A8%99%E6%BA%96%E5%B7%AE&printable=yes 阐述及应用 简单来说,标准差是一组数值自平均值分散开来的程度的一种测量观念。一个较大的标准差,代表大部分的数值和其 平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。 例如,两组数的集合 {0, 5, 9, 14} 和 {5, 6, 8, 9} 其平均值都是 7 ,但第二个集合具有较小的标准差。 标准差可以当作不确定性的一种测量。例如在物理科学中,做重复性测量时,测量数值集合的标准差代表这些测量的 精确度。当要决定测量值是否符合预测值,测量值的标准差占有决定性重要角色:如果测量平均值与预测值相差太远 (同时与标准差数值做比较),则认为测量值与预测值互相矛盾。这很容易理解,因为如果测量值都落在一定数值范 围之外,可以合理推论预测值是否正确。 标准差应用于投资上,可作为量度回报稳定性的指标。标准差数值越大,代表回报远离过去平均数值,回报较不稳定 故风险越高。相反,标准差数值越细,代表回报较为稳定,风险亦较小。 标准差的定义及简易计算公式 标准计算公式 假设有一组数值 (皆为实数),其平均值为: . 此组数值的标准差为: . Page 2 of 8标准差 - 维基百科,自由的百科全书 2009-6-14http://zh.wikipedia.org/w/index.php?title=%E6%A8%99%E6%BA%96%E5%B7%AE&printable=yes 简化计算公式 上述公式可以变换为一个较简单的公式: 上述代数变换的过程如下: 随机变量的标准差计算公式 一随机变量 X 的标准差定义为: Page 3 of 8标准差 - 维基百科,自由的百科全书 2009-6-14http://zh.wikipedia.org/w/index.php?title=%E6%A8%99%E6%BA%96%E5%B7%AE&printable=yes . 须注意并非所有随机变量都具有标准差,因为有些随机变量不存在期望值。 如果随机变量 X 为 具有相同机 率,则可用上述公式计算标准差。 样本标准差 在真实世界中,除非在某些特殊情况下,找到一个总体的真实的标准差是不现实的。大多数情况下,总体标准差是通 过随机抽取一定量的样本并计算样本标准差估计的。 从一大组数值 当中取出一样本数值组合 ,常定义其样本标准差: 样本方差 s2 是对总体方差σ2的无偏估计。 s 中分母为 n - 1 是因为 的自由度为 n − 1 ,这是由于存在约束条 件 。 连续随机变量的标准差计算公式 概率密度为 p(x) 的连续随机变量 x 的标准差是: 其中 Page 4 of 8标准差 - 维基百科,自由的百科全书 2009-6-14http://zh.wikipedia.org/w/index.php?title=%E6%A8%99%E6%BA%96%E5%B7%AE&printable=yes 标准差的性质 对于常数 c 和随机变量 X 和 Y: σ(X + c) = σ(X) 其中: cov(X,Y) 表示随机变量 X 和 Y 的协方差。 范例 这里示范如何计算一组数的标准差。例如一群孩童年龄的数值为 { 5, 6, 8, 9 } : 第一步,计算平均值 . n = 4 (因为集合里有 4 个数),分别设为: 用 4 取代 N Page 5 of 8标准差 - 维基百科,自由的百科全书 2009-6-14http://zh.wikipedia.org/w/index.php?title=%E6%A8%99%E6%BA%96%E5%B7%AE&printable=yes 此为平均值。 第二步,计算标准差 用 4 取代 N 用 7 取代 Page 6 of 8标准差 - 维基百科,自由的百科全书 2009-6-14http://zh.wikipedia.org/w/index.php?title=%E6%A8%99%E6%BA%96%E5%B7%AE&printable=yes 此为标准差。 正态分布的规则 在实际应用上,常考虑一组数据具有近似于正态分布的机率分布。若其 假设正确,则约 68% 数值分布在距离平均值有 1 个标准差之内的范 围,约 95% 数值分布在距离平均值有 2 个标准差之内的范围,以及约 99.7% 数值分布在距离平均值有 3 个标准差之内的范围。称为 "68-95- 99.7 rule"。 标准差与平均值之间的关系 一组数据的平均值及标准差常常同时做为参考的依据。在直觉上,如果 数值的中心以平均值来考量,则标准差为统计分布之一"自然"的测量。 较确切的叙述为:假设 为实数,定义其公式 使用微积分,不难算出 σ(r) 在下面情况下具有唯一最小值: 深蓝区域是距平均值小于一个标准差之内的数 值范围。在正态分布中,此范围所占比率为全 部数值之 68% 。 根据正态分布,两个标准差 之内(深蓝,蓝)的比率合起来为 95% 。根 据正态分布,三个标准差之内(深蓝,蓝,浅 蓝)的比率合起来为 99% 。 Page 7 of 8标准差 - 维基百科,自由的百科全书 2009-6-14http://zh.wikipedia.org/w/index.php?title=%E6%A8%99%E6%BA%96%E5%B7%AE&printable=yes 几何学解释 从几何学的角度出发,标准差可以理解为一个从 n 维空间的一个点到一条直线的距离的函数。举一个简单的例子,一 组数据中有3个值,X1,X2,X3。它们可以在3维空间中确定一个点 P = (X1,X2,X3))。想像一条通过原点的直线 。如果这组数据中的3个值都相等,则点 P 就是直线 L 上的一个点,P 到 L 的距离为0, 所以标准 差也为0。若这3个值不都相等,过点 P 作垂线 PR 垂直于 L,PR 交 L 于点 R,则 R 的坐标为这3个值的平均数: 运用一些代数知识,不难发现点 P 与点 R 之间的距离(也就是点 P 到直线 L 的距离)是 。在 n 维空间中,这个规 律同样适用,把3换成 n 就可以了。 外部链接 n Standard Deviation Calculator 标准差计算器(英文) 取自"http://zh.wikipedia.org/w/index.php?title=%E6%A8%99%E6%BA%96%E5%B7%AE&variant=zh-cn" 2个分类: 机率与统计 | 技术分析 n 本页面最后修订于2009年5月27日 (星期三) 23:36。 n 本站的全部文字在GNU自由文档许可证之条款下提供(详情)。 Wikipedia®和维基百科标志是维基媒体基金会的注册商标;维基™是维基媒体基金会的商标。 维基媒体基金会是在美国佛罗里达州登记的501(c)(3)免税、非营利、慈善机构。 Page 8 of 8标准差 - 维基百科,自由的百科全书 2009-6-14http://zh.wikipedia.org/w/index.php?title=%E6%A8%99%E6%BA%96%E5%B7%AE&printable=yes
/
本文档为【正态分布-标准差】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索