標(biāo)準(zhǔn)差
A+醫(yī)學(xué)百科 >> 標(biāo)準(zhǔn)差 |
標(biāo)準(zhǔn)差(Standard Deviation) ,也稱均方差(mean square error),是各數(shù)據(jù)偏離平均數(shù)的距離的平均數(shù),它是離均差平方和平均后的方根,用σ表示。標(biāo)準(zhǔn)差是方差的算術(shù)平方根。標(biāo)準(zhǔn)差能反映一個數(shù)據(jù)集的離散程度。平均數(shù)相同的,標(biāo)準(zhǔn)差未必相同。
目錄 |
簡介
標(biāo)準(zhǔn)差也被稱為標(biāo)準(zhǔn)偏差,或者實驗標(biāo)準(zhǔn)差,公式如圖。
簡單來說,標(biāo)準(zhǔn)差是一組數(shù)據(jù)平均值分散程度的一種度量。一個較大的標(biāo)準(zhǔn)差,代表大部分?jǐn)?shù)值和其平均值之間差異較大;一個較小的標(biāo)準(zhǔn)差,代表這些數(shù)值較接近平均值。
例如,兩組數(shù)的集合 {0, 5, 9, 14} 和 {5, 6, 8, 9} 其平均值都是 7 ,但第二個集合具有較小的標(biāo)準(zhǔn)差。
標(biāo)準(zhǔn)差可以當(dāng)作不確定性的一種測量。例如在物理科學(xué)中,做重復(fù)性測量時,測量數(shù)值集合的標(biāo)準(zhǔn)差代表這些測量的精確度。當(dāng)要決定測量值是否符合預(yù)測值,測量值的標(biāo)準(zhǔn)差占有決定性重要角色:如果測量平均值與預(yù)測值相差太遠(yuǎn)(同時與標(biāo)準(zhǔn)差數(shù)值做比較),則認(rèn)為測量值與預(yù)測值互相矛盾。這很容易理解,因為如果測量值都落在一定數(shù)值范圍之外,可以合理推論預(yù)測值是否正確。
標(biāo)準(zhǔn)差應(yīng)用于投資上,可作為量度回報穩(wěn)定性的指標(biāo)。標(biāo)準(zhǔn)差數(shù)值越大,代表回報遠(yuǎn)離過去平均數(shù)值,回報較不穩(wěn)定故風(fēng)險越高。相反,標(biāo)準(zhǔn)差數(shù)值越細(xì),代表回報較為穩(wěn)定,風(fēng)險亦較小。
例如,A、B兩組各有6位學(xué)生參加同一次語文測驗,A組的分?jǐn)?shù)為95、85、75、65、55、45,B組的分?jǐn)?shù)為73、72、71、69、68、67。這兩組的平均數(shù)都是70,但A組的標(biāo)準(zhǔn)差為17.07分,B組的標(biāo)準(zhǔn)差為2.37分(此數(shù)據(jù)時在R統(tǒng)計軟件中運行獲得),說明A組學(xué)生之間的差距要比B組學(xué)生之間的差距大得多。
如是總體,標(biāo)準(zhǔn)差公式根號內(nèi)除以n
如是樣本,標(biāo)準(zhǔn)差公式根號內(nèi)除以(n-1)
因為我們大量接觸的是樣本,所以普遍使用根號內(nèi)除以(n-1)
公式意義
所有數(shù)減去其平均值的平方和,所得結(jié)果除以該組數(shù)之個數(shù)(或個數(shù)減一),再把所得值開根號,所得之?dāng)?shù)就是這組數(shù)據(jù)的標(biāo)準(zhǔn)差。
標(biāo)準(zhǔn)差的意義
標(biāo)準(zhǔn)差越高,表示實驗數(shù)據(jù)越離散,也就是說越不精確
反之,標(biāo)準(zhǔn)差越低,代表實驗的數(shù)據(jù)越精確
離散度
標(biāo)準(zhǔn)差是反應(yīng)一組數(shù)據(jù)離散程度最常用的一種量化形式,是表示精密確的最要指標(biāo)。說起標(biāo)準(zhǔn)差首先得搞清楚它出現(xiàn)的目 的。我們使用方法去檢測它,但檢測方法總是有誤差的,所以檢測值并不是其真實值。檢測值與真實值之間的差距就是評價檢測方法最有決定性的指標(biāo)。但是真實值 是多少,不得而知。因此怎樣量化檢測方法的準(zhǔn)確性就成了難題。這也是臨床工作質(zhì)控的目的:保證每批實驗結(jié)果的準(zhǔn)確可靠。
雖然樣本的真實值是不可能知道的,但是每個樣本總是會有一個真實值的,不管它究竟是多少。可以想象,一個好的檢測方法,基檢測值應(yīng)該很緊密的分散在真實值周圍。如何不緊密,那距真實值的就會大,準(zhǔn)確性當(dāng)然也就不好了,不可能想象離散度大的方法,會測出準(zhǔn)確的結(jié)果。因此,離散度是評價方法的好壞的 最重要也是最基本的指標(biāo)。
一組數(shù)據(jù)怎樣去評價和量化它的離散度呢?人們使用了很多種方法:
極差
最直接也是最簡單的方法,即最大值-最小值(也就是極差)來評價一組數(shù)據(jù)的離散度。這一方法在日常生活中最為常見,比如比賽中去掉最高最低分就是極差的具體應(yīng)用。
離均差的平方和
由于誤差的不可控性,因此只由兩個數(shù)據(jù)來評判一組數(shù)據(jù)是不科學(xué)的。所以人們在要求更高的領(lǐng)域不使用極差來評判。其實,離散度就是數(shù)據(jù)偏離平均值的程度。因此將數(shù)據(jù)與均值之差(我們叫它離均差)加起來就能反映出一個準(zhǔn)確的離散程度。和越大離散度也就越大。
但是由于偶然誤差是成正態(tài)分布的,離均差有正有負(fù),對于大樣本離均差的代數(shù)和為零的。為了避免正負(fù)問題,在數(shù)學(xué)有上有兩種方法:一種是取絕對 值,也就是常說的離均差絕對值之和。而為了避免符號問題,數(shù)學(xué)上最常用的是另一種方法--平方,這樣就都成了非負(fù)數(shù)。因此,離均差的平方和成了評價離散度 一個指標(biāo)?! ?/p>
方差(S2)
由于離均差的平方和與樣本個數(shù)有關(guān),只能反應(yīng)相同樣本的離散度,而實際工作中做比較很難做到相同的樣本,因此為了消除樣本個數(shù)的影響,增加可比性,將標(biāo)準(zhǔn)差求平均值,這就是我們所說的方差成了評價離散度的較好指標(biāo)。
樣本量越大越能反映真實的情況,而算數(shù)均值卻完全忽略了這個問題,對此統(tǒng)計學(xué)上早有考慮,在統(tǒng)計學(xué)中樣本的均差多是除以自由度(n-1),它是意思是樣本能自由選擇的程度。當(dāng)選到只剩一個時,它不可能再有自由了,所以自由度是n-1。
標(biāo)準(zhǔn)差(SD)
由于方差是數(shù)據(jù)的平方,與檢測值本身相差太大,人們難以直觀的衡量,所以常用方差開根號換算回來這就是我們要說的標(biāo)準(zhǔn)差。
在統(tǒng)計學(xué)中樣本的均差多是除以自由度(n-1),它是意思是樣本能自由選擇的程度。當(dāng)選到只剩一個時,它不可能再有自由了,所以自由度是n-1。
變異系數(shù)(CV)
標(biāo)準(zhǔn)差能很客觀準(zhǔn)確的反映一組數(shù)據(jù)的離散程度,但是對于不同的檢目,或同一項目不同的樣本,標(biāo)準(zhǔn)差就缺乏可比性了,因此對于方法學(xué)評價來說又引入了變異系數(shù)CV?! ?/p>
標(biāo)準(zhǔn)差與平均值之間的關(guān)系
一組數(shù)據(jù)的平均值及標(biāo)準(zhǔn)差常常同時做為參考的依據(jù)。在直覺上,如果數(shù)值的中心以平均值來考慮,則標(biāo)準(zhǔn)差為統(tǒng)計分布之一“自然”的測量。
定義公式:
標(biāo)準(zhǔn)差公式
1、方差s^2=[(x1-x)^2+(x2-x)^2+......(xn-x)^2]/n
2、標(biāo)準(zhǔn)差=方差的算術(shù)平方根
幾何學(xué)解釋
從幾何學(xué)的角度出發(fā),標(biāo)準(zhǔn)差可以理解為一個從 n 維空間的一個點到一條直線的距離的函數(shù)。舉一個簡單的例子,一組數(shù)據(jù)中有3個值,X1,X2,X3。它們可以在3維空間中確定一個點 P = (X1,X2,X3)。想像一條通過原點的直線 。如果這組數(shù)據(jù)中的3個值都相等,則點 P 就是直線 L 上的一個點,P 到 L 的距離為0, 所以標(biāo)準(zhǔn)差也為0。若這3個值不都相等,過點 P 作垂線 PR 垂直于 L,PR 交 L 于點 R,則 R 的坐標(biāo)為這3個值的平均數(shù):
運用一些代數(shù)知識,不難發(fā)現(xiàn)點 P 與點 R 之間的距離(也就是點 P 到直線 L 的距離)是。在 n 維空間中,這個規(guī)律同樣適用,把3換成 n 就可以了。
標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的區(qū)別
標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤都是心理統(tǒng)計學(xué)的內(nèi)容,兩者不但在字面上比較相近,而且兩者都是表示距離某一個標(biāo)準(zhǔn)值或中間值的離散程度,即都表示變異程度,但是兩者是有著較大的區(qū)別的。
首先要從統(tǒng)計抽樣的方面說起?,F(xiàn)實生活或者調(diào)查研究中,我們常常無法對某類欲進行調(diào)查的目標(biāo)群體的所有成員都加以施測,而只能夠在所有成員(即樣本)中抽取一些成員出來進行調(diào)查,然后利用統(tǒng)計原理和方法對所得數(shù)據(jù)進行分析,分析出來的數(shù)據(jù)結(jié)果就是樣本的結(jié)果,然后用樣本結(jié)果推斷總體的情況。一個總體可以抽取出多個樣本,所抽取的樣本越多,其樣本均值就越接近總體數(shù)據(jù)的平均值?! ?/p>
標(biāo)準(zhǔn)差(standard deviation, STD)
表示的就是樣本數(shù)據(jù)的離散程度。標(biāo)準(zhǔn)差就是樣本平均數(shù)方差的開平方,標(biāo)準(zhǔn)差通常是相對于樣本數(shù)據(jù)的平均值而定的,通常用M±SD來表示,表示樣本某個數(shù)據(jù)觀察值相距平均值有多遠(yuǎn)。從這里可以看到,標(biāo)準(zhǔn)差收到極值的影響。標(biāo)準(zhǔn)差越小,表明數(shù)據(jù)越聚集;標(biāo)準(zhǔn)差越大,表明數(shù)據(jù)越離散。標(biāo)準(zhǔn)差的大小因測驗而定,如果一個測驗是學(xué)術(shù)測驗,標(biāo)準(zhǔn)差大,表示學(xué)生分?jǐn)?shù)的離散程度大,更能夠測量出學(xué)生的學(xué)業(yè)水平;如果一個側(cè)樣測量的是某種心理品質(zhì),標(biāo)準(zhǔn)差小,表明所編寫的題目是同質(zhì)的,這時候的標(biāo)準(zhǔn)差小的更好。標(biāo)準(zhǔn)差與正態(tài)分布有密切聯(lián)系:在正態(tài)分布中,1個標(biāo)準(zhǔn)差等于正態(tài)分布下曲線的68.26%的面積,1.96個標(biāo)準(zhǔn)差等于95%的面積。這在測驗分?jǐn)?shù)等值上有重要作用?! ?/p>
標(biāo)準(zhǔn)誤(standard error, SE)
表示的是抽樣的誤差。因為從一個總體中可以抽取出無多個樣本,每一個樣本的數(shù)據(jù)都是對總體的數(shù)據(jù)的估計。標(biāo)準(zhǔn)誤代表的就是當(dāng)前的樣本對總體數(shù)據(jù)的估計,標(biāo)準(zhǔn)誤代表的就是樣本均數(shù)與總體均數(shù)的相對誤差。標(biāo)準(zhǔn)誤是由樣本的標(biāo)準(zhǔn)差除以樣本人數(shù)的開平方來計算的。從這里可以看到,標(biāo)準(zhǔn)誤更大的是受到樣本人數(shù)的影響。樣本人數(shù)越大,標(biāo)準(zhǔn)誤越小,那么抽樣誤差就越小,就表明所抽取的樣本能夠較好地代表樣本?! ?/p>
Excel函數(shù)
關(guān)于這個函數(shù)在EXCEL中的STDEVP函數(shù)有詳細(xì)描述,EXCEL中文版里面就是用的“標(biāo)準(zhǔn)偏差”字樣。但我國的中文教材等通常還是使用的是“標(biāo)準(zhǔn)差”。
在EXCEL中STDEVP函數(shù)是另外一種標(biāo)準(zhǔn)差,也就是總體標(biāo)準(zhǔn)差。在繁體中文的一些地方可能叫做“母體標(biāo)準(zhǔn)差”
在R統(tǒng)計軟件中標(biāo)準(zhǔn)差的程序為: sum((x-mean(x))^2)/(length(x)-1)
樣本標(biāo)準(zhǔn)差
在真實世界中,除非在某些特殊情況下,不然找到一個總體的真實的標(biāo)準(zhǔn)差是不現(xiàn)實的。大多數(shù)情況下,總體標(biāo)準(zhǔn)差是通過隨機抽取一定量的樣本并計算樣本標(biāo)準(zhǔn)差估計的?! ?/p>
應(yīng)用實例
標(biāo)準(zhǔn)差在確定企業(yè)最優(yōu)資本結(jié)構(gòu)中的應(yīng)用
資本結(jié)構(gòu)指的是企業(yè)各種資金來源的比例關(guān)系,是企業(yè)籌資活動的結(jié)果。最優(yōu)資本結(jié)構(gòu)是指能使企業(yè)資本成本最低且企業(yè)價值最大的資本結(jié)構(gòu);產(chǎn)權(quán)比率,即借入資本與自有資本的構(gòu)成比例,是反映企業(yè)資本結(jié)構(gòu)的重要變量。企業(yè)的資產(chǎn)由債務(wù)性資金和權(quán)益性資金組成,但其
風(fēng)險等級和收益率各不相同。根據(jù)投資組合理論,投資的多樣化可以分散掉一定的風(fēng)險,因此資金提供者需要決定投資于債務(wù)性資金和權(quán)益性資金的比例。以便在權(quán)衡風(fēng)險和收益的情況下保證其利益的最大化。
理論探索而外部資金提供者利益的最大化也就是企業(yè)價值的最大化,這一投資比例對于企業(yè)融資而言也就是企業(yè)的最優(yōu)資本結(jié)構(gòu)比例。
假定某企業(yè)的資金通過發(fā)行債券和股票兩種方式獲得,并且都屬于風(fēng)險性資產(chǎn)。σ其中債券的收益率為rD,風(fēng)險通過標(biāo)準(zhǔn)差σD來衡量;股票的收益率為rE,風(fēng)險為σE;股票和債券的相關(guān)系數(shù)為pDE,協(xié)方差為COV(rD,rE);債券所占的比重為wD,股票所占比重為WE(WD + WE = 1)。根據(jù)投資組合理論,企業(yè)外部投資者對該企業(yè)投資所獲的期望收益率為E(rp) = WDE(rD) + wEE(rE),方差為
1、企業(yè)債務(wù)性資金和權(quán)益性資金完全正相關(guān),即相關(guān)系數(shù)pDE為1。企業(yè)外部投資者獲得的期望收益率為E(rp) = wDE(rD) + wEE(rE),風(fēng)險標(biāo)準(zhǔn)差為σ = wDσD + wEσE,也就是組合的標(biāo)準(zhǔn)差等于各個部分標(biāo)準(zhǔn)差的加權(quán)平均值,通過投資組合不可能分散掉投資風(fēng)險。根據(jù)投資組合理論,投資組合的不同比例對于投資者而言是無差異的。
2、企業(yè)債務(wù)性資金和權(quán)益性資金完全負(fù)相關(guān),即其相關(guān)系數(shù)為-1。投資者獲得的報酬率的期望值及其方差分別為。根據(jù)投資組合理論,只有當(dāng)投資比例大于σE / (σD + σE)時其投資組合才是有效的。對于企業(yè)籌資而言,也即企業(yè)的權(quán)益性資金的比例大干σE / (σD + σE),企業(yè)的籌資比例才是有效的,而且當(dāng)組合比例為σE / (σD + σE)時,企業(yè)的籌資組合風(fēng)險為零。
3、企業(yè)債務(wù)性資金和權(quán)益性資金的相關(guān)系數(shù)大于-1小于1。理論上,一個企業(yè)的兩種籌資方式之間的相關(guān)程度較高,一方面兩種籌資方式都承擔(dān)系統(tǒng)風(fēng)險,另一方面它們也承擔(dān)相同的公司風(fēng)險。因此從實踐來看,企業(yè)的不同籌資方式間的相關(guān)程度不可能是完全的正相關(guān)和負(fù)相關(guān)。對于一個企業(yè)而言,債務(wù)性資金對企業(yè)有固定的要求權(quán),權(quán)益性資金對企業(yè)只有剩余要求權(quán),因此債務(wù)性資金的波動不可能像權(quán)益性資金的波動那么大。同時企業(yè)的風(fēng)險會同時影響企業(yè)的債務(wù)性資金和權(quán)益性資金,因此企業(yè)的債務(wù)性資金和權(quán)益性資金的相關(guān)系數(shù)不可能為負(fù)數(shù)。企業(yè)不同的籌資方式間的相關(guān)系數(shù)一般在0-1之間。
那么究竟在什么比例下企業(yè)的價值才會達到最大呢?根據(jù)投資組合理論,當(dāng)E(r1) > E(r2),且
時,才能出現(xiàn)r1,優(yōu)于r2??梢姡瑳Q定企業(yè)資本結(jié)構(gòu)的直接因素主要是不同籌資方式的收益率和風(fēng)險以及它們之間的相關(guān)系數(shù)。
關(guān)于“標(biāo)準(zhǔn)差”的留言: | 訂閱討論RSS |
目前暫無留言 | |
添加留言 |