一、正態(tài)分布
。ㄒ)正態(tài)分布的圖形
將表18-1的110名20歲健康男大學生身高頻數(shù)分布繪成圖18-1中的(1),可見高峰位于中部,左右兩側(cè)大致對稱。可以設(shè)想,如果抽樣觀察例數(shù)逐漸增多,組段不斷分細,就會逐漸形成一條高峰位于中央(均數(shù)所在處)、兩側(cè)完全對稱地降低、但永遠不與橫軸相交的鐘型曲線(圖18-1中的(3)),這條曲線近似于數(shù)學上的正態(tài)分布(normal distribution)曲線。
統(tǒng)計學家按其變化參數(shù),推導出正態(tài)分布密度函數(shù)f(X)
。蓿糥<+∞公式(18.16)
式中μ為均數(shù);σ為標準差;π為圓周率;е為自然對數(shù)的底,即2.71828。以上均為常數(shù),僅X為變量。
為了應用方便,常將式(18.16)進行變量變換—u變換(即u=(X-μ)/σ),u變換后,μ=0,σ=1,使原來的正態(tài)分布變換為標準正態(tài)分布(standard normal distribution)亦稱u分布,如圖18-2。
圖18-1 頻數(shù)分布逐漸接近正態(tài)分布示意
圖18-2 正態(tài)分布與標準正態(tài)分布的面積與縱高
此時,式( 18.16)化成
- ∞<u<+∞ 公式(18.17)
式中,φ(u)為標準正態(tài)分布的密度函數(shù),即縱軸高度。
根據(jù)X和u的不同取值,分別按式(18.16)和式(18.17)可以繪出正態(tài)分布和標準正態(tài)分布的圖形(圖18-2)。
。ǘ)正態(tài)分布的特征
由式(18.16 )gn (18.17)可看出正態(tài)分布有下列特征:①正態(tài)曲線(normal curve)在橫軸上方均數(shù)處最高。②正態(tài)分布以均數(shù)為中心,左右對稱。③正態(tài)分布兩個參數(shù)(parameter),即均數(shù)μ和標準差σ;常用N(μ,σ)表示均數(shù)為μ、標準差為σ的正態(tài)分布;所以標準正態(tài)分布用N(0,1)表示。④正態(tài)曲線在±1σ處各有一人拐點。⑤正態(tài)曲線下的面積分布有一定的規(guī)律。
二、正態(tài)曲線下面積的分布規(guī)律
正態(tài)曲線下一定區(qū)間的面積可以通過對式(18.16)和式(18.17)積分求得。為了省去計算的麻煩,有人按式(18.17)編成了附表18-1“標準正態(tài)分布曲線下的面積”通過查表可求出正態(tài)曲線下某區(qū)間的面積,進而估計該區(qū)間的觀察例數(shù)占總例數(shù)的百分數(shù)或變量值落在該區(qū)間的概率。查表時應注意:①表中曲線下面積為自-∞到u的面積;②當μ,σ已知時,先根據(jù)u變換(即u=(X-μ)/σ)求得u值,再查表;③當μ,σ未知且樣本含量n足夠大時,常用樣本均數(shù)x和樣本標準差s分別代替μ和σ進行u變換[即u=(X-μ)/S],求得u的估計值,再查表;④曲線下對稱于0的區(qū)間面積相等,如區(qū)間(-∞,-1.96)與區(qū)間(1.96,+∞)的面積相等;⑤曲線下橫軸上的總面積為100%或1。
下面三個區(qū)間的面積應用較多,要求記住,并結(jié)合圖18-3理解其意義。①標準正態(tài)分布時區(qū)間(-1,1)或正態(tài)分布時區(qū)間(μ-1σ,μ+1σ)的面積占總面積的68.27%;②標準正態(tài)分布時間(-1.96,1.96)或正態(tài)分布時區(qū)間(μ-1.96,μ+1.96)的面積占總面積的95.00%;③標準正態(tài)分布區(qū)間(-2.58,2.58)或正態(tài)分布時間區(qū)(μ-2.58,μ+2.58)的面積占總面積的99.00%。
圖18-3 正態(tài)與標準正態(tài)曲線及其面積分布
三、醫(yī)學正常值范圍的估計
。ㄒ)正常值范圍(normal range)的意義
正常值是指正常人體或動物體的各種生理常數(shù),正常人體液和排泄物中某種生理、生化指標或某種元素的含量,以及人體對各種試驗的正常反應值等。由于存在變異,各種數(shù)據(jù)不僅因人而異,而且同一個人還會隨機體內(nèi)外環(huán)境的改變而改變,因而需要確定其波動的范圍,即正常值范圍。
制定正常值范圍,①首先要確定一批樣本含量足夠在的“正常人”。所謂“正常人”不是指機體任何器官、組織的形態(tài)及機能都正常的人,而是指排除了影響所研究指標的疾病的有關(guān)因素的同質(zhì)人群。②根據(jù)指標的實際用途確定單側(cè)或雙側(cè)界值:若某種指標過高或過低均屬異常,需要確定正常值范圍的下限和上限,如白細胞計數(shù);若某指標過高為異常,需確定上限,如尿鉛;若某指標過低為異常,需確定下限,如肺活量。③根據(jù)研究目的的和實用要求選定適當?shù)陌俜纸缰担S?0%、90%、95%或99%,其中最常用的是95%。④根據(jù)資料的分布特點,選用恰當?shù)慕缰涤嬎惴椒,如正態(tài)分布資料用正態(tài)分布法;對數(shù)正態(tài)分布資料用對數(shù)正態(tài)分布法;偏態(tài)分布資料用百分位數(shù)法。
。ǘ)正常值范圍估計
計算正常值百分界值的方法甚多,如正態(tài)分布法、對數(shù)正態(tài)分布法、正態(tài)概率紙法、百分位數(shù)法、曲線擬合法、容許區(qū)間法等,F(xiàn)以95%正常值范圍為例,主要介紹以下三種。
1.正態(tài)分布法:適用于正誠或近似正態(tài)分布資料。
雙側(cè)界值:x±1.96s
單側(cè)上界:x+1.645s
單側(cè)下界:x-1.645s
2.對數(shù)正態(tài)分布法:適用于對數(shù)正態(tài)分布資料。
雙側(cè)界值:lg-1(xlgx±1.96slgx)
單側(cè)上界:lg-1(xlgx+1.645slgx)
單側(cè)下界:lg-1(xlgx-1.645slgx)
3.百分位數(shù)法:常用于偏態(tài)分布資料。
雙側(cè)界值:P2.5和P97.5
單側(cè)上界:P95
單側(cè)下界:P5
例18.13 試估計表18-1中110名20歲健康男大學生身高的95%正常值范圍。
該指標計算雙側(cè)界值
x±1.96s=172.73±1.96×4.09
該指標的95%正常值范圍為 164.71~180.75(cm)
例18.14 某年某市調(diào)查了200例正常成人血鉛含量(μg/100g)如下,試估計該市成人血鉛含量95%正常值范圍單側(cè)上界。
3 | 4 | 4 | 4 | 4 | 4 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 6 | 6 | 6 | 6 |
6 | 6 | 6 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 8 | 8 | 8 | 8 |
8 | 8 | 8 | 8 | 8 | 8 | 8 | 9 | 9 | 9 | 9 | 9 | 9 | 9 | 10 | 10 | 10 | 10 | 10 | 10 |
10 | 10 | 10 | 11 | 11 | 11 | 11 | 11 | 12 | 12 | 12 | 12 | 12 | 12 | 12 | 13 | 13 | 13 | 13 | 13 |
13 | 13 | 13 | 13 | 13 | 13 | 13 | 14 | 14 | 14 | 14 | 14 | 14 | 14 | 14 | 14 | 14 | 15 | 15 | 15 |
15 | 15 | 15 | 15 | 16 | 16 | 16 | 16 | 16 | 16 | 17 | 17 | 17 | 17 | 17 | 17 | 17 | 17 | 17 | 17 |
17 | 17 | 18 | 18 | 18 | 18 | 18 | 19 | 19 | 19 | 19 | 19 | 19 | 20 | 20 | 20 | 20 | 20 | 20 | 20 |
20 | 21 | 21 | 21 | 21 | 21 | 22 | 22 | 22 | 22 | 22 | 22 | 23 | 23 | 23 | 24 | 24 | 24 | 24 | 24 |
24 | 25 | 25 | 26 | 26 | 26 | 26 | 26 | 27 | 27 | 28 | 28 | 29 | 29 | 30 | 30 | 31 | 31 | 31 | 31 |
32 | 32 | 32 | 32 | 32 | 32 | 33 | 33 | 36 | 38 | 38 | 39 | 40 | 41 | 41 | 43 | 47 | 50 | 53 | 60 |
該資料為偏態(tài)分布,經(jīng)對數(shù)變換(即原始數(shù)據(jù)取對數(shù))后,整理成頻數(shù)表,見表18-5。從頻數(shù)分布看,近似正態(tài)分布,計算對數(shù)形式的均數(shù)與標準差,得:
xlgx=Σflgx/Σf=230.0/200=1.15
其95%正常值范圍的單側(cè)上界為lg-1xlgx+1.645slgx)=lg-11。5942=39(μg/100g)
即該市正常成人血鉛含量的95%正常值為39μg/100g以下。
例18.15 試用百分位數(shù)法估計例18.14資料的95%正常值的單側(cè)上界。
該資料不經(jīng)對數(shù)轉(zhuǎn)換時為偏態(tài)分布,也可用百分位數(shù)法估計。先整理成頻數(shù)表,見表18-6。
P95=L+i/f95(n×95%-ΣfL)=38+5/7(200×95%-189)=38.7(μg/100g)
表18-5 200名血鉛值對數(shù)變換后的頻數(shù)表及gx slgx計算表
對數(shù)組段 | 頻數(shù)f | 組中值(lgX) | flgX | FlgX2 |
0.45~ | 1 | 0.5 | 0.5 | 0.25 |
0.55~ | 5 | 0.6 | 3.0 | 1.80 |
0.65~ | 10 | 0.7 | 7.0 | 4.90 |
0.75~ | 20 | 0.8 | 16.0 | 12.80 |
0.85~ | 11 | 0.9 | 9.9 | 8.91 |
0.95~ | 21 | 1.0 | 21.0 | 21.00 |
1.05~ | 29 | 1.1 | 31.9 | 35.09 |
1.15~ | 25 | 1.2 | 30.0 | 36.00 |
1.25~ | 30 | 1.3 | 39.0 | 50.07 |
1.35~ | 20 | 1.4 | 28.0 | 39.20 |
1.45~ | 16 | 1.5 | 24.0 | 36.00 |
1.55~ | 8 | 1.6 | 12.8 | 20.48 |
1.65~ | 3 | 1.7 | 5.1 | 8.67 |
1.75~1.84 | 1 | 1.8 | 1.8 | 3.24 |
合計 | 200 | 230.00 | 279.04 |
表18-6 200名血鉛值頻數(shù)表及P95計算表
組段 | 頻數(shù)f | 累計頻數(shù)Σf | 累計頻率(%) |
3~ | 36 | 36 | 18.0 |
8~ | 39 | 75 | 37.5 |
13~ | 47 | 122 | 61.0 |
18~ | 30 | 152 | 76.0 |
23~ | 18 | 170 | 85.0 |
28~ | 16 | 186 | 93.0 |
33~ | 3 | 189 | 94.5 |
38~ | 7 | 196 | 98.0 |
43~ | 1 | 197 | 98.5 |
48~ | 1 | 198 | 99.0 |
53~ | 1 | 199 | 99.5 |
58~62 | 1 | 200 | 100.0 |
附表18-1 標準正態(tài)分布曲線下的面積
[本表為自-∞到一u的面積Φ(-u),Φ(u)=1-Φ(-u)]
u | .00 | .01 | .02 | .03 | .04. | .05 | .06 | .07 | .08 | .09 |
-3.0 | .0013 | .0013 | .0013 | .0012 | .0012 | .0011 | .0011 | .0011 | .0010 | .0010 |
-2.9 | .0019 | .0018 | .0018 | .0017 | .0016 | .0016 | .0015 | .0015 | .0014 | .0014 |
-2.8 | .0026 | .0025 | .0024 | .0023 | .0023 | .0022 | .0021 | .0021 | .0020 | .0019 |
-2.7 | .0035 | .0034 | .0033 | .0032 | .0031 | .0030 | .0029 | .0028 | .0027 | .0026 |
-2.6 | .0047 | .0045 | .0044 | .0043 | .0041 | .0040 | .0039 | .0038 | .0037 | .0036 |
-2.5 | .0062 | .0060 | .0059 | .0057 | .0055 | .0054 | .0052 | .0051 | .0049 | .0048 |
-2.4 | .0082 | .0080 | .0078 | .0075 | .0073 | .0071 | .0069 | .0068 | .0066 | .0064 |
-2.3 | .0107 | .0104 | .0102 | .0099 | .0096 | .0094 | .0091 | .0089 | .0087 | .0084 |
-2.2 | .0139 | .0136 | .0132 | .0129 | .0125 | .0122 | .0119 | .0116 | .0113 | .0110 |
-2.1 | .0179 | .0174 | .0170 | .0166 | .0162 | .0158 | .0154 | .0150 | .0146 | .0143 |
-2.0 | .0228 | .0222 | .0217 | .0212 | .0207 | .0202 | .0197 | .0192 | .0188 | .0183 |
-1.9 | .0287 | .0281 | .0274 | .0268 | .0262 | .0256 | .0250 | .0244 | .0239 | .0233 |
-1.8 | .0359 | .0351 | .0344 | .0336 | .0329 | .0322 | .0314 | .0307 | .0301 | .0294 |
-1.7 | .0446 | .0436 | .0427 | .0418 | .0409 | .0401 | .0392 | .0384 | .0375 | .0367 |
-1.6 | .0548 | .0537 | .0526 | .0516 | .0505 | .0495 | .0485 | .0475 | .0465 | .0455 |
-1.5 | .0668 | .0655 | .0643 | .0630 | .0618 | .0606 | .0594 | .0582 | .0571 | .0559 |
-1.4 | .0808 | .0793 | .0778 | .0764 | .0749 | .0735 | .0721 | .0708 | .0694 | .0681 |
-1.3 | .0968 | .0951 | .0934 | .0918 | .0901 | .0885 | .0869 | .0853 | .0838 | .0823 |
-1.2 | .1151 | .1131 | .1112 | .1093 | .1075 | .1056 | .1038 | .1020 | .1003 | .0985 |
-1.1 | .1357 | .1335 | .1314 | .1292 | .1271 | .1251 | .1230 | .1210 | .1190 | .1170 |
-1.0 | .1587 | .1562 | .1539 | .1515 | .1492 | .1469 | .1446 | .1423 | .1401 | .1379 |
-0.9 | .1841 | .1814 | .1788 | .1762 | .1736 | .1711 | .1685 | .1660 | 1635 | .1611 |
-0.8 | .2119 | .2090 | .2061 | .2033 | .2005 | .1977 | .1949 | .1922 | .1894 | .1867 |
-0.7 | .2420 | .2389 | .2358 | .2327 | .2296 | .2266 | .2236 | .2206 | .2177 | .2148 |
-0.6 | .2743 | .2709 | .2676 | .2643 | .2611 | .2578 | .2546 | .2514 | .2483 | .2451 |
-0.5 | .3085 | .3050 | .3015 | .2981 | .2946 | .2912 | .2877 | .2843 | .2810 | .2776 |
-0.4 | .3446 | .3409 | .3372 | .3336 | .3300 | .3264 | .3228 | .3192 | .3156 | .3121 |
-0.3 | .3821 | .3783 | .3745 | .3707 | .3669 | .3632 | .3594 | .3557 | .3520 | .3483 |
-0.2 | .4207 | .4186 | .4129 | .4090 | .4052 | .4013 | .3974 | .3936 | .3897 | .3859 |
-0.1 | .4602 | .4562 | .4522 | .4483 | .4443 | .4404 | .4364 | .4325 | .4286 | .4247 |
-0.0 | .5000 | .4960 | .4920 | .4880 | .4840 | .4801 | .4761 | .4721 | .4681 | .4641 |