醫(yī)學(xué)全在線
搜索更多精品課程:
熱 門:外科內(nèi)科學(xué)婦產(chǎn)科兒科眼科耳鼻咽喉皮膚性病學(xué)骨科學(xué)全科醫(yī)學(xué)醫(yī)學(xué)免疫學(xué)生理學(xué)病理學(xué)診斷學(xué)急診醫(yī)學(xué)傳染病學(xué)醫(yī)學(xué)影像藥 學(xué):藥理學(xué)藥物化學(xué)藥物分析藥物毒理學(xué)生物技術(shù)制藥生藥學(xué)中藥學(xué)藥用植物學(xué)方劑學(xué)衛(wèi)生毒理學(xué)檢 驗:理化檢驗 臨床檢驗基礎(chǔ)護 理:外科護理婦產(chǎn)科護理兒科護理 社區(qū)護理五官護理護理學(xué)內(nèi)科護理護理管理學(xué)中 醫(yī):中醫(yī)基礎(chǔ)理論中醫(yī)學(xué)針灸學(xué)刺法灸法學(xué)口 腔:口腔內(nèi)科口腔外科口腔正畸口腔修復(fù)口腔組織病理生物化學(xué):生物化學(xué)細(xì)胞生物學(xué)病原生物學(xué)醫(yī)學(xué)生物學(xué)分析化學(xué)醫(yī)用化學(xué)其 它:人體解剖學(xué)衛(wèi)生統(tǒng)計學(xué)人體寄生蟲學(xué)儀器分析健康評估流行病學(xué)臨床麻醉學(xué)社會心理學(xué)康復(fù)醫(yī)學(xué)法醫(yī)學(xué)核醫(yī)學(xué)危重病學(xué)中國醫(yī)史學(xué)
您現(xiàn)在的位置: 醫(yī)學(xué)全在線 > 精品課程 > 衛(wèi)生學(xué) > 南華大學(xué) > 正文:衛(wèi)生學(xué)電子教材:第三節(jié)  計量資料的統(tǒng)計推斷
    

衛(wèi)生學(xué)電子教材-第七章 計量資料的統(tǒng)計方法:第三節(jié) 計量資料的統(tǒng)計推斷

衛(wèi)生學(xué)電子教材第七章 計量資料的統(tǒng)計方法:第三節(jié) 計量資料的統(tǒng)計推斷:◎<一、均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤>◎<二、平均分布>◎<三、總體均數(shù)的區(qū)間分布>◎<四、假設(shè)檢驗>一、均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤本節(jié)介紹計量資料的統(tǒng)計推斷。正態(tài)分布總體有2個參數(shù)或特征量——均數(shù)μ和標(biāo)準(zhǔn)差σ,其中均數(shù)作為總體變量值的代表值,是最重要的。醫(yī)學(xué)現(xiàn)象受特定因素的影響反映在均數(shù)的變化上。例如性別和年齡對兒童身高的影響反映在兒童身高的均數(shù)的變化上。因此計量資料的統(tǒng)計推斷主要指如何由樣本統(tǒng)計量推斷總
<一、均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤><二、平均分布><三、總體均數(shù)的區(qū)間分布>
<四、假設(shè)檢驗>

一、均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤 

本節(jié)介紹計量資料的統(tǒng)計推斷。正態(tài)分布總體有2個參數(shù)或特征量——均數(shù)μ和標(biāo)準(zhǔn)差σ,其中均數(shù)作為總體變量值的代表值,是最重要的。醫(yī)學(xué)現(xiàn)象受特定因素的影響反映在均數(shù)的變化上。例如性別和年齡對兒童身高的影響反映在兒童身高的均數(shù)的變化上。因此計量資料的統(tǒng)計推斷主要指如何由樣本統(tǒng)計量推斷總體均數(shù)。

設(shè)X是均數(shù)為μ、標(biāo)準(zhǔn)差為σ的總體的變量,從總體中隨機抽取含量n的樣本,算出樣本均數(shù) ,所有可能的含量n的樣本均數(shù)構(gòu)成變量為 的總體。由于原總體中的X值存在差別,隨機抽樣每個樣本抽到的n個X值有所不同,因此樣本均數(shù)總體中的 值也存在差別。在第五章第一節(jié)已述,由抽樣造成的樣本統(tǒng)計量和相應(yīng)總體參數(shù)的差別稱為抽樣誤差,因此由抽樣造成的樣本均數(shù)和總體均數(shù)的差別稱為均數(shù)的抽樣誤差。樣本均數(shù)總體中 值的差別是抽樣誤差造成的?傮w均數(shù)μ為定值,分析樣本均數(shù) 的分布情況就可得出抽樣誤差 -μ的分布情況。下述規(guī)律是用數(shù)理統(tǒng)計理論推導(dǎo)出來的:

1.若原變量X服從正態(tài)分布,則含量n的樣本均數(shù) 也服從正態(tài)分布。即使原變量X服從偏態(tài)分布,據(jù)中心極限定理(central limit theorem),當(dāng)n足夠大時(比如n>30), 也近似服從正態(tài)分布。

2.若原變量 X的總體(不管正態(tài)或偏態(tài))均數(shù)為 μ、標(biāo)準(zhǔn)差為σ,則

從無限總體抽樣而言,從有限總體抽樣此關(guān)系近似成立)為

統(tǒng)計學(xué)中把樣本統(tǒng)計量的標(biāo)準(zhǔn)差又稱為標(biāo)準(zhǔn)誤(standard error),因此樣本均數(shù)的標(biāo)準(zhǔn)差又稱為均數(shù)的標(biāo)準(zhǔn)誤。均數(shù)的標(biāo)準(zhǔn)誤是描述均數(shù)的抽樣誤差的統(tǒng)計指標(biāo)(變異指標(biāo)),均數(shù)的標(biāo)準(zhǔn)誤越大,則均數(shù)的抽樣誤差越大(更確切地說,是抽樣誤差的波動程度越大)。

由(7·15)式可見,個體X值的標(biāo)準(zhǔn)差σ越大,均數(shù) 值的標(biāo)準(zhǔn)誤

全相同的特殊情況,即σ=0,此時不管什么樣本,樣本中n個X值相同,所

別,n越大,這種均衡作用越大。從同一總體中抽樣,總體標(biāo)準(zhǔn)差為定值,因此要減小均數(shù)的標(biāo)準(zhǔn)誤,降低抽樣誤差,只有加大樣本含量。

總體標(biāo)準(zhǔn)差σ一般是未知的,若用樣本標(biāo)準(zhǔn)差s估計,則據(jù)(7·15)例7· 17 求例7·2中10名7歲男孩體重均數(shù)的標(biāo)準(zhǔn)誤。

在例7·9中已算得s=2.6kg,故

該地10名7歲男孩體重均數(shù)的標(biāo)準(zhǔn)誤為0.8kg。

返回頂部

二、平均分布 

上節(jié)(7·14)式曾說明,若X服從正態(tài)分布N(μ,σ),作正態(tài)變量X的u轉(zhuǎn)換u=(X-μ)/σ,則標(biāo)準(zhǔn)正態(tài)變量u服從標(biāo)準(zhǔn)正態(tài)分布 N(0,1),F(xiàn)從正態(tài)總體N(μ,σ)抽取含量n的樣本均數(shù) 服從正態(tài)分布N

如果知道總體標(biāo)準(zhǔn)差,上式的u可用作為推斷總體均數(shù)的樣本檢驗統(tǒng)計量。u檢驗就是基于此式。但一般的實際情況是總體標(biāo)準(zhǔn)差σ和總體均數(shù)μ都是未知的,此時不能用u來推斷總體均數(shù)。數(shù)理統(tǒng)計學(xué)中證明,當(dāng)總體標(biāo)準(zhǔn)差未知時,可作正態(tài)變量 的t轉(zhuǎn)換

t變量為樣本zxtf.net.cn/shouyi/檢驗統(tǒng)計量,用以推斷總體均數(shù)。

個t值,所有可能的含量n的樣本t值構(gòu)成t變量的總體或t分布。

t分布只有1個參數(shù)——自由度ν,為計算t的標(biāo)準(zhǔn)差的自由度。(7·18)式t的ν=n-1,因為其s的ν=n-1。t分布曲線如圖7-3所示。橫軸為t變量,縱軸為t的概率密度f(t)。t分布曲線的特點是:以0為中心,高峰位于0處,左右兩側(cè)對稱;ν越小,t變量值的離散程度越大,曲線越扁平。t分布曲線較標(biāo)準(zhǔn)正態(tài)曲線要扁平些(高峰低些,兩尾部翹得高些),若ν=∝,則t分布曲線和標(biāo)準(zhǔn)正態(tài)曲線完全吻合。t分布曲線下的整個面積為1,t分布曲線下t從a到b(>a)的面積為t值分布在此范圍內(nèi)的百分比,即t值落在此范圍內(nèi)的概率P。對于自由度為ν的t分布,如下定義tα,v 值(取正值),稱為自由度為ν、P為α的t界值。

雙側(cè): P(t≤-tα,v)和P(t≥tα,v)為α,由于t分布以0為中心對稱,即

P(t≤-tα,v)=P(t≥tα,v)=α/2

于是有 P(-tα,v<t<tα,v)=1-α

單側(cè):P(t≤-tα,v)=α或P(t≥tα,v)=α

由上可知,單側(cè)α和雙側(cè) 2α的t界值相同,即單側(cè)tα,v=雙側(cè)t2α,v。如ν=20時,單側(cè)t0.05,20=雙側(cè)t0,10,20

根據(jù)t分布曲線下的面積計算,由ν值和α值可得出tα,v值。表7-9是常用的t界值表,橫標(biāo)目為自由度ν,縱標(biāo)目為概率P(即α)。由表7-9可見,對于相同的自由度ν,α值越小,tα,v值越大;對于相同的α值,自由度ν越大,tα,v值越小。當(dāng)ν=∝時,則tα,v=uα,故查u界值即可查ν=∝的t界值。 

要說明的是,若變量X服從偏態(tài)分布,但據(jù)中心極限定理,當(dāng)樣本含量足夠大時,其樣本均數(shù)近似服從正態(tài)分布,因此凡用u和t的推斷正態(tài)分布總體均數(shù)的統(tǒng)計方法,只要樣本含量足夠大(比如n>30),也可近似用于推斷偏態(tài)分布的總體均數(shù)。只是不對稱的偏態(tài)分布總體不宜用均數(shù)來反映其平均水平。但如果偏態(tài)分布和正態(tài)分布相差不太遠(yuǎn),用均數(shù)也不必太擔(dān)心會不恰當(dāng)。 

 

返回頂部

三、總體均數(shù)的區(qū)間估計 

由樣本統(tǒng)計量推斷總體均數(shù)有2個重要方面:區(qū)間估計(interval estimation)和假設(shè)檢驗(hypothesis testing)。先介紹總體均數(shù)的區(qū)間估計。

僅由樣本均數(shù)估計總體均數(shù)稱為點估計(point estimation)。點估計雖然簡單,但缺點是未考慮抽樣誤差?傮w均數(shù)的區(qū)間估計是由抽樣誤差規(guī)律,按一定概率(可信度)估計總體均數(shù)在哪個區(qū)間(范圍),稱為總體均數(shù)的可信區(qū)間(confidence interval)。其可信度(confidence level)要預(yù)先確定?尚哦扔1-α表示,常用的可信度為95%,如要提高可信度則可用99%。

設(shè)正態(tài)總體為N(μ,σ),從中隨機抽取含量n的樣本:X1,X2,…,Xn。要由樣本估計總體均數(shù)μ的1-α可信區(qū)間。

自由度ν=n-1的t分布,因此有

故總體均數(shù)μ的1—α可信區(qū)間為

可信區(qū)間的 2個端點值稱為可信限(confidence limit), -tα,vs 為可信區(qū)間的下限, +tα,vs 為可信區(qū)間的上限?尚艆^(qū)間是指以上、下可信限為界的一個范圍,樣本均數(shù)作為總體均數(shù)的點估計處于可信區(qū)間中心。

例7·18 由例7·2中某地10名7歲男孩體重的樣本資料,求該地7歲男孩體重均數(shù)的95%可信區(qū)間。

ν=n-1=10-1=9, 1-α=0.95,α=0.05,查t界值表得雙側(cè)t界值t0.05,9=2.262,故有

21.4±2.262×0.8=19.6~23.2(kg)

該地7歲男孩體重均數(shù)的95%可信區(qū)間為19.6~23.2kg。

可信度所指的可信區(qū)間包括總體均數(shù)的概率是事先對計算可信區(qū)間的公

的概率為95%。事后抽出樣本而得出具體的可信區(qū)間就不能那么說了,如例7·18不能說19.6~23.2kg包括總體均數(shù)的概率為95%,因為這時只有兩種情況,一是推斷正確,總體均數(shù)在該區(qū)間內(nèi);一是推斷錯誤,總體均數(shù)在該區(qū)間外。而究竟是哪種情況,又不能確定。但是依據(jù)一個事件發(fā)生的概率可作為該事件實際發(fā)生的平均頻率的道理,可得出結(jié)論:95%可信區(qū)間相當(dāng)每100個由含量相同的樣本算得的可信區(qū)間,平均有95個可信區(qū)間會包括總體均數(shù),只有5個可信區(qū)間不會包括總體均數(shù)。5%是小概率,實際發(fā)生的可能性小,因此實際應(yīng)用中就認(rèn)為總體均數(shù)在算得的可信區(qū)間內(nèi),所冒犯錯誤的風(fēng)險為5%。

可信區(qū)間估計總體均數(shù)的準(zhǔn)確度即可信度。估計總體均數(shù)的精密度用可信區(qū)間的長度(上可信限—下可信限)來衡量比較,該長度越長,精密度越低。要提高估計總體均數(shù)的精密度可用加大樣本含量來達到。因為n加大,

但在樣本含量相同的情況下,若要提高估計總體均數(shù)的準(zhǔn)確度,則必會降低精密度。因為1—α加大,則α減小,ta,n加大,可信區(qū)間的長度變長。如99%可信區(qū)間比95%可信區(qū)間精密度要低。

返回頂部

四、總體均數(shù)的假設(shè)檢驗(t檢驗) 

現(xiàn)介紹總體均數(shù)的假設(shè)檢驗(t檢驗)。

1.總體均數(shù)的假設(shè)檢驗(t檢驗)的基本思想總體均數(shù)的假設(shè)檢驗(t檢驗)有2個目的:①推斷單個總體均數(shù)μ是否等于已知總體均數(shù)μ0,設(shè)從均數(shù)為μ的總體抽取1個樣本,樣本均數(shù)為 ;②推斷兩個總體均數(shù)μ1

μ=μ0或μ12,這種情況差別相對小,稱為差別無顯著性;②除了由抽樣誤差造成外,還由總體均數(shù)的差別造成,即μ≠μ0或μ1≠μ2,這種情況差別相對大,稱為差別有顯著性。因此假設(shè)檢驗也可稱為顯著性檢驗

斷μ和μ0或μ1和μ2是否相等是目的。其檢驗統(tǒng)計量為t,故亦稱為t檢驗。檢驗的一般步驟如下(對照后例閱讀):

(1)作出總體均數(shù)(μ)或其差別(μ12)的假設(shè),確定檢驗水準(zhǔn)(α):檢驗假設(shè)(也稱無效假設(shè))為H1:μ=μ0(或μ12)。檢驗假設(shè)的對立面?zhèn)鋼窦僭O(shè)為H0,一般選用雙側(cè)μ≠μ0(或μ1≠μ2);如果某一側(cè)μ<μ0(或μ1<μ2)或μ>μ0(或μ1>μ2)憑理論或經(jīng)驗判定實際不可能存在,或無實際價值、研究者不關(guān)心,則選用單側(cè)μ>μ0(或μ1>μ2)或μ<μ0(或μ1<μ2)。給抽樣誤差概率按雙側(cè)或單側(cè)確定某個水準(zhǔn),稱為檢驗水準(zhǔn)(size of a test),亦稱顯著性水準(zhǔn)(significance level),定為小概率,一般定α=0.05,如要減小α則可定α=0.01。本書例題采用單側(cè)檢驗予以說明,采用雙側(cè)檢驗則省去說明。

(2)根據(jù)檢驗假設(shè)(H0),計算檢驗統(tǒng)計量(t)值:選用什么檢驗統(tǒng)計量,決定于總體類型和要推斷的總體參數(shù)。推斷正態(tài)總體均數(shù),當(dāng)總體標(biāo)準(zhǔn)差未知時,用t檢驗(若總體標(biāo)準(zhǔn)差已知,則用u檢驗)。根據(jù)檢驗假設(shè)所定求t值的公式計算t值。

(3)根據(jù)檢驗統(tǒng)計量(t)值,以檢驗水準(zhǔn)(α)判斷是否拒絕檢驗假設(shè)

高級職稱考試網(wǎng),可用所求得的t值以外(雙側(cè)或單側(cè))的t分布曲線以下的面積,即概率P值來衡量。表7-9的t界值表有雙側(cè)和單側(cè)的P=0.05和P=0.01,求P值可得出P>0.05、P≤0.05和P≤0.01。若t≥tα,v(由于t界值是取正值,當(dāng)求得的t值為負(fù)時,則。黷|),即P≤α,則按α水準(zhǔn)拒絕

(指雙側(cè),或μ1≠μ2)。拒絕H0所冒犯錯誤(無差別判斷為有差別)的風(fēng)險為小概率α。若t<tα,v,即P>α,由于接受H0所冒犯錯誤(有差別判斷為無差別)的概率未知,故一般說成則按α水準(zhǔn)不

(或μ1≠μ2)。

2.樣本均數(shù)和總體均數(shù)比較的t檢驗從正態(tài)總體N(μ,σ)隨機抽取含量n的樣本,推斷μ是否等于μ0(一般為理論值或標(biāo)準(zhǔn)值,如正常人該指標(biāo)的均數(shù))。作 和μ0比較的t檢驗,用(7·18)式計算t值(式中μ為μ0),ν=n-1。

例7·19 已知健康成年男子的脈搏均數(shù)為72次/分。某醫(yī)生在一山區(qū)抽樣調(diào)查了25名健康成年男子,求得其脈搏均數(shù)為74.2次/分,標(biāo)準(zhǔn)差為6.0次/分。問該山區(qū)成年男子的脈搏均數(shù)是否高于一般成年男子的脈搏均數(shù)?

已知一般成年男子脈搏數(shù)總體的均數(shù)μ0為72次/分,設(shè)山區(qū)成年男子脈搏數(shù)總體的均數(shù)為μ,假設(shè)為:

H0:μ=72次/分

H1:μ>72次/分

單側(cè)α=0.05

式有

查t界值表得P>0.05。按α=0.05水準(zhǔn)不拒絕H0,尚不能認(rèn)為山區(qū)成年男子的脈搏均數(shù)高于一般成年男子的脈搏均數(shù)。

3.配對差值均數(shù)和總體均數(shù)0比較的t檢驗推斷兩個總體均數(shù)是否相等有配對設(shè)計和成組設(shè)計,先介紹配對設(shè)計。醫(yī)學(xué)研究的配對有同源配對和異源配對。同源配對為自身對照,是同一個體的處理前和后(如病人治療的前和后)、兩種處理方法(如血液化驗的甲法和乙法)等配對或?qū)φ;異源配對是將兩個個體按一些影響研究結(jié)果指標(biāo)的因素齊同配成對子,如將性別相同、年齡、生活、勞動條件相近的兩個人配成對子,同對的兩個個體每個個體給予一種處理。配對設(shè)計資料的t檢驗相對于成組設(shè)計資料的t檢驗,如果樣本含量相同,可提高兩個總體均數(shù)差別的假設(shè)檢驗的檢驗效能(power of atest)——若兩個總體均數(shù)有差別通過假設(shè)檢驗而判別有差別的概率;如果使檢驗效能相同,則可減少樣本含量。

從正態(tài)總體N(μ1,σ1)和N(μ2,σ2)配對抽取n對變量值,配對差值d=Xd-Xd服從正態(tài)分布N(μd,σd),其中μd12,配對例7·20 用克矽平治療10名矽肺患者,治療前后血紅蛋白含量如表7-10。問矽肺患者經(jīng)克矽平治療后血紅蛋白含量是否有改變?

設(shè)矽肺患者治療后血紅蛋白含量總體的均數(shù)為μ1,原來血紅蛋白含量總體的均數(shù)為μ2,μd12,假設(shè)為:

H0:μd=0

H1:μd≠0

α=0.05今n=10,∑d=68,∑d2=2900,

據(jù)(7·20)式有

查t界值表得P>0.05。按α=0.05水準(zhǔn)不拒絕H0,尚不能認(rèn)為矽肺患者經(jīng)克矽平治療后血紅蛋白含量有改變。 

例7·21 某單位研究飲食中缺乏維生素E與肝中維生素A含量的關(guān)系,將同種屬的大白鼠按性別相同,年齡、體重相近配成8對,并將每對中的兩頭動物隨機分到正常飼料組和維生素E缺乏組,然后定期將大白鼠殺死,測得其肝中維生素A的含量如表7-11。問不同飼料的大白鼠肝中維生素A含量有無差別?

設(shè)正常飼料的大白鼠肝中維生素A含量總體的均數(shù)為μ1,維生素E缺乏的大白鼠肝中維生素A含量總體的均數(shù)為μ2,μd=μ12,假設(shè)為:

H0 :μd=0

H1:μd≠0

α=0.05今n=8,∑d=68.1,∑d2=808.67,

據(jù)(7·20)式有ν=8-1=7

查t界值表得P<0.01。按α=0.05水準(zhǔn)拒絕H0,接受H1,認(rèn)為不同飼料的大白鼠肝中維生素A含量有差別,正常飼料的較高。 

4.兩個樣本均數(shù)比較的t檢驗成組設(shè)計用t檢驗,理論上要求兩個正態(tài)總體方差(或標(biāo)準(zhǔn)差)相等。由于一群變量值都加一個常數(shù),只改變其均數(shù),而不改變其方差,可以認(rèn)為自然的或人為的特定因素對某個指標(biāo)的影響,不會改變該指標(biāo)的方差,因此在很多實際應(yīng)用情況,兩個總體方差相等或近似相等的條件常能滿足。

從正態(tài)總體N(μ1,σ)和N(μ2,σ)分別抽取含量n1和n2的樣當(dāng)μ12時的t變量為

值。

例7·22某克山病區(qū)抽樣測得11例急性克山病患者和13名健康人的血磷值如表7-12。問急性克山病患者和健康人的血磷值是否不同?

設(shè)急性克山病患者血磷值總體的均數(shù)為μ1,健康人血磷值總體的均數(shù)為μ2,假設(shè)為:

H0:μ12

H1:μ1≠μ2

α=0.05

據(jù)(7·25)式有

查t界值表得P<0.05。按α=0.05水準(zhǔn)拒絕H0,接受H1,認(rèn)為該地急性克山病患者和健康人的血磷值不同,患者較高。 

例7·23 某地抽查了25~29歲正常人群的紅細(xì)胞數(shù),其中男性156人,得均數(shù)為4.651×1012/L,標(biāo)準(zhǔn)差為0.548×1012L;女性74人,得均數(shù)為4.222×1012/L,標(biāo)準(zhǔn)差為0.442×1012L。問該人群男、女的紅細(xì)胞數(shù)有無差別?

設(shè)該人群男性紅細(xì)胞數(shù)總體的均數(shù)為μ1,女性紅細(xì)胞數(shù)總體的均數(shù)為μ2,被檢假設(shè)為:

H0:μ12

H1:μ1≠μ2

α=0.05

據(jù)(7·25)式有查t界值表(取靠近228的v=200)得P<0.01。按α=0.05水準(zhǔn)拒絕H0,接受H1,認(rèn)為該人群男、女的紅細(xì)胞數(shù)有差別,男高于女。最后說明兩個樣本幾何均數(shù)比較的t檢驗,目的是推斷兩個總體幾何均數(shù)是否相等。原

返回頂部

 



 


...
醫(yī)學(xué)全在線 版權(quán)所有© CopyRight 2006-2046, MED126.COM, All Rights Reserved
皖I(lǐng)CP備06007007號
百度大聯(lián)盟認(rèn)證綠色會員可信網(wǎng)站 中網(wǎng)驗證