一、估計(jì)樣本含量的意義及條件
我們?cè)诘谝还?jié)里曾提到重復(fù)的原則。所謂重復(fù),是指各處理組(對(duì)照在實(shí)驗(yàn)研究中也被看作是一種處理,而且是必不可少的)的受試對(duì)象都應(yīng)有一定的數(shù)量,例數(shù)不能太少,所以在抽樣調(diào)查、臨床觀察或?qū)嶒?yàn)研究中,首先總要考慮樣本含量(或叫樣本大小)問題。樣本太小,使應(yīng)有的差別不能顯示出來,難以獲得正確的研究結(jié)果,結(jié)論也缺乏充分的依據(jù);但樣本太大,會(huì)增加實(shí)際工作中的困難,對(duì)實(shí)驗(yàn)條件的嚴(yán)格控制也不易做到,并且造成不必要的浪費(fèi)。所以這里所說的樣本含量估計(jì),系指在保證研究結(jié)論具有一定可靠性的條件下,確定最少的觀察或?qū)嶒?yàn)例數(shù)。
但是,樣本含量又是個(gè)比較復(fù)雜的問題。要講清在各種情況下估計(jì)樣本含量的方法和原理,那是很繁雜的。而且,不同的參考書上介紹的計(jì)算公式和工具表往往不一樣,以致同一問題所得的結(jié)果也可能有出入。所以,不論按哪種公式或工具表求得的結(jié)果,也只能是個(gè)近似的估計(jì)數(shù)。
估計(jì)樣本含量,必須事先明確一些條件與要求:
。ㄒ)根據(jù)研究目的與資料性質(zhì),要先知道一些數(shù)據(jù)。例如要比較幾組計(jì)數(shù)資料,先要知道百分?jǐn)?shù)或率;要比較幾組計(jì)量資料,先要知道平均數(shù)及標(biāo)準(zhǔn)差。這些數(shù)據(jù)可從以往的實(shí)踐,預(yù)備試驗(yàn)的結(jié)果、兄弟單位的經(jīng)驗(yàn)或文獻(xiàn)資料里得來。
。ǘ)確定容許誤差。由于抽樣誤差的影響,用樣本指標(biāo)估計(jì)總體指標(biāo)常有一定的誤差,因而要確定一個(gè)樣本指標(biāo)與總體指標(biāo)相差所容許的限度。此值要求越小,所需例數(shù)就越多。
(三)確定把握度(1—β)。β是第二型錯(cuò)誤的概率;而1—β的意思是:如果兩組確有差別,則在每100次實(shí)驗(yàn)中平均能發(fā)現(xiàn)出差別來的概率。把握度可用小數(shù)(或百分?jǐn)?shù))表示,一般取0.99、0.95、0.90、0.80、0.50。要求把握度越高,則所需例數(shù)直多。
。ㄋ)確定顯著性水平,即第一型錯(cuò)誤的概率(α)。這就是希望在α=0.05的水準(zhǔn)上發(fā)現(xiàn)差別,還是希望在α=0.01的水準(zhǔn)上發(fā)現(xiàn)差別。α越少,所需例數(shù)越多。
此外,估計(jì)樣本含量時(shí)還應(yīng)當(dāng)根據(jù)專業(yè)知識(shí)確定用單側(cè)檢驗(yàn)或雙側(cè)檢驗(yàn)。同一實(shí)驗(yàn),若既可用單側(cè)檢驗(yàn)又可用雙側(cè)檢驗(yàn),則前者所需例數(shù)要少些。
二、用計(jì)算法估計(jì)樣本含量
我們運(yùn)用前面學(xué)過的某些假設(shè)檢驗(yàn)公式,就可以進(jìn)行樣本含量的計(jì)算。下面僅舉兩例略作介紹。這里的公式僅適用于α=0.05,1—β=0.50。而且都是雙側(cè)檢驗(yàn)。
。ㄒ)兩個(gè)率比較時(shí)樣本含量的計(jì)算 令n為每組所需例數(shù),P1、P2為已知的兩個(gè)率(用小數(shù)表示),P為合并的率,當(dāng)設(shè)兩組例數(shù)相等時(shí),即P=(P1+P2)/2。q=1=p,則
。11.1)
例11.5 據(jù)某院初步觀察,用甲、乙兩種藥物治療慢性氣管炎患者,近控率甲藥為45%,乙藥為25%。現(xiàn)擬進(jìn)一步試驗(yàn),問每組需觀察多少例,才可能在α=0.05的水準(zhǔn)上發(fā)現(xiàn)兩種療法近控率有顯著相差?
本例P1=0.45,P2=0.25,P=(0.45+0.25)÷2=0.25,q=1-0.35=0.65,代入式11.1
每組需觀察46人,兩組共觀察92人,注意:例數(shù)問題不同于一般數(shù)學(xué)計(jì)算中的四舍五入,凡是有小數(shù)的值,應(yīng)一律取稍大于它的正整數(shù),如本例45.5取46,若為45.1也應(yīng)取46。
。ǘ)個(gè)別比較t檢驗(yàn)樣本含量的計(jì)算 令n為所需樣本數(shù),S為差數(shù)的標(biāo)準(zhǔn)差,X為差數(shù)的均數(shù),t0.05O為t值表上相當(dāng)于P=0.05的t值,4為n足夠大時(shí)t20.05=1.962的數(shù),則
大樣本 。11.2)
小樣本 (11.3)
例11.6 用某藥治療胃及十二指腸潰瘍病人,服藥四周后胃鏡復(fù)查時(shí),患者潰瘍面平均縮小0.2cm2,標(biāo)準(zhǔn)差為0.4cm2,假定該藥確能使?jié)兠婵s小或愈合,問需多少病人作療效觀察才能在α=0.05的水準(zhǔn)上發(fā)出用藥前后相差顯著?
本例X=0.2,S=0.4,先代入式(11.2)
由于n<30,故用式(11.3)重算。當(dāng)n=16,ν=16-1=15,t0.05=2.131,
當(dāng)n=19(略大于18.16),ν=19-1=18,t0.05=2.101
當(dāng)n=18,ν =18-1=17,t0.05=2.110
故至少需用18人作療效觀察。
三、用查表法估計(jì)樣本含量
當(dāng)要求平均有80%、90%以上的機(jī)會(huì)能發(fā)出相差顯著或非常顯著時(shí),計(jì)算公式比較復(fù)雜,數(shù)理統(tǒng)計(jì)上已編制成工具表,一查便得,附表19只是其中的一部分。我們?nèi)砸郧懊娴睦}來介紹這些表的用法。
。ㄒ)兩個(gè)率比較時(shí)所需樣本含量 對(duì)于兩個(gè)率的比較,單側(cè)檢驗(yàn)可查附表19(1),雙側(cè)檢驗(yàn)查附表19(2)
仍用例11.5來說明。本例P1=45%,P2=25%,δ=45%-25%=20%,設(shè)α=0.05,把握度為0.80。如果已知甲藥療效不可能低于乙藥,可用單側(cè)檢驗(yàn),查附表19(1)。我們從“較小率”欄中找到25橫行,再從上方找到δ=20直行,基相交處,讀上行數(shù)字得69,即每組最少需要69例,兩組共需138例。
如果兩個(gè)率(或百分?jǐn)?shù))都超過50%,怎樣使用這個(gè)表呢?假定甲組陽性率是80%,乙組陽性率是65%,兩組陽性率相差15%。這時(shí)先求兩組的陰性率,于是甲組陰性率為20%,乙組陰性率為35%,兩組陰性率相差仍為15%。若用雙側(cè)檢驗(yàn),我們查附表19(2),從“較小率”欄找到20橫行,再從上方找到δ=15直行,其相交處上行數(shù)字為135,即每組需檢查135例(兩組共270例)將有80%的機(jī)會(huì)在α=0.05的水準(zhǔn)上發(fā)現(xiàn)兩組陽性率相差顯著。
若表中查不到題中的“較小率”及δ,可用最接近的值或內(nèi)插法求n,但寧可使n偏大,以免估計(jì)的樣本含量偏少。
。ǘ)個(gè)別比較t檢驗(yàn)所需的樣本含量 這是配對(duì)比較,應(yīng)查附表20。使用該表時(shí),先要求出差數(shù)的總體均數(shù)μ與總體標(biāo)準(zhǔn)差σ之比,即δ=μ/σ,當(dāng)μ與σ未知時(shí),可分別用X與S作為估計(jì)值。
仍用例11.6來說明,本例X=0.2,S=0.40,故δ=μ/σ=0.2/0.4=0.5。若設(shè)α=0.05,1—β=0.90,用雙側(cè)檢驗(yàn),查附表得20,得n=44,即需觀察44例病人。若設(shè)α=0.05,1—β=0.50,則n=18,同計(jì)算法結(jié)果一致。
。ㄈ)兩個(gè)均數(shù)比較所需樣本含量 應(yīng)查附表21。先要求出兩總體均數(shù)之差與總體標(biāo)準(zhǔn)差這比,即δ=(μ1-μ2)/σ。若μ1及μ2未知時(shí),可分別以X1及X2估計(jì)之;σ未知時(shí),可以合并標(biāo)準(zhǔn)差S估計(jì)之。
例11.7 某職業(yè)病防治所用兩種療法治療矽肺患者,一個(gè)療程后,患者血清粘蛋白下降值甲療法平均為2.6(mg%),乙療法平均為2.0(mg%,)兩種療法下降值之合并標(biāo)準(zhǔn)差為1.3(mg%)。若發(fā)現(xiàn)兩組療效相差顯著,每組至少應(yīng)觀察多少病人?
本例X1=2.6,X2=2.0,S=1.3,故δ=(μ1-μ2)/σ=(2.6-2.0)/1.3=0.46。若設(shè)α=0.05,1—β=0.50,用雙側(cè)檢驗(yàn),查附表21,δ=0.46查不到。在這種情況下,可用鄰近而略小的δ值代替,或用內(nèi)插法估計(jì)。本例若查δ=0.45,得n=39,即每組需要39例,兩組共需78例。若用內(nèi)插法計(jì)算,當(dāng)δ=0.45時(shí)所需例數(shù)是39,δ=0.50時(shí)所需例數(shù)是32,所以δ=0.46時(shí)所需例數(shù)是:
答案是:每組需要至少觀察38例,兩組共需觀察76例。