前面已提及,醫(yī)學研究中實際觀測或調(diào)查的一部分個體稱為樣本,研究對象的全部稱為總體。如作水質檢驗時從井水或河水中采的水樣,臨床化驗中從病人身上采的血液或其它活體組織標本,是樣本;而整個一口井或一條河的某一段所有的水,某病人全身所有的血液或某個組織器官,則是總體。這類總體是具體存在的,但另有些總體卻是假想的,只是理論上存在的一個范圍。例如試驗某一治療流感新藥的療效,最初接受治療的一批流感患者,不論數(shù)量多少,都只是一個樣本。若該藥療效得到肯定,從而加以推廣,那么此后凡在相同條件下接受該藥治療的所有流感患者,都屬于這個總體?墒钱敵踉囉脮r,這個總體還并不存在,是假想的。
總體包含的觀察單位通常是大量的甚至是無限的,在實際工作中,一般不可能或不必要對每個觀察單位逐一進行研究。我們只能從中抽取一部分觀察單位加以實際觀察或調(diào)查研究,根據(jù)對這一部分觀察單位的觀察研究結果,再去推論和估計總體情況。如上述某新藥治療流感例子,試驗治療的只是少數(shù)有限的病人,而結論卻要推廣到全體,得出一個該藥對所有流感患者之療效的規(guī)律性的認識。所以說,觀察樣本的目的在于推論總體,這就是樣本與總體的辯證關系。
為了使樣本能夠正確反映總體情況,對總體要有明確的規(guī)定;總體內(nèi)所有觀察單位必須是同質的;在抽取樣本的過程中,必須遵守隨機化原則;樣本的觀察單位還要有足夠的數(shù)量。
又稱機率,是用以描述某事件發(fā)生的可能性大小的一個數(shù)值。
在自然界和人類社會中,存在著兩類不同的現(xiàn)象:①在一定條件下,肯定發(fā)生的事件叫做必然事件,肯定不發(fā)生的事件叫做不可能事件。如在適當溫度濕度下經(jīng)一定時間孵化,正常受精雞蛋必然會孵出小雞來,而石頭是不可能孵出小雞來的。必然事件與不可能事件雖然形式相反,但兩者在發(fā)生某種結果與否都是確定的,故統(tǒng)稱確定性現(xiàn)象。②在基本條件不變的情況下,可能發(fā)生的結果有多種,究竟發(fā)生哪種結果,事先不能肯定,這類現(xiàn)象叫做隨機現(xiàn)象。隨機現(xiàn)象的表現(xiàn)結果稱為隨機事件。如任意拋擲一枚硬幣,可能徽花向上也可能幣值向上,拋擲前不能肯定,這是一個隨機現(xiàn)象,而結果出現(xiàn)“徵花向上”則是一個隨機事件。
(一)古典概率 是zxtf.net.cn/shiti/最簡單的隨機現(xiàn)象的概率計算。這類隨機現(xiàn)象具有兩個特征:①在觀察或試驗中它的全部可能結果只有有限個,譬如為n個,記為E1,E2,…,En,而且這些事件是兩兩互不相容的,即任何兩個事件不能同時發(fā)生;②事件E1,E2,…,En的發(fā)生或出現(xiàn)是等可能的,即它們發(fā)生的概率都一樣。古典概率的大部分問題都能形象地用摸球模型來描述。有利于直觀地理解概率論的許多基本概念;而且它有著多方面的重要應用,例如工業(yè)產(chǎn)品的抽樣檢查等。
(二)統(tǒng)計概率 上述“事件”是指不能再進行分解或不能由其它事件構成的基本事件。在實際工作中,基本事件的發(fā)生并不總是等可能的,而且有時為無窮多個。這樣就有必要把古典概率的定義加以推廣,從事后經(jīng)驗的角度來理解概率的意義。實踐證明,雖然個別隨機事件在某次試驗或觀察中可以出現(xiàn)也可以不出現(xiàn),但在大量重復試驗中它卻呈現(xiàn)出明顯的規(guī)律性。假設在相同條件下,獨立地重復做n次試驗,某隨機事件A在n次試驗中出現(xiàn)了m次,則比值m/n稱為隨機事件A在n次試驗中出現(xiàn)的頻率。當試驗重復很多次時,隨機事件A的頻率m/n就會在某個固定的常數(shù)P附近擺動,而且n愈大擺動的幅度愈小。這種規(guī)律性稱之為統(tǒng)計規(guī)律性。頻率的穩(wěn)定性說明隨機事件發(fā)生的可能性大小是隨機事件本身固有的、不隨人們意志為轉移的客觀屬性,所以在醫(yī)學科研中,當n充分大時,就以頻率作為概率的近似值,記住P(A)即
由此可見,頻率是就樣本而言的,而概率總是從總體的意義上說的。這樣,概率就為預計某一事件發(fā)生的可能性大小,提供了衡量的尺度。
例如:某病患者40名,用某療法治療后,其中35人痊愈,治愈者占治療人數(shù)的35/40,這是頻率。因為數(shù)量少,這個頻率可能波動較大。假如經(jīng)過長期的大量觀察,比如數(shù)百、數(shù)千例,得到治愈率為70%,我們就可以說,該療法治愈某病的概率近似值為70%。
又如:某院婦產(chǎn)科在一個月內(nèi)出生嬰兒30名,其中男嬰18名,占新生兒數(shù)的18/30,這叫頻率。大量統(tǒng)計表明,人口中男女的比例基本上是1:1。這是個較穩(wěn)定的常數(shù),即概率的近似值。于是,在嬰兒分娩前,我們就可用它作為尺度,預計是男的概率為1/2(0.5或50%),是女的概率也為1/2(0.5或50%)。
通過以上討論,可以知道:如果某事件是必然事件,則有m=n,所以必然事件的概率等于1;如果某事件是不可能事件,則有m=0,所以不可能事件的概率等于0;如果某事件是隨機事件,則有0<M<N,所以隨機事件的概率是介于0與1之間的一個數(shù)。某事件的概率愈接近0,表示發(fā)生的可能性愈;愈接受1,表示發(fā)生的可能性愈大。
簡單地說,是指隨機事件的數(shù)量表現(xiàn)。例如一批注入某種毒物的動物,在一定時間內(nèi)死亡的只數(shù);某地若干名男性健康成人中,每人血紅蛋白量的測定值;等等。另有一些現(xiàn)象并不直接表現(xiàn)為數(shù)量,例如人口的男女性別、試驗結果的陽性或陰性等,但我們可以規(guī)定男性為1,女性為0,則非數(shù)量標志也可以用數(shù)量來表示。這些例子中所提到的量,盡管它們的具體內(nèi)容是各式各樣的,但從數(shù)學觀點來看,它們表現(xiàn)了同一種情況,這就是每個變量都可以隨機地取得不同的數(shù)值,而在進行試驗或測量之前,我們要預言這個變量將取得某個確定的數(shù)值是不可能的。
按照隨機變量可能取得的值,可以把它們分為兩種基本類型:①離散型隨機變量,即在一定區(qū)間內(nèi)變量取值為有限個,或數(shù)值可以一一列舉出來。例如某地區(qū)某年人口的出生數(shù)、死亡數(shù),某藥治療某病病人的有效數(shù)、無效數(shù)等。②連續(xù)型隨機變量,即在一定區(qū)間內(nèi)變量取值有無限人,或數(shù)值無法一一列舉出來。例如某地區(qū)男性健康成人的身長值、體重值,一批傳染性肝炎患者的血清轉氨酶測定值等。
誤差是指實際觀察值與客觀真值之差、樣本指標與總體指標之差。誤差可分為系統(tǒng)誤差和隨機誤差。
(一)系統(tǒng)誤差 在實際觀測過程中,由于儀器未校正、測量者感官的某種障礙、醫(yī)生掌握療效標準偏高或偏低等原因,使觀察值不是分散在真值兩側,而是有方向性、系統(tǒng)性或周期性地偏離真值。這類誤差可以通過實驗設計和技術措施來消除或使之減弱,但不能靠概率統(tǒng)計辦法來消除或減弱。
(二)隨機誤差 或稱偶然誤差,是指排除了系統(tǒng)誤差后尚存的誤差。它受多種因素的影響,使觀察值不按方向性和系統(tǒng)性而隨機地變化。隨機誤差服從正態(tài)分布,可以用概率統(tǒng)計方法處理。
在隨機誤差中,最重要的是抽樣誤差。我們從同一總體中隨機抽取若干個大小相同的樣本,各樣本平均數(shù)(或率)之間會有所不同。這些樣本間的差異,同時反映了樣本與總體間的差異。它是由于從總體中抽取樣本才出現(xiàn)的誤差,統(tǒng)計上稱為抽樣誤差(或抽樣波動)。抽樣誤差在醫(yī)學生物實驗中最主要的來源是個體的變異。所以這是一種難以控制的、不可避免的誤差。但抽樣誤差是有一定規(guī)律的。研究和運用抽樣誤差的規(guī)律,是根據(jù)樣本估計總體時所必須領會的基本概念之一,也是醫(yī)學統(tǒng)計學的重要內(nèi)容之一。
隨機誤差中還包括重復誤差。它是由于對同一受試對象或檢樣采用同一方法重復測定時所出現(xiàn)的誤差。如用天平稱同一個燒杯的重量,重復測定多次,其結果會有某些波動?刂浦貜驼`差的手段主要是改進測定方法,提高操作者的熟練程度。重復是摸清實驗誤差大小的手段,以便分析和減少實驗誤差。
亦稱顯著性檢驗,其基本原理是先對總體的特征作出某種假設,然后通過抽樣研究的統(tǒng)計推理,對此假設應該被拒絕還是接受作出推斷。
生物現(xiàn)象的個體差異是客觀存在,以致抽樣誤差不可避免,所以我們不能僅憑個別樣本的值來下結論。當遇到兩個或幾個樣本均數(shù)(或率)、樣本均數(shù)(率)與已知總體均數(shù)(率)有大有小時,應當考慮到造成這種差別的原因有兩種可能:一是這兩個或幾個樣本均數(shù)(或率)來自同一總體,其差別僅僅由于抽樣誤差即偶然性所造成;二是這兩個或幾個樣本均數(shù)(或率)來自不同的總體,即其差別不僅由抽樣誤差造成,而主要是由實驗因素不同所引起的。假設檢驗的目的就在于排除抽樣誤差的影響,區(qū)分差別在統(tǒng)計上zxtf.net.cn/wsj/是否成立,并了解事件發(fā)生的概率。
進行假設檢驗時,要先建立檢驗假設(即上述第一種可能,符號是H0)與備擇假設(即上述第二種可能,符號是H1),確立檢驗水準(當檢驗假設為真,但被錯誤地拒絕的概率,記作α),通常取α=0.05或α=0.01;然后由樣本觀察值按相應的公式計算統(tǒng)計量,如X2值、t值等;最后查有關的統(tǒng)計用表確定P值范圍(有時也可直接計算P值)作出結論。若P>α,結論為按α所取水準不顯著,不拒絕H0,即認為差別很可能是由于抽樣誤差造成的,在統(tǒng)計上不成立;如果P≤α,結論為按所取α水準顯著,拒絕H0,接受H1,則認為此差別不大可能僅由抽樣誤差所致,很可能是實驗因素不同造成的,故在統(tǒng)計上成立。