醫(yī)學統(tǒng)計學:第二節(jié)　醫(yī)學統(tǒng)計學常用的名詞概念

<<醫(yī)學統(tǒng)計學>>目錄

一、樣本與總體前面已提及，醫(yī)學研究中實際觀測或調(diào)查的一部分個體稱為樣本，研究對象的全部稱為總體。如作水質檢驗時從井水或河水中采的水樣，臨床化驗中從病人身上采的血液或其它活體組織標本，是樣本；而整個一口井或一條河的某一段所有的水，某病人全身所有的血液或…

一、樣本與總體

前面已提及，醫(yī)學研究中實際觀測或調(diào)查的一部分個體稱為樣本，研究對象的全部稱為總體。如作水質檢驗時從井水或河水中采的水樣，臨床化驗中從病人身上采的血液或其它活體組織標本，是樣本；而整個一口井或一條河的某一段所有的水，某病人全身所有的血液或某個組織器官，則是總體。這類總體是具體存在的，但另有些總體卻是假想的，只是理論上存在的一個范圍。例如試驗某一治療流感新藥的療效，最初接受治療的一批流感患者，不論數(shù)量多少，都只是一個樣本。若該藥療效得到肯定，從而加以推廣，那么此后凡在相同條件下接受該藥治療的所有流感患者，都屬于這個總體�？墒钱敵踉囉脮r，這個總體還并不存在，是假想的。

總體包含的觀察單位通常是大量的甚至是無限的，在實際工作中，一般不可能或不必要對每個觀察單位逐一進行研究。我們只能從中抽取一部分觀察單位加以實際觀察或調(diào)查研究，根據(jù)對這一部分觀察單位的觀察研究結果，再去推論和估計總體情況。如上述某新藥治療流感例子，試驗治療的只是少數(shù)有限的病人，而結論卻要推廣到全體，得出一個該藥對所有流感患者之療效的規(guī)律性的認識。所以說，觀察樣本的目的在于推論總體，這就是樣本與總體的辯證關系。

為了使樣本能夠正確反映總體情況，對總體要有明確的規(guī)定；總體內(nèi)所有觀察單位必須是同質的；在抽取樣本的過程中，必須遵守隨機化原則；樣本的觀察單位還要有足夠的數(shù)量。

二、概率

又稱機率，是用以描述某事件發(fā)生的可能性大小的一個數(shù)值。

在自然界和人類社會中，存在著兩類不同的現(xiàn)象：①在一定條件下，肯定發(fā)生的事件叫做必然事件，肯定不發(fā)生的事件叫做不可能事件。如在適當溫度濕度下經(jīng)一定時間孵化，正常受精雞蛋必然會孵出小雞來，而石頭是不可能孵出小雞來的。必然事件與不可能事件雖然形式相反，但兩者在發(fā)生某種結果與否都是確定的，故統(tǒng)稱確定性現(xiàn)象。②在基本條件不變的情況下，可能發(fā)生的結果有多種，究竟發(fā)生哪種結果，事先不能肯定，這類現(xiàn)象叫做隨機現(xiàn)象。隨機現(xiàn)象的表現(xiàn)結果稱為隨機事件。如任意拋擲一枚硬幣，可能徽花向上也可能幣值向上，拋擲前不能肯定，這是一個隨機現(xiàn)象，而結果出現(xiàn)“徵花向上”則是一個隨機事件。

（一)古典概率　是zxtf.net.cn/shiti/最簡單的隨機現(xiàn)象的概率計算。這類隨機現(xiàn)象具有兩個特征：①在觀察或試驗中它的全部可能結果只有有限個，譬如為n個，記為E₁，E₂，…，E_n，而且這些事件是兩兩互不相容的，即任何兩個事件不能同時發(fā)生；②事件E₁，E₂，…，E_n的發(fā)生或出現(xiàn)是等可能的，即它們發(fā)生的概率都一樣。古典概率的大部分問題都能形象地用摸球模型來描述。有利于直觀地理解概率論的許多基本概念；而且它有著多方面的重要應用，例如工業(yè)產(chǎn)品的抽樣檢查等。

（二)統(tǒng)計概率　上述“事件”是指不能再進行分解或不能由其它事件構成的基本事件。在實際工作中，基本事件的發(fā)生并不總是等可能的，而且有時為無窮多個。這樣就有必要把古典概率的定義加以推廣，從事后經(jīng)驗的角度來理解概率的意義。實踐證明，雖然個別隨機事件在某次試驗或觀察中可以出現(xiàn)也可以不出現(xiàn)，但在大量重復試驗中它卻呈現(xiàn)出明顯的規(guī)律性。假設在相同條件下，獨立地重復做n次試驗，某隨機事件A在n次試驗中出現(xiàn)了m次，則比值m/n稱為隨機事件A在n次試驗中出現(xiàn)的頻率。當試驗重復很多次時，隨機事件A的頻率m/n就會在某個固定的常數(shù)P附近擺動，而且n愈大擺動的幅度愈小。這種規(guī)律性稱之為統(tǒng)計規(guī)律性。頻率的穩(wěn)定性說明隨機事件發(fā)生的可能性大小是隨機事件本身固有的、不隨人們意志為轉移的客觀屬性，所以在醫(yī)學科研中，當n充分大時，就以頻率作為概率的近似值，記住P(A)即

由此可見，頻率是就樣本而言的，而概率總是從總體的意義上說的。這樣，概率就為預計某一事件發(fā)生的可能性大小，提供了衡量的尺度。

例如：某病患者40名，用某療法治療后，其中35人痊愈，治愈者占治療人數(shù)的35/40，這是頻率。因為數(shù)量少，這個頻率可能波動較大。假如經(jīng)過長期的大量觀察，比如數(shù)百、數(shù)千例，得到治愈率為70％，我們就可以說，該療法治愈某病的概率近似值為70％。

又如：某院婦產(chǎn)科在一個月內(nèi)出生嬰兒30名，其中男嬰18名，占新生兒數(shù)的18/30，這叫頻率。大量統(tǒng)計表明，人口中男女的比例基本上是1:1。這是個較穩(wěn)定的常數(shù)，即概率的近似值。于是，在嬰兒分娩前，我們就可用它作為尺度，預計是男的概率為1/2(0.5或50％)，是女的概率也為1/2(0.5或50％)。

通過以上討論，可以知道：如果某事件是必然事件，則有m=n，所以必然事件的概率等于1；如果某事件是不可能事件，則有m=0，所以不可能事件的概率等于0；如果某事件是隨機事件，則有0<M<N，所以隨機事件的概率是介于0與1之間的一個數(shù)。某事件的概率愈接近0，表示發(fā)生的可能性愈��；愈接受1，表示發(fā)生的可能性愈大。

三、隨機變量

簡單地說，是指隨機事件的數(shù)量表現(xiàn)。例如一批注入某種毒物的動物，在一定時間內(nèi)死亡的只數(shù)；某地若干名男性健康成人中，每人血紅蛋白量的測定值；等等。另有一些現(xiàn)象并不直接表現(xiàn)為數(shù)量，例如人口的男女性別、試驗結果的陽性或陰性等，但我們可以規(guī)定男性為1，女性為0，則非數(shù)量標志也可以用數(shù)量來表示。這些例子中所提到的量，盡管它們的具體內(nèi)容是各式各樣的，但從數(shù)學觀點來看，它們表現(xiàn)了同一種情況，這就是每個變量都可以隨機地取得不同的數(shù)值，而在進行試驗或測量之前，我們要預言這個變量將取得某個確定的數(shù)值是不可能的。

按照隨機變量可能取得的值，可以把它們分為兩種基本類型：①離散型隨機變量，即在一定區(qū)間內(nèi)變量取值為有限個，或數(shù)值可以一一列舉出來。例如某地區(qū)某年人口的出生數(shù)、死亡數(shù)，某藥治療某病病人的有效數(shù)、無效數(shù)等。②連續(xù)型隨機變量，即在一定區(qū)間內(nèi)變量取值有無限人,或數(shù)值無法一一列舉出來。例如某地區(qū)男性健康成人的身長值、體重值，一批傳染性肝炎患者的血清轉氨酶測定值等。

四、誤差

誤差是指實際觀察值與客觀真值之差、樣本指標與總體指標之差。誤差可分為系統(tǒng)誤差和隨機誤差。

（一)系統(tǒng)誤差　在實際觀測過程中，由于儀器未校正、測量者感官的某種障礙、醫(yī)生掌握療效標準偏高或偏低等原因，使觀察值不是分散在真值兩側，而是有方向性、系統(tǒng)性或周期性地偏離真值。這類誤差可以通過實驗設計和技術措施來消除或使之減弱，但不能靠概率統(tǒng)計辦法來消除或減弱。

（二)隨機誤差　或稱偶然誤差，是指排除了系統(tǒng)誤差后尚存的誤差。它受多種因素的影響，使觀察值不按方向性和系統(tǒng)性而隨機地變化。隨機誤差服從正態(tài)分布，可以用概率統(tǒng)計方法處理。

在隨機誤差中，最重要的是抽樣誤差。我們從同一總體中隨機抽取若干個大小相同的樣本，各樣本平均數(shù)（或率)之間會有所不同。這些樣本間的差異，同時反映了樣本與總體間的差異。它是由于從總體中抽取樣本才出現(xiàn)的誤差，統(tǒng)計上稱為抽樣誤差（或抽樣波動)。抽樣誤差在醫(yī)學生物實驗中最主要的來源是個體的變異。所以這是一種難以控制的、不可避免的誤差。但抽樣誤差是有一定規(guī)律的。研究和運用抽樣誤差的規(guī)律,是根據(jù)樣本估計總體時所必須領會的基本概念之一，也是醫(yī)學統(tǒng)計學的重要內(nèi)容之一。

隨機誤差中還包括重復誤差。它是由于對同一受試對象或檢樣采用同一方法重復測定時所出現(xiàn)的誤差。如用天平稱同一個燒杯的重量，重復測定多次，其結果會有某些波動�？刂浦貜驼`差的手段主要是改進測定方法，提高操作者的熟練程度。重復是摸清實驗誤差大小的手段，以便分析和減少實驗誤差。

五、假設檢驗

亦稱顯著性檢驗，其基本原理是先對總體的特征作出某種假設，然后通過抽樣研究的統(tǒng)計推理，對此假設應該被拒絕還是接受作出推斷。

生物現(xiàn)象的個體差異是客觀存在，以致抽樣誤差不可避免，所以我們不能僅憑個別樣本的值來下結論。當遇到兩個或幾個樣本均數(shù)（或率)、樣本均數(shù)（率)與已知總體均數(shù)（率)有大有小時，應當考慮到造成這種差別的原因有兩種可能：一是這兩個或幾個樣本均數(shù)（或率)來自同一總體，其差別僅僅由于抽樣誤差即偶然性所造成；二是這兩個或幾個樣本均數(shù)（或率)來自不同的總體，即其差別不僅由抽樣誤差造成，而主要是由實驗因素不同所引起的。假設檢驗的目的就在于排除抽樣誤差的影響，區(qū)分差別在統(tǒng)計上zxtf.net.cn/wsj/是否成立，并了解事件發(fā)生的概率。

進行假設檢驗時，要先建立檢驗假設（即上述第一種可能，符號是H₀)與備擇假設（即上述第二種可能，符號是H₁)，確立檢驗水準（當檢驗假設為真，但被錯誤地拒絕的概率，記作α)，通常取α=0.05或α=0.01；然后由樣本觀察值按相應的公式計算統(tǒng)計量，如X²值、t值等；最后查有關的統(tǒng)計用表確定P值范圍（有時也可直接計算P值)作出結論。若P>α，結論為按α所取水準不顯著，不拒絕H₀，即認為差別很可能是由于抽樣誤差造成的，在統(tǒng)計上不成立；如果P≤α,結論為按所取α水準顯著，拒絕H₀，接受H₁，則認為此差別不大可能僅由抽樣誤差所致,很可能是實驗因素不同造成的，故在統(tǒng)計上成立。

...

上一篇文章：第三節(jié)　計數(shù)資料與計量資料

下一篇文章：第一節(jié)　醫(yī)學統(tǒng)計學及其主要內(nèi)容

醫(yī)學統(tǒng)計學:第二節(jié) 醫(yī)學統(tǒng)計學常用的名詞概念

一、樣本與總體

二、概率