生物統(tǒng)計 - 數(shù)理統(tǒng)計方法
生物統(tǒng)計(shengwu?tongji,biostatistics,biometry,biometrics)含義?應(yīng)用于中的數(shù)理統(tǒng)計方法。即用數(shù)理統(tǒng)計的原理和方法,分析和解釋生物界的種種現(xiàn)象和數(shù)據(jù)資料,以求把握其本質(zhì)和規(guī)律性。
正文
最早提出生物統(tǒng)計思想的是比利時數(shù)學(xué)家L.A.J.凱特萊,他試圖把統(tǒng)計學(xué)的理論應(yīng)用于解決生物學(xué)、醫(yī)學(xué)和社會學(xué)中的問題。1866年,G.J.孟德爾揭示了遺傳的基本規(guī)律,這是最早運用數(shù)理統(tǒng)計于生物實驗的一個成功的范例(見孟德爾定律)。1889年,F(xiàn).高爾頓在《自然的遺傳》一書中,通過對人體身高的研究指出,子代的身高不僅與親代的身高相關(guān),而且有向平均值“回歸”的趨勢,由此提出了“回歸”和“相關(guān)”的概念和算法,從而奠定了生物統(tǒng)計的基礎(chǔ)。
高爾頓的學(xué)生K.皮爾遜進一步把統(tǒng)計學(xué)應(yīng)用于生物研究,提出了實際測定數(shù)與理論預(yù)期數(shù)之間的偏離度指數(shù)即卡方差 - x的概念和算法,這在屬性的統(tǒng)計分析上起了重要作用。1899年,他創(chuàng)辦了《生物統(tǒng)計》雜志,還建立了一所數(shù)理統(tǒng)計學(xué)校。他的學(xué)生W.S.戈塞特對樣本標準差作了許多研究,并于1908年以“Student”的筆名將t-檢驗法發(fā)表于《生物統(tǒng)計》雜志上。
此后,t-檢驗法就成了生物統(tǒng)計學(xué)中的基本工具之一。英國數(shù)學(xué)家R.A.費希爾指出,只注意事后的數(shù)據(jù)分析是不夠的,事先必須作好實驗設(shè)計。他使實驗設(shè)計成了生物統(tǒng)計的一個分支。他的學(xué)生G.W.斯奈迪格把變異來源不同的均方比值稱為F值,并指出當F值大于理論上5%概率水準的F值時,該項變異來源的必然性效應(yīng)就從偶然性變量中分析出來了,這就是“方差分析法”。
上述這些方法對于農(nóng)業(yè)科學(xué)、生物學(xué)特別是遺傳學(xué)的研究,起了重大的推動作用,20世紀20年代以來,各種數(shù)理統(tǒng)計方法陸續(xù)創(chuàng)立,它們在實驗室、田間、飼養(yǎng)和臨床實驗中得到廣泛應(yīng)用并日益擴大到整個工業(yè)界。70年代,隨著計算機的普及,使本來由于計算量過大而不得不放棄的統(tǒng)計方法又獲得了新的生命力,應(yīng)用更為廣泛,并在現(xiàn)代科技中占有十分重要的地位。
無分布法
大多數(shù)統(tǒng)計分析方法都建立在“數(shù)據(jù)為正態(tài)分布”這一基本假定之上,而許多生物學(xué)數(shù)據(jù)遠非正態(tài)分布,采用無分布法可以繞過這一困難。這類方法往往比較直觀,而且計算簡便。有時,一部分 - 或全部觀測結(jié)果并不能直接用數(shù)據(jù)表示,只能用反映大小或程度的等級或秩次表示。例如,觀測結(jié)果是“-”,“±”,“+”及“++”以上,排序后的等級便是1,2,3,4……。許多很有效的無分布法就是基于數(shù)據(jù)或觀測結(jié)果的大小順序的。由于無分布法通常并不涉及數(shù)據(jù)分布的參數(shù)(如平均數(shù)),所以有時也稱為非參數(shù)方法。
生存分析
許多生物現(xiàn)象的動態(tài)觀察結(jié)果都比一次性的橫斷面觀察更能說明問題。例如:惡性腫瘤患者接受手術(shù)治療的效果,要看他們術(shù)后經(jīng)過一段時間的生存率,或者有必要描繪出在不同條件下的生存率曲線(以時間為橫軸,生存率為縱軸),以便進行分析與比較;器官移植的效果,要看異體器官在體內(nèi)正常工作和不被排斥的時間等。生存分析的用途是廣泛的。
多元分析
又稱多指標或多變量分析,是對多個觀測指標同時進行綜合性分析,所以比普通的一元統(tǒng)計分析更為全面、有效。這是40年代就已出現(xiàn)的一系列好方法。由于涉及較深的數(shù)學(xué)知識和很復(fù)雜的計算,妨礙了它們的普及,隨著計算機和統(tǒng)計軟件包的日益完善,預(yù)料多元分析不久將會成為生物科學(xué)研究的常規(guī)武器。
多重回歸是指多個自變量和一個因變量的回歸;而多元回歸是指不止一個因變量的回歸。但二者常被混淆使用。它們可用于預(yù)測、指標的綜合或自變量的篩選。判別分析是利用形如多重回歸方程的判別函數(shù)來進行個體種類的判斷或診斷。聚類分析是將許多個體或指標按它們的相似程度來歸類。對個體進行聚類稱為Q型聚類;對指標進行聚類稱為R型聚類。Q型聚類和判別分析是數(shù)量分類學(xué)的兩種基本方法。
趨勢面是以地理上的經(jīng)、緯度為自變量的高次方程,可用于繪制研究對象在地理上的分布密度的等高線圖,亦可用于預(yù)測。主成分分析的目的在于將許多彼此相關(guān)的指標變換成少數(shù)幾個彼此獨立的綜合指標,而且它們包含了原來那些指標的幾乎全部統(tǒng)計信息。因子分析的計算程序與主成分分析類似,但它不是研究指標的變換,而是分析個體間的內(nèi)在聯(lián)系,此法為心理學(xué)家所首創(chuàng),也可用于研究復(fù)雜的疾病。
統(tǒng)計模型
幾乎所有的統(tǒng)計方法都有一個數(shù)學(xué)模型作為背景。除了上述方法之外,在生物科學(xué)研究中用處較大的還有:捉放捉模型,用于個體總數(shù)的估計;對數(shù)線性模型,用于多維列聯(lián)表(即按多個指標分組的計數(shù)資料)的分析;Logit模型,既可用來同時排除多個混雜因素的影響,又可用于處理定量的混雜變量與危險因子。如果所有指標都是定性的,Logit模型就成了對數(shù)線性模型的一個特例。
參考書目
楊紀珂等:《現(xiàn)代生物統(tǒng)計》,安徽教育出版社,合肥,1985。
湯旦林:《醫(yī)用統(tǒng)計基礎(chǔ)》,人民衛(wèi)生出版社,北京,1989。
