查古籍
(一)概說
病例對照研究(casecontrol study)是主要用于探索病因的一種流行病學方法。它是以某人群內(nèi)一組患有某種病的人(稱為病例)和同一人群內(nèi)未患這種病但在與患病有關的某些已知因素方面和病例組相似的人(稱為對照)作為研究對象;調(diào)查他們過去對某個或某些可疑病因(即研究因子)的暴露有無和(或)暴露程度(劑量);通過對兩組暴露史的比較,推斷研究因子作為病因的可能性:如果病例組有暴露史者或嚴重暴露者的比例在統(tǒng)計學上顯著高于對照組,則可認為這種暴露與患病存在統(tǒng)計學聯(lián)系,有可能是因果聯(lián)系(圖4-1)。究竟是否是因果聯(lián)系,須根據(jù)一些標準再加以衡量判斷(詳見第七章“病因及其推斷”)。所謂聯(lián)系(associatiom)是指兩個或更多個變量間的一種依賴關系,可以是因果關系,也可以不是。
圖4-1 病例對照研究示意圖
例如,對一組肺癌病人(病例組)和一組未患肺癌但有可比性的人(對照組)調(diào)查他們的吸煙(暴露)歷史(可包括現(xiàn)在吸煙否,過去吸過煙否,開始吸煙年齡,吸煙年數(shù),最近每天吸煙支數(shù);如已戒煙則為戒煙前每日吸煙支數(shù),已戒煙年數(shù),等等)。其目的為通過比較兩組吸煙史的差別,檢驗吸煙(可疑病因)與疾?。ǚ伟┯幸蚬?lián)系的假設。這就是病例對照研究。
實例1.吸煙與肺癌的關系。
英國流行病學家A.B.Doll與R.Hill于1948~1952年進行過一項病例對照研究。他們從倫敦20所醫(yī)院及其他幾個地區(qū)選取確診的肺癌1465例。每一病例按性別、年齡組、種族、職業(yè)、社會階層等條件匹配一個對照;對照系胃癌、腸癌及其他非癌癥住院病人,也是1465例。由調(diào)查員根據(jù)調(diào)查表詢問調(diào)查。經(jīng)分析數(shù)據(jù),得到的主要結果有:①肺癌病人中不吸煙者的比例遠小于對照組:男性占0.3%,女性占31.7%;而對照組中男性不吸煙者占4.2%,女性占53.3%,差別均很顯著;②肺癌病人在病前10年內(nèi)大量吸煙者(≥25支/日)顯著多于對照組;③隨著每日吸煙量的增加,肺癌的預期死亡率。(推算出的年死亡率)也升高,例如男性45歲~64歲組日吸煙25~49支者與不吸煙者死亡率之比為2.94/0.14,即前者的率為后者的21倍;④肺癌病人與對照組比較,開始吸煙的年齡較早,持續(xù)的年數(shù)較多,而病例中已戒煙者的停吸年數(shù)也少于對照組中已戒煙者。
以后,Hill,Doll,Peto等又用前瞻性隊列研究法深入研究,經(jīng)長達20年(女性經(jīng)22年)的觀察,更加令人信服地提示出吸煙為肺癌的主要病因以及吸煙對健康的其他多種危害。他們的結論已為其他許多研究所證實,成為許多國家提倡不吸煙、限制吸煙及限制卷煙銷售政策的科學基礎。
病例對照研究是最常用的分析流行病學方法。因其需要的調(diào)查對象數(shù)目較少,人力、物力都較節(jié)省,獲得結果較快,并且可由臨床醫(yī)生在醫(yī)院內(nèi)進行。對于少見病的病因研究,常為唯一可行的方法。但這些優(yōu)點都是與前瞻性隊列研究相對而言的,實際上倘與同等規(guī)模的臨床研究或?qū)嶒炇已芯勘容^,病例對照研究所費的時間與精力可能更多。
本書以臨床醫(yī)學專業(yè)學生為主要讀者,并不要求他們能掌握或獨立應用分析流行病學方法,目標只是了解大概、擴大眼界、培養(yǎng)科學思辨能力,領會科學上獲得一個發(fā)現(xiàn)或作出一個結論的復雜過程及需要的客觀態(tài)度。
病例對照研究是從現(xiàn)在是否患有某種疾病出發(fā),回溯過去可能的原因(暴露),在時間順序上是逆向的,即是從“果”推求“因”,所以又稱回顧性調(diào)查、研究。
病例對照研究(及其他類型的流行病學研究)中所謂的暴露(exposure)是指研究對象(病例或?qū)φ眨┚哂心撤N疑為與患病與否可能有關的特征或曾受到某種疑為與患病與否可能有關的因子的影響。所謂特征(characteristic)可以是體質(zhì)上的、生理上的、也可是心理精神上的;即可以是遺傳性的也可以是獲得性的;所謂因子(因素)既可以是外界的也可以是機體內(nèi)在的;特征或因子可以是致病性的,也可以是保護性的(使人免于患病的)。因此,“暴露”是一個涵義廣泛的概念。
(二)方法
1.樣本含量的估計 為了研究一種暴露與疾病的關系需要多大一個樣本,也就是需要多少個病例和多少個對照,首先取決于4個條件:①人群中暴露者的比例;②假定暴露造成的相對危險度(其涵義詳見后文);③要求的顯著性水平;④要求的把握度。從這4個條件估算樣本的含量的方法,詳見附錄五。實際上,樣本含量還受許多因素的制約,例如病例和對照的來源、財力、人力、完成期限等。假定只有一定數(shù)目的病例與對照可以利用,則一個研究能查出的最小相對危險度是多少?又假定經(jīng)費數(shù)目已限定,則應選多少個病例與對照才能取得最大的把握度,這些都是應考慮的問題。此外,評價交互反應,控制混淆因素,亞組分析,每例多個對照等均影響所需樣本的大小。
2.病例和對照的來源與選擇
(1)病例:主要有兩種來源:①從醫(yī)院病人選擇,即是從某一所或若干所醫(yī)院選擇某時期內(nèi)就診或住院的某種病的全部病例。病例應符合統(tǒng)一的、明確的診斷標準。最好是新發(fā)生的(新診斷的)病例。因為一種病的全部病例不大可能都有進入某一所或幾所醫(yī)院的同等機會,能進入的只是其中符合條件(即選擇因素)的那一部分,所以不要求能代表某時某地的全部病例,但應要求能代表產(chǎn)生病例的人群,即該人群只要發(fā)生該種病例均可能進入該院。這樣,結果的普遍性雖受限,但真實性不受影響,而真實性是普遍性的前提。這種研究稱為以醫(yī)院為基礎的(hospital-based)病例對照研究;②從某特定人群選擇病例,即是以符合某一明確規(guī)定的人群在某時期內(nèi)(一年或幾年,視病例發(fā)生多少而定)的全部病例或當病例數(shù)過多時以其中的一個隨機樣本作為研究對象。其優(yōu)點是選擇偏倚比前一種來源的小,結論推及該人群的可信程度較高。這種研究稱為以人群為基礎的(population-based)病例對照研究。
(2)對照:設立對照的目的在于估計如果疾病與暴露無聯(lián)系,則病例組的暴露率可能為多少,也就是為比較提供一個基準。因此,對照與病例在一些主要方面必須具可比性。首先,對照必須從病例所來自的人群選擇,對照是有可能成為病例的人,換言之,每一病例在未發(fā)病前應該是合格的對照,而每一對照若發(fā)病都有可能成為病例組的成員。對照選擇是否恰當是病例對照研究成敗關鍵之一。
通常的做法是:如果病例組來自某一特定人群,則可以該人群的非病例(即未患該種疾病的人)的一個隨機樣本作對照;如果病例來自某所醫(yī)院,則可從同醫(yī)院同時就診或住院的其他病例中選擇對照。要求對照具有和病例一致的某些特征,即對照與病例有可比性,例如性別、年齡、居住地等;同時要求對照沒有患和研究因子與研究疾病有關的其他疾病的可能。例如,研究吸煙與肺癌的關系時,不能以慢性支氣管炎病人為對照,因為吸煙同時是這兩種病的可能病因;研究胃癌的病因不能以“慢性胃炎”病人為對照,因為這兩種病在病因上有密切關系,前者可能是后者在病因鏈上的一環(huán)。上述要求的目的都是減少混淆偏倚。其他來源的對照如病例的鄰居、同事、親屬等。各種不同來源的對照要解決的問題不同,都各有其局限性。例如,鄰居對照可控制社會經(jīng)濟地位的混淆作用,兄弟姊妹對照是考慮控制早期環(huán)境的影響和遺傳因素的混淆作用(極端要求為用同卵孿生),配偶對照是主要考慮成年期環(huán)境的影響。最常采用的方式是對照和病例都選自同一醫(yī)院,因為理論上他們都來自該醫(yī)院所服務的同一人群,而且對兩者都可在相同的環(huán)境中進行調(diào)查,也易于合作。但是由于不同病種的患者入院的機會不同,有可能使本來與某病無關的特征在醫(yī)院病例中表現(xiàn)出虛假的聯(lián)系(詳見第七章“病因及其推斷”)。為了減少這種偏倚發(fā)生的可能性,應該選取多種疾病而不是一種疾病的病人作對照。
3.病例與對照的配合 設置對照的作用在于平衡除了研究因子(暴露)以外的其他可能影響患病的因素,也就是說如果暴露與所研究的疾病不存在聯(lián)系的話,病例的暴露比例(率)應該與對照的無顯著差別;如果發(fā)現(xiàn)顯著差別,既然對照與病例在其他有關方面都可比較,因此可以推斷患病與否可能是與暴露率的差別有聯(lián)系。為使兩者具可比性,首先可以通過限制選擇病例與對照的范圍(例如年齡范圍、性別、種族等),使有關因子盡可能齊同。病例組與對照組的某些特征不應存在顯著差別,即應該均衡。
另一個選擇對照的重要方法叫匹配(matching,曾譯“配比”),又稱匹配抽樣(matchedsampling),就是在安排病例與對照時,使兩者的某些特征或變量相一致。具體做法有兩種:一種叫成組匹配或頻數(shù)匹配,即在選擇好一組病例之后,在選擇對照組時要求其某些特征或變量的構成比例與病例組的一致(即在兩組的總體分布一致),例如性別、年齡構成一致,具體做法上類似分層抽樣。另一種做法叫個別匹配,就是以每一病例為單位,選擇少數(shù)幾個特征或變量方面與病例一致的一個或幾個對照者組成一個計數(shù)單位或計數(shù)和分析單位。一個病例匹配一個對照的(即1:1匹配)一般稱為配對,也就是說由一個病例和一個對照組成對子(pair)為一個計數(shù)單位。
個別匹配,特別是1:1匹配,最常被采用。理論上,一個病例可以匹配多個對照,但研究證明病例與對照之比超過1:4時,統(tǒng)計效率不會明顯增加,但工作量卻增大。如果病例與對照來源都充足,調(diào)查費用又差不多,則以1:1匹配最合適;如果病例數(shù)有限而對照易得,則可采用一個病例匹配幾個對照的辦法以提高統(tǒng)計效率(例如實例2)。
在病例對照研究中采用匹配的目的,首先在于提高研究效率(study efficiency),表現(xiàn)為每一研究對象提供的信息量的增加。匹配后再按匹配的因素進行分層分析,可使每一個匹配層中都有一定數(shù)目的病例與對照,不至于因有的層只有病例有的層只有對照而無法對比,不能提供信息。其次,在于控制混淆因素的作用。所以匹配的特征或變量必須是已知的混淆因子,至少也應有充分的理由這樣懷疑,否則不應匹配。
無論是否采用匹配設計,為控制混淆作用都須在分析階段用分層、標準化或多元分析,但匹配后再按匹配因素作分層分析可以提高分析的效率,也就是提高了控制混淆因素的效率。
但是匹配也要付出代價:匹配增加了尋找對照的速度,以同樣的低價也許可以得到更多不匹配的對照,從而擴大樣本含量。從這個意義上說,匹配又降低了研究效率。增加匹配項目又會導致可能作為對照者的減少,無法找到可匹配對照的病例只得被剔除;一個項目一經(jīng)匹配不但使它與疾病的關系不能分析而且使它與其他研究因子的交互作用也不能充分分析。把不必要的項目列入匹配,企圖使病例與對照盡量一致,如果匹配的因素與暴露有聯(lián)系,就可能人為地造成更多的病例與對照暴露史一致的對子,徒然丟失信息,增加工作難度的結果反而是降低了研究效率。這種情況稱為匹配過度(over-matching),應注意避免。
匹配的變量應一致到什么程度,取決于變量的性質(zhì)、實際可能與必要:離散變量(即屬性,無中間值的變量)可以完全匹配,連續(xù)變量(在一定范圍內(nèi)可取任何值的變量)往往劃分為若干類或組,再按此匹配。例如按年齡分組、按血壓分組、按吸煙量分組匹配。分得太細,會增加工作難度,也不一定必要,例如年齡要求同歲;但分得太粗,例如年齡按10歲分組,又達不到控制混淆作用的目的。
當估計有許多可能的混淆因素需要控制時,倘僅靠分層則因?qū)訑?shù)太多不能保證每層均有病例與對照,所以采用匹配以保證有效的分層分析。其次,有的列名變量包含許多類別或內(nèi)容復雜(例如職業(yè)、種族、居住地、籍貫、兄弟姊妹等),如是可能的混淆因子,應加匹配。否則單靠分層不能控制混淆作用。
匹配可保證對照與病例在某些重要方面的可比性。對于小樣本研究以及因為病例的某種構成(例如年齡、性別構成)特殊,隨機抽取的對照組很難與之平衡時,個別匹配最為有用。
一般除性別、年齡之外,對于其他因素是否列入匹配須持慎重態(tài)度,以防止匹配過頭及徒增費用和延長完成時間。
4.計劃和執(zhí)行 病例對照研究在制訂計劃和執(zhí)行時應注意以下問題:
(1)主要假設的說明是否清楚、簡明而且可以檢驗?
(2)疾病與暴露變量的定義清楚、明確否?
(3)是否擬探索劑量反應關系和多個危險因素的聯(lián)合作用?
(4)為解答問題所需之病例數(shù)和對照數(shù)能否得到?這樣大小的樣本能查出的最小相對危險度是多少?與估計的相差多少?[參考附錄五(四)節(jié)]。
(5)病例來源及抽樣技術明確否?病例數(shù)與對照數(shù)之比是多少?匹配否及匹配哪些變量?
(6)調(diào)查表(問卷)是否已包括打算測量的所有變量并能夠收集到需要的數(shù)據(jù)?其詳盡程度是否已足供分析之用?
(7)醫(yī)院記錄(病歷)及其他來源的信息、從體檢、實驗室檢查、病理切片等獲得的數(shù)據(jù)需表格記錄否?
(8)調(diào)查表經(jīng)過試用否?其真實度與可靠度(重復性)經(jīng)評估否?訪問時擬使用幫助回憶的實物、模型或圖片否?
(9)調(diào)查員、質(zhì)控員、病歷摘錄員、編碼員的工作手冊已編好否?須專門培訓否?
(10)組織機構、人員、設備、經(jīng)費落實否?
(11)協(xié)作單位有書面協(xié)議否?有關領導機關已批準否?將診斷根據(jù)(切片、標本、影像圖片等)送到主持單位復核安排妥當否?
(12)實驗室檢驗項目或用儀器檢測的項目所用儀器、方法、試劑是否符合標準?結果的真實度與可靠度經(jīng)過考核否?
(13)經(jīng)治醫(yī)院、醫(yī)生是否同意提供病例和對照?是否必須取得研究對象在了解情況后的書面同意?資料、數(shù)據(jù)怎樣保密?怎樣保存?
5.數(shù)據(jù)分析 須分析什么項目,計算哪些統(tǒng)計量,用什么統(tǒng)計學方法,用手工(計算器)還是計算機,如用后者怎樣建數(shù)據(jù)庫和用什么軟件包,等等,都應包括在設計之中,手工計算時還應擬好相應表格?,F(xiàn)在計算機及統(tǒng)計軟件包的應用漸趨普及,過去很難進行的一些復雜的統(tǒng)計檢驗現(xiàn)在很快就可完成并打印出結果還可繪出統(tǒng)計圖。但是,一些流行病學專家主張先用手工計算基本內(nèi)容以熟悉數(shù)據(jù),然后再由計算機作復雜運算(多元分析)。
本節(jié)要介紹的是基本原理和基本方法,無論用手工或機器運算,這些都是應熟悉的。
病例對照研究數(shù)據(jù)分析的中心內(nèi)容是比較病例和對照中暴露的比例并由此估計暴露與疾病的聯(lián)系程度,并估計差別與聯(lián)系由隨機誤差造成的可能性有多大,特別要排除由于混淆變量未被控制而造成虛假聯(lián)系或差異的可能。進一步,還可計算暴露與疾病的劑量反應關系,各因子的交互作用(對一種因子的暴露會不會影響對另一種因子的效應),等等。非匹配和匹配設計的研究,數(shù)據(jù)的分析方法有一些不同。
(1)非匹配數(shù)據(jù)的分析:首先要檢驗病例組與對照組在某些主要特征(即可能成為混淆因子的特征)的構成上是否沒有顯著差別(均衡性檢驗)。
1)聯(lián)系的顯著性與聯(lián)系強度:某個因素與某種結局(患病或死亡)之間的聯(lián)系是否有統(tǒng)計學顯著性,常用χ2檢驗。最簡單的情況是因素與結局都只分為“有”或“無”兩類,數(shù)據(jù)可納入一張2×2表(即四格表,又稱四格列聯(lián)表),例如表4-1。χ2檢驗可用四格表專用公式(式4-1)。但χ2值的大小并不表示聯(lián)系的強度。χ2≥3.84時,設兩者無聯(lián)系的假設(無效價設,H)被否定,而轉向存在聯(lián)系的假設(備擇假設,HA),這個判斷錯誤的可能性為≤0.05(即ρ≤0.05)。χ2值越大,判斷錯誤的可能性越小。
表4-1 危險因子與疾病的聯(lián)系
統(tǒng)計學顯著性可以評價在多大程度上可用機會解釋所觀察到的聯(lián)系。但如數(shù)據(jù)本身存在系統(tǒng)誤差,統(tǒng)計學顯著性檢驗就無意義,因為它不能區(qū)別聯(lián)系的真或假(由偏倚、混淆所致的聯(lián)系)。此外,統(tǒng)計學顯著性檢驗結果極大地受樣本含量的影響,樣本小則隨機變異大;即使實際上暴露的作用很大,也會導致“不顯著”的結論。所以“不顯著”應理解為“不足以否定無效假設”。
(式4-1)
現(xiàn)況調(diào)查和隊列研究(見本章“二、隊列研究”)可以計算暴露者(或具某特征者)和未暴露者(或不具某特征者)的患病率或發(fā)病率,因為分子數(shù)與分母數(shù)是已知的。也可以計算相對危險度(見本章公式4-11)。這是聯(lián)系強度的一個指標。
但是病例對照研究因為不能計算出患病率或發(fā)病率所以不能計算相對危險度,但可用另一個聯(lián)系強度指標——比數(shù)比(odds ratio,又譯比,值比、優(yōu)勢比,縮寫為OR)。比數(shù)比是兩個比數(shù)之比。比數(shù)(odds)是表示一個事件發(fā)生機會大小的一種指標。以表4-1為例(字母代表數(shù)目),如果是隊列研究與現(xiàn)況調(diào)查,可以計算發(fā)病(或患?。┍葦?shù),暴露組的這個比數(shù)為α/c,未暴露組的這個比數(shù)為b/d。如果是病例對照研究,可以計算暴露比數(shù),在病例組是α/b,在對照組是c/d。兩組比數(shù)之比稱為比數(shù)比,
OR =(α/b)/(c/d)=αd/bc
或
OR =(α/c)/(b/d)= αd/bc.(式4-2)
這個比正好是四格表中兩條對角線上四個數(shù)字的交叉乘積αd與bc之比,所以四格表數(shù)據(jù)的OR又稱交叉乘積比。OR可用于隊列研究,但更重要的是用于病例對照研究。在少見病,OR可以當作RR去解釋,即OR近似于RR。因在此情況下總體內(nèi)不論暴露組或未暴露組中患病者的人數(shù)(分別記為A與B,用大寫字母區(qū)別于樣本數(shù)據(jù)的小寫字母)都遠少于未患病者的人數(shù)(C與D),所以在總體內(nèi)A+C→C,B+D→D,于是
因為從隨機樣本的α/c與b/d可以估計A/C或B/D,所以可用αd/bc估計AD/BC,也就是說可以用OR作為RR的估計值。
暴露組與未暴露組的發(fā)病率或死亡率之比稱為率比(rate ratio)。兩組發(fā)病概率之比稱為危險度比(risk ratio)。在少見病,這兩個比和比數(shù)比均近似,可統(tǒng)稱為相對危險度。
從OR(或RR)值可估計暴露與疾病的聯(lián)系程度。這種聯(lián)系的穩(wěn)定性,即隨機變異的大小可用顯著性檢驗的ρ值和可信限來估計。OR是用來估評暴露與疾病的聯(lián)系程度或即暴露作用強度的一個點估計值(0~∞),但為估計這個值受隨機變異影響的程度,最好同時算出可能包括真值(參數(shù))的一個取值范圍,表示以一定程度的信心估計參數(shù)值所在的范圍,稱為可信限或可信區(qū)間(confidence interval)。計算方法詳見附錄五。如果可信限包括了無效值(OR=1),說明該聯(lián)系無顯著性;可信限的寬度又反映點估計值(OR)的穩(wěn)定性,范圍寬說明估計值不穩(wěn)定,也就是隨機變異程度大。所以現(xiàn)在認為僅計算出點估計值的意義有限,應同時計算出其可信限。
2)分層數(shù)據(jù)分析:病例對照研究在設計階段可采用的控制混淆因素的方法有限制與匹配。限制是指對采用研究對象的范圍加以限制,如混淆因素為列名變量(離散變量)可限定只采用某一類或幾類對象(例如性別、職業(yè)、地區(qū)等),如為連續(xù)變量可限定只采用某一范圍內(nèi)(例如年齡組、段)的對象。其目的都是得到比較勻質(zhì)的研究對象。如果一個因素在各對象間無差別或差別很小,它就不可能起到混淆作用,也就是得到了控制??稍诜治鲭A段采用的控制混淆因素的方法有分層、標準化和多元分析。其中以分層分析最常用。
分層就是把樣本按照一個或更多個混淆因子的暴露有無或作用程度而劃分為若干個組,也就是“層”,再分別在每一層內(nèi)分析所研究暴露與疾病的聯(lián)系,計算各層的比數(shù)比(記為OR);
表4-2 第i層內(nèi)病例與對照按暴露有無分組
如果各層 具有齊性[齊性檢驗方法見附錄五(一)],則可以計算總的即各層OR的合并OR。因其方法系Mantel與Haenszel兩人所開發(fā),所以通常記作ORMH。因在同一層內(nèi)作為分層標志的因子對病例組與對照組的作用都是相同的,所以對所研究的暴露與疾病的聯(lián)系便不會發(fā)生混淆作用。其原理與匹配相同,實際上1:1匹配就是一種最細的分層,每層只包括一個病例與一個對照。合并OR是概括各層OR的一個指標。
合并OR的計算方法:
(式4-3)
ORMH可信限的計算方法及計算實例見附錄五(一)。
ORMH如果不等于1,那么與1的差異是否顯著?可用作顯著性檢驗,其方法如下:
(式4-4)
式中,ai=各層四格表中的a數(shù)值,
檢驗假設(即無效假設)Ho:OR=1,雙側備擇假設HA:OR≠1。統(tǒng)計量X2MH呈自由度為1的X2分布。
分層分析法舉例:某地進行了一次食管癌病因的病例對照研究,共調(diào)查病例200例,人群對照776例。現(xiàn)分析其中飲酒與食管癌的聯(lián)系,結果如表4-3。
表4-3 飲酒與食管癌的聯(lián)系
OR=6.11 χ2=84.29
可見飲酒與食管癌有強聯(lián)系,但已知吸煙與食管癌也有強聯(lián)系。為了分析飲酒與食管癌顯示出的強聯(lián)系是否可能與吸煙有關,或吸煙是否可能是一個混淆因子,可采用分層分析:按是否吸煙分為兩組,再分析飲酒與食管癌的聯(lián)系,結果見表4-4。
表4-4 飲酒與食管癌在吸煙與不吸煙者的聯(lián)系
OR=10.3 χ2=53.99 OR=3.70 χ2=24.62
計算ORMH,先用公式(4-3)計算
再用公式(4-4)作χ2檢驗:
χ2MH=76.84
ρ
《儒門事親》(公元 1228 年? )金.張從正(子和、戴人)。十五卷。主張治療用汗吐下三法,用要偏于寒涼,但在攻邪方面有其長處。
CopyRight ©2019-2025 學門教育網(wǎng) 版權所有
網(wǎng)站備案/許可證號:魯ICP備19034508號-2
(一)概說
病例對照研究(casecontrol study)是主要用于探索病因的一種流行病學方法。它是以某人群內(nèi)一組患有某種病的人(稱為病例)和同一人群內(nèi)未患這種病但在與患病有關的某些已知因素方面和病例組相似的人(稱為對照)作為研究對象;調(diào)查他們過去對某個或某些可疑病因(即研究因子)的暴露有無和(或)暴露程度(劑量);通過對兩組暴露史的比較,推斷研究因子作為病因的可能性:如果病例組有暴露史者或嚴重暴露者的比例在統(tǒng)計學上顯著高于對照組,則可認為這種暴露與患病存在統(tǒng)計學聯(lián)系,有可能是因果聯(lián)系(圖4-1)。究竟是否是因果聯(lián)系,須根據(jù)一些標準再加以衡量判斷(詳見第七章“病因及其推斷”)。所謂聯(lián)系(associatiom)是指兩個或更多個變量間的一種依賴關系,可以是因果關系,也可以不是。
圖4-1 病例對照研究示意圖
例如,對一組肺癌病人(病例組)和一組未患肺癌但有可比性的人(對照組)調(diào)查他們的吸煙(暴露)歷史(可包括現(xiàn)在吸煙否,過去吸過煙否,開始吸煙年齡,吸煙年數(shù),最近每天吸煙支數(shù);如已戒煙則為戒煙前每日吸煙支數(shù),已戒煙年數(shù),等等)。其目的為通過比較兩組吸煙史的差別,檢驗吸煙(可疑病因)與疾?。ǚ伟┯幸蚬?lián)系的假設。這就是病例對照研究。
實例1.吸煙與肺癌的關系。
英國流行病學家A.B.Doll與R.Hill于1948~1952年進行過一項病例對照研究。他們從倫敦20所醫(yī)院及其他幾個地區(qū)選取確診的肺癌1465例。每一病例按性別、年齡組、種族、職業(yè)、社會階層等條件匹配一個對照;對照系胃癌、腸癌及其他非癌癥住院病人,也是1465例。由調(diào)查員根據(jù)調(diào)查表詢問調(diào)查。經(jīng)分析數(shù)據(jù),得到的主要結果有:①肺癌病人中不吸煙者的比例遠小于對照組:男性占0.3%,女性占31.7%;而對照組中男性不吸煙者占4.2%,女性占53.3%,差別均很顯著;②肺癌病人在病前10年內(nèi)大量吸煙者(≥25支/日)顯著多于對照組;③隨著每日吸煙量的增加,肺癌的預期死亡率。(推算出的年死亡率)也升高,例如男性45歲~64歲組日吸煙25~49支者與不吸煙者死亡率之比為2.94/0.14,即前者的率為后者的21倍;④肺癌病人與對照組比較,開始吸煙的年齡較早,持續(xù)的年數(shù)較多,而病例中已戒煙者的停吸年數(shù)也少于對照組中已戒煙者。
以后,Hill,Doll,Peto等又用前瞻性隊列研究法深入研究,經(jīng)長達20年(女性經(jīng)22年)的觀察,更加令人信服地提示出吸煙為肺癌的主要病因以及吸煙對健康的其他多種危害。他們的結論已為其他許多研究所證實,成為許多國家提倡不吸煙、限制吸煙及限制卷煙銷售政策的科學基礎。
病例對照研究是最常用的分析流行病學方法。因其需要的調(diào)查對象數(shù)目較少,人力、物力都較節(jié)省,獲得結果較快,并且可由臨床醫(yī)生在醫(yī)院內(nèi)進行。對于少見病的病因研究,常為唯一可行的方法。但這些優(yōu)點都是與前瞻性隊列研究相對而言的,實際上倘與同等規(guī)模的臨床研究或?qū)嶒炇已芯勘容^,病例對照研究所費的時間與精力可能更多。
本書以臨床醫(yī)學專業(yè)學生為主要讀者,并不要求他們能掌握或獨立應用分析流行病學方法,目標只是了解大概、擴大眼界、培養(yǎng)科學思辨能力,領會科學上獲得一個發(fā)現(xiàn)或作出一個結論的復雜過程及需要的客觀態(tài)度。
病例對照研究是從現(xiàn)在是否患有某種疾病出發(fā),回溯過去可能的原因(暴露),在時間順序上是逆向的,即是從“果”推求“因”,所以又稱回顧性調(diào)查、研究。
病例對照研究(及其他類型的流行病學研究)中所謂的暴露(exposure)是指研究對象(病例或?qū)φ眨┚哂心撤N疑為與患病與否可能有關的特征或曾受到某種疑為與患病與否可能有關的因子的影響。所謂特征(characteristic)可以是體質(zhì)上的、生理上的、也可是心理精神上的;即可以是遺傳性的也可以是獲得性的;所謂因子(因素)既可以是外界的也可以是機體內(nèi)在的;特征或因子可以是致病性的,也可以是保護性的(使人免于患病的)。因此,“暴露”是一個涵義廣泛的概念。
(二)方法
1.樣本含量的估計 為了研究一種暴露與疾病的關系需要多大一個樣本,也就是需要多少個病例和多少個對照,首先取決于4個條件:①人群中暴露者的比例;②假定暴露造成的相對危險度(其涵義詳見后文);③要求的顯著性水平;④要求的把握度。從這4個條件估算樣本的含量的方法,詳見附錄五。實際上,樣本含量還受許多因素的制約,例如病例和對照的來源、財力、人力、完成期限等。假定只有一定數(shù)目的病例與對照可以利用,則一個研究能查出的最小相對危險度是多少?又假定經(jīng)費數(shù)目已限定,則應選多少個病例與對照才能取得最大的把握度,這些都是應考慮的問題。此外,評價交互反應,控制混淆因素,亞組分析,每例多個對照等均影響所需樣本的大小。
2.病例和對照的來源與選擇
(1)病例:主要有兩種來源:①從醫(yī)院病人選擇,即是從某一所或若干所醫(yī)院選擇某時期內(nèi)就診或住院的某種病的全部病例。病例應符合統(tǒng)一的、明確的診斷標準。最好是新發(fā)生的(新診斷的)病例。因為一種病的全部病例不大可能都有進入某一所或幾所醫(yī)院的同等機會,能進入的只是其中符合條件(即選擇因素)的那一部分,所以不要求能代表某時某地的全部病例,但應要求能代表產(chǎn)生病例的人群,即該人群只要發(fā)生該種病例均可能進入該院。這樣,結果的普遍性雖受限,但真實性不受影響,而真實性是普遍性的前提。這種研究稱為以醫(yī)院為基礎的(hospital-based)病例對照研究;②從某特定人群選擇病例,即是以符合某一明確規(guī)定的人群在某時期內(nèi)(一年或幾年,視病例發(fā)生多少而定)的全部病例或當病例數(shù)過多時以其中的一個隨機樣本作為研究對象。其優(yōu)點是選擇偏倚比前一種來源的小,結論推及該人群的可信程度較高。這種研究稱為以人群為基礎的(population-based)病例對照研究。
(2)對照:設立對照的目的在于估計如果疾病與暴露無聯(lián)系,則病例組的暴露率可能為多少,也就是為比較提供一個基準。因此,對照與病例在一些主要方面必須具可比性。首先,對照必須從病例所來自的人群選擇,對照是有可能成為病例的人,換言之,每一病例在未發(fā)病前應該是合格的對照,而每一對照若發(fā)病都有可能成為病例組的成員。對照選擇是否恰當是病例對照研究成敗關鍵之一。
通常的做法是:如果病例組來自某一特定人群,則可以該人群的非病例(即未患該種疾病的人)的一個隨機樣本作對照;如果病例來自某所醫(yī)院,則可從同醫(yī)院同時就診或住院的其他病例中選擇對照。要求對照具有和病例一致的某些特征,即對照與病例有可比性,例如性別、年齡、居住地等;同時要求對照沒有患和研究因子與研究疾病有關的其他疾病的可能。例如,研究吸煙與肺癌的關系時,不能以慢性支氣管炎病人為對照,因為吸煙同時是這兩種病的可能病因;研究胃癌的病因不能以“慢性胃炎”病人為對照,因為這兩種病在病因上有密切關系,前者可能是后者在病因鏈上的一環(huán)。上述要求的目的都是減少混淆偏倚。其他來源的對照如病例的鄰居、同事、親屬等。各種不同來源的對照要解決的問題不同,都各有其局限性。例如,鄰居對照可控制社會經(jīng)濟地位的混淆作用,兄弟姊妹對照是考慮控制早期環(huán)境的影響和遺傳因素的混淆作用(極端要求為用同卵孿生),配偶對照是主要考慮成年期環(huán)境的影響。最常采用的方式是對照和病例都選自同一醫(yī)院,因為理論上他們都來自該醫(yī)院所服務的同一人群,而且對兩者都可在相同的環(huán)境中進行調(diào)查,也易于合作。但是由于不同病種的患者入院的機會不同,有可能使本來與某病無關的特征在醫(yī)院病例中表現(xiàn)出虛假的聯(lián)系(詳見第七章“病因及其推斷”)。為了減少這種偏倚發(fā)生的可能性,應該選取多種疾病而不是一種疾病的病人作對照。
3.病例與對照的配合 設置對照的作用在于平衡除了研究因子(暴露)以外的其他可能影響患病的因素,也就是說如果暴露與所研究的疾病不存在聯(lián)系的話,病例的暴露比例(率)應該與對照的無顯著差別;如果發(fā)現(xiàn)顯著差別,既然對照與病例在其他有關方面都可比較,因此可以推斷患病與否可能是與暴露率的差別有聯(lián)系。為使兩者具可比性,首先可以通過限制選擇病例與對照的范圍(例如年齡范圍、性別、種族等),使有關因子盡可能齊同。病例組與對照組的某些特征不應存在顯著差別,即應該均衡。
另一個選擇對照的重要方法叫匹配(matching,曾譯“配比”),又稱匹配抽樣(matchedsampling),就是在安排病例與對照時,使兩者的某些特征或變量相一致。具體做法有兩種:一種叫成組匹配或頻數(shù)匹配,即在選擇好一組病例之后,在選擇對照組時要求其某些特征或變量的構成比例與病例組的一致(即在兩組的總體分布一致),例如性別、年齡構成一致,具體做法上類似分層抽樣。另一種做法叫個別匹配,就是以每一病例為單位,選擇少數(shù)幾個特征或變量方面與病例一致的一個或幾個對照者組成一個計數(shù)單位或計數(shù)和分析單位。一個病例匹配一個對照的(即1:1匹配)一般稱為配對,也就是說由一個病例和一個對照組成對子(pair)為一個計數(shù)單位。
個別匹配,特別是1:1匹配,最常被采用。理論上,一個病例可以匹配多個對照,但研究證明病例與對照之比超過1:4時,統(tǒng)計效率不會明顯增加,但工作量卻增大。如果病例與對照來源都充足,調(diào)查費用又差不多,則以1:1匹配最合適;如果病例數(shù)有限而對照易得,則可采用一個病例匹配幾個對照的辦法以提高統(tǒng)計效率(例如實例2)。
在病例對照研究中采用匹配的目的,首先在于提高研究效率(study efficiency),表現(xiàn)為每一研究對象提供的信息量的增加。匹配后再按匹配的因素進行分層分析,可使每一個匹配層中都有一定數(shù)目的病例與對照,不至于因有的層只有病例有的層只有對照而無法對比,不能提供信息。其次,在于控制混淆因素的作用。所以匹配的特征或變量必須是已知的混淆因子,至少也應有充分的理由這樣懷疑,否則不應匹配。
無論是否采用匹配設計,為控制混淆作用都須在分析階段用分層、標準化或多元分析,但匹配后再按匹配因素作分層分析可以提高分析的效率,也就是提高了控制混淆因素的效率。
但是匹配也要付出代價:匹配增加了尋找對照的速度,以同樣的低價也許可以得到更多不匹配的對照,從而擴大樣本含量。從這個意義上說,匹配又降低了研究效率。增加匹配項目又會導致可能作為對照者的減少,無法找到可匹配對照的病例只得被剔除;一個項目一經(jīng)匹配不但使它與疾病的關系不能分析而且使它與其他研究因子的交互作用也不能充分分析。把不必要的項目列入匹配,企圖使病例與對照盡量一致,如果匹配的因素與暴露有聯(lián)系,就可能人為地造成更多的病例與對照暴露史一致的對子,徒然丟失信息,增加工作難度的結果反而是降低了研究效率。這種情況稱為匹配過度(over-matching),應注意避免。
匹配的變量應一致到什么程度,取決于變量的性質(zhì)、實際可能與必要:離散變量(即屬性,無中間值的變量)可以完全匹配,連續(xù)變量(在一定范圍內(nèi)可取任何值的變量)往往劃分為若干類或組,再按此匹配。例如按年齡分組、按血壓分組、按吸煙量分組匹配。分得太細,會增加工作難度,也不一定必要,例如年齡要求同歲;但分得太粗,例如年齡按10歲分組,又達不到控制混淆作用的目的。
當估計有許多可能的混淆因素需要控制時,倘僅靠分層則因?qū)訑?shù)太多不能保證每層均有病例與對照,所以采用匹配以保證有效的分層分析。其次,有的列名變量包含許多類別或內(nèi)容復雜(例如職業(yè)、種族、居住地、籍貫、兄弟姊妹等),如是可能的混淆因子,應加匹配。否則單靠分層不能控制混淆作用。
匹配可保證對照與病例在某些重要方面的可比性。對于小樣本研究以及因為病例的某種構成(例如年齡、性別構成)特殊,隨機抽取的對照組很難與之平衡時,個別匹配最為有用。
一般除性別、年齡之外,對于其他因素是否列入匹配須持慎重態(tài)度,以防止匹配過頭及徒增費用和延長完成時間。
4.計劃和執(zhí)行 病例對照研究在制訂計劃和執(zhí)行時應注意以下問題:
(1)主要假設的說明是否清楚、簡明而且可以檢驗?
(2)疾病與暴露變量的定義清楚、明確否?
(3)是否擬探索劑量反應關系和多個危險因素的聯(lián)合作用?
(4)為解答問題所需之病例數(shù)和對照數(shù)能否得到?這樣大小的樣本能查出的最小相對危險度是多少?與估計的相差多少?[參考附錄五(四)節(jié)]。
(5)病例來源及抽樣技術明確否?病例數(shù)與對照數(shù)之比是多少?匹配否及匹配哪些變量?
(6)調(diào)查表(問卷)是否已包括打算測量的所有變量并能夠收集到需要的數(shù)據(jù)?其詳盡程度是否已足供分析之用?
(7)醫(yī)院記錄(病歷)及其他來源的信息、從體檢、實驗室檢查、病理切片等獲得的數(shù)據(jù)需表格記錄否?
(8)調(diào)查表經(jīng)過試用否?其真實度與可靠度(重復性)經(jīng)評估否?訪問時擬使用幫助回憶的實物、模型或圖片否?
(9)調(diào)查員、質(zhì)控員、病歷摘錄員、編碼員的工作手冊已編好否?須專門培訓否?
(10)組織機構、人員、設備、經(jīng)費落實否?
(11)協(xié)作單位有書面協(xié)議否?有關領導機關已批準否?將診斷根據(jù)(切片、標本、影像圖片等)送到主持單位復核安排妥當否?
(12)實驗室檢驗項目或用儀器檢測的項目所用儀器、方法、試劑是否符合標準?結果的真實度與可靠度經(jīng)過考核否?
(13)經(jīng)治醫(yī)院、醫(yī)生是否同意提供病例和對照?是否必須取得研究對象在了解情況后的書面同意?資料、數(shù)據(jù)怎樣保密?怎樣保存?
5.數(shù)據(jù)分析 須分析什么項目,計算哪些統(tǒng)計量,用什么統(tǒng)計學方法,用手工(計算器)還是計算機,如用后者怎樣建數(shù)據(jù)庫和用什么軟件包,等等,都應包括在設計之中,手工計算時還應擬好相應表格?,F(xiàn)在計算機及統(tǒng)計軟件包的應用漸趨普及,過去很難進行的一些復雜的統(tǒng)計檢驗現(xiàn)在很快就可完成并打印出結果還可繪出統(tǒng)計圖。但是,一些流行病學專家主張先用手工計算基本內(nèi)容以熟悉數(shù)據(jù),然后再由計算機作復雜運算(多元分析)。
本節(jié)要介紹的是基本原理和基本方法,無論用手工或機器運算,這些都是應熟悉的。
病例對照研究數(shù)據(jù)分析的中心內(nèi)容是比較病例和對照中暴露的比例并由此估計暴露與疾病的聯(lián)系程度,并估計差別與聯(lián)系由隨機誤差造成的可能性有多大,特別要排除由于混淆變量未被控制而造成虛假聯(lián)系或差異的可能。進一步,還可計算暴露與疾病的劑量反應關系,各因子的交互作用(對一種因子的暴露會不會影響對另一種因子的效應),等等。非匹配和匹配設計的研究,數(shù)據(jù)的分析方法有一些不同。
(1)非匹配數(shù)據(jù)的分析:首先要檢驗病例組與對照組在某些主要特征(即可能成為混淆因子的特征)的構成上是否沒有顯著差別(均衡性檢驗)。
1)聯(lián)系的顯著性與聯(lián)系強度:某個因素與某種結局(患病或死亡)之間的聯(lián)系是否有統(tǒng)計學顯著性,常用χ2檢驗。最簡單的情況是因素與結局都只分為“有”或“無”兩類,數(shù)據(jù)可納入一張2×2表(即四格表,又稱四格列聯(lián)表),例如表4-1。χ2檢驗可用四格表專用公式(式4-1)。但χ2值的大小并不表示聯(lián)系的強度。χ2≥3.84時,設兩者無聯(lián)系的假設(無效價設,H)被否定,而轉向存在聯(lián)系的假設(備擇假設,HA),這個判斷錯誤的可能性為≤0.05(即ρ≤0.05)。χ2值越大,判斷錯誤的可能性越小。
表4-1 危險因子與疾病的聯(lián)系
患病有暴露史無暴露史合計有aba+b無cdc+d合計a+cb+da+b+c+d=n統(tǒng)計學顯著性可以評價在多大程度上可用機會解釋所觀察到的聯(lián)系。但如數(shù)據(jù)本身存在系統(tǒng)誤差,統(tǒng)計學顯著性檢驗就無意義,因為它不能區(qū)別聯(lián)系的真或假(由偏倚、混淆所致的聯(lián)系)。此外,統(tǒng)計學顯著性檢驗結果極大地受樣本含量的影響,樣本小則隨機變異大;即使實際上暴露的作用很大,也會導致“不顯著”的結論。所以“不顯著”應理解為“不足以否定無效假設”。
(式4-1)
現(xiàn)況調(diào)查和隊列研究(見本章“二、隊列研究”)可以計算暴露者(或具某特征者)和未暴露者(或不具某特征者)的患病率或發(fā)病率,因為分子數(shù)與分母數(shù)是已知的。也可以計算相對危險度(見本章公式4-11)。這是聯(lián)系強度的一個指標。
但是病例對照研究因為不能計算出患病率或發(fā)病率所以不能計算相對危險度,但可用另一個聯(lián)系強度指標——比數(shù)比(odds ratio,又譯比,值比、優(yōu)勢比,縮寫為OR)。比數(shù)比是兩個比數(shù)之比。比數(shù)(odds)是表示一個事件發(fā)生機會大小的一種指標。以表4-1為例(字母代表數(shù)目),如果是隊列研究與現(xiàn)況調(diào)查,可以計算發(fā)病(或患?。┍葦?shù),暴露組的這個比數(shù)為α/c,未暴露組的這個比數(shù)為b/d。如果是病例對照研究,可以計算暴露比數(shù),在病例組是α/b,在對照組是c/d。兩組比數(shù)之比稱為比數(shù)比,
OR =(α/b)/(c/d)=αd/bc
或
OR =(α/c)/(b/d)= αd/bc.(式4-2)
這個比正好是四格表中兩條對角線上四個數(shù)字的交叉乘積αd與bc之比,所以四格表數(shù)據(jù)的OR又稱交叉乘積比。OR可用于隊列研究,但更重要的是用于病例對照研究。在少見病,OR可以當作RR去解釋,即OR近似于RR。因在此情況下總體內(nèi)不論暴露組或未暴露組中患病者的人數(shù)(分別記為A與B,用大寫字母區(qū)別于樣本數(shù)據(jù)的小寫字母)都遠少于未患病者的人數(shù)(C與D),所以在總體內(nèi)A+C→C,B+D→D,于是
因為從隨機樣本的α/c與b/d可以估計A/C或B/D,所以可用αd/bc估計AD/BC,也就是說可以用OR作為RR的估計值。
暴露組與未暴露組的發(fā)病率或死亡率之比稱為率比(rate ratio)。兩組發(fā)病概率之比稱為危險度比(risk ratio)。在少見病,這兩個比和比數(shù)比均近似,可統(tǒng)稱為相對危險度。
從OR(或RR)值可估計暴露與疾病的聯(lián)系程度。這種聯(lián)系的穩(wěn)定性,即隨機變異的大小可用顯著性檢驗的ρ值和可信限來估計。OR是用來估評暴露與疾病的聯(lián)系程度或即暴露作用強度的一個點估計值(0~∞),但為估計這個值受隨機變異影響的程度,最好同時算出可能包括真值(參數(shù))的一個取值范圍,表示以一定程度的信心估計參數(shù)值所在的范圍,稱為可信限或可信區(qū)間(confidence interval)。計算方法詳見附錄五。如果可信限包括了無效值(OR=1),說明該聯(lián)系無顯著性;可信限的寬度又反映點估計值(OR)的穩(wěn)定性,范圍寬說明估計值不穩(wěn)定,也就是隨機變異程度大。所以現(xiàn)在認為僅計算出點估計值的意義有限,應同時計算出其可信限。
2)分層數(shù)據(jù)分析:病例對照研究在設計階段可采用的控制混淆因素的方法有限制與匹配。限制是指對采用研究對象的范圍加以限制,如混淆因素為列名變量(離散變量)可限定只采用某一類或幾類對象(例如性別、職業(yè)、地區(qū)等),如為連續(xù)變量可限定只采用某一范圍內(nèi)(例如年齡組、段)的對象。其目的都是得到比較勻質(zhì)的研究對象。如果一個因素在各對象間無差別或差別很小,它就不可能起到混淆作用,也就是得到了控制??稍诜治鲭A段采用的控制混淆因素的方法有分層、標準化和多元分析。其中以分層分析最常用。
分層就是把樣本按照一個或更多個混淆因子的暴露有無或作用程度而劃分為若干個組,也就是“層”,再分別在每一層內(nèi)分析所研究暴露與疾病的聯(lián)系,計算各層的比數(shù)比(記為OR);
表4-2 第i層內(nèi)病例與對照按暴露有無分組
組別病倒對照合計暴露αibim1i未暴露cidim0i合計n1in0ini如果各層 具有齊性[齊性檢驗方法見附錄五(一)],則可以計算總的即各層OR的合并OR。因其方法系Mantel與Haenszel兩人所開發(fā),所以通常記作ORMH。因在同一層內(nèi)作為分層標志的因子對病例組與對照組的作用都是相同的,所以對所研究的暴露與疾病的聯(lián)系便不會發(fā)生混淆作用。其原理與匹配相同,實際上1:1匹配就是一種最細的分層,每層只包括一個病例與一個對照。合并OR是概括各層OR的一個指標。
合并OR的計算方法:
(式4-3)
ORMH可信限的計算方法及計算實例見附錄五(一)。
ORMH如果不等于1,那么與1的差異是否顯著?可用作顯著性檢驗,其方法如下:
(式4-4)
式中,ai=各層四格表中的a數(shù)值,
檢驗假設(即無效假設)Ho:OR=1,雙側備擇假設HA:OR≠1。統(tǒng)計量X2MH呈自由度為1的X2分布。
分層分析法舉例:某地進行了一次食管癌病因的病例對照研究,共調(diào)查病例200例,人群對照776例。現(xiàn)分析其中飲酒與食管癌的聯(lián)系,結果如表4-3。
表4-3 飲酒與食管癌的聯(lián)系
飲酒史病倒數(shù)對照數(shù)合計飲 酒171381552不飲酒29395424合計200776976OR=6.11 χ2=84.29
可見飲酒與食管癌有強聯(lián)系,但已知吸煙與食管癌也有強聯(lián)系。為了分析飲酒與食管癌顯示出的強聯(lián)系是否可能與吸煙有關,或吸煙是否可能是一個混淆因子,可采用分層分析:按是否吸煙分為兩組,再分析飲酒與食管癌的聯(lián)系,結果見表4-4。
表4-4 飲酒與食管癌在吸煙與不吸煙者的聯(lián)系
不吸煙者吸煙者飲酒史病倒對照合計飲酒史病倒對照合計飲 酒69191260飲酒102190292不飲酒9257266不飲酒20138158合計78448526合計122328450OR=10.3 χ2=53.99 OR=3.70 χ2=24.62
計算ORMH,先用公式(4-3)計算
再用公式(4-4)作χ2檢驗:
χ2MH=76.84
ρ