中醫(yī)古籍
  • 《醫(yī)學(xué)統(tǒng)計學(xué)》 一、變異指標的意義及種類

    設(shè)有甲乙兩人,對同一名患者采耳垂血,檢查紅細胞數(shù)(萬/mm3),每人數(shù)五個計數(shù)盤,得結(jié)果為

    合計均數(shù)甲4804905005105202500500乙4404605005405602500500

    兩人計數(shù)的均數(shù)都是500,能說兩人的檢驗技術(shù)相同嗎?不能,因為甲的計數(shù)結(jié)果比較密集,而乙的分散,因此甲的檢驗精度顯然比乙的高。從上可以看出:描述一群變量值,除用平均數(shù)等表示其集中位置外,還要說明其分散或變異情況。說明變異情況的特征值稱變異指標。變異指標的種類較多,下面分別介紹極差、四分位數(shù)間距、均差、方差、標準差及變異系數(shù)。

    1.極差最大值與最小值之差稱極差(或全距),符號為R,是變異指標中最簡單的一種。如上例甲計數(shù)的極差為520-480=40,乙的為560-440=120??梢娨业挠嫈?shù)較甲的波動大。一般把最小值與最大值寫在括號里,附在極差的后面。如上例寫成40(480~520)與120(440~560)。其單位與變量值的相同。

    當(dāng)調(diào)查例數(shù)增多時,遇到較大或較小極端值的機會就加大,因此最大值與極差隨著例數(shù)的增多而加大,但最小值卻隨著例數(shù)的增多而變小。

    極差計算簡便,但只考慮了最小、最大值,因此易受個別極端值的影響,且隨例數(shù)的多少而變動,不穩(wěn)定。僅用于粗略地說明變量值的變動范圍。但在正態(tài)分布中可用以估計標準值范圍,詳見有關(guān)文獻。

    2.四分位數(shù)間距極差的不穩(wěn)定主要是受兩極端數(shù)值的影響,于是有人將兩端數(shù)據(jù)按比例去掉一定例數(shù),這樣所得數(shù)據(jù)就比較穩(wěn)定了。例如兩端各去掉25%,取中間50%數(shù)據(jù)的數(shù)值范圍,那么只要計算P25與P75,求P75與P25之差即得四分位數(shù)間距,符號為Q。

    Q=P75-P25(4.12)

    例4.7 試計算表4.8七歲男童坐高的四分位數(shù)間距

    求 P25的位置102×.25=.25.5.

    求 P75的位置102×.75=.76.5.

    求累計頻數(shù)得:

    L25=65,L75=68,

    A25=22,A75=75,

    f25=15, f75=13,i=1

    表4.8 7歲男童的坐高

    坐高(cm)例數(shù)(f)累計頻數(shù)61-1162-3463-4864-142265-153766-215867-177568-138869-79570-510071-2102合計102—

    代入式(4.5)得:

    Q=68.12-65.23=2.89 cm

    有50%的7歲男童,坐高在65.23~68.12cm之間,其四分位數(shù)間距為2.89cm。

    3.均差四分位數(shù)間距雖比極差穩(wěn)定,但仍只是兩點之間的距離,沒有利用每個變量值的信息。于是有人計算每個變量值與均數(shù)(或中位數(shù))差的絕對值之和,然后平均稱為均差(或平均直線差)作為變異指標之一。

    (4.13)

    例4.8 試計算4.3中,心重的均差。

    由例4.3知X=293.75g,代入式(4.13)得

    4.方差式式(4.13)中用變量值與均數(shù)之差的絕對值之和∑∣X-X∣,而不用離均差之和∑(X-X)是因為∑(X-X)=0,不能說明變異情況,故取絕對值以去掉負號。亦有人用平方的辦法,即用離均差平方和∑(X-x )2,既去掉了負號,又提高了指標的靈敏性。因為數(shù)值愈大,平方后增大的愈多,所以離均差稍有變化,就能從指標上反映出來。例如有甲乙兩組數(shù)據(jù)如下:

    X∑∣X-X∣∑(X-X)2甲組101112131412610乙組91212131412614

    乙組僅有兩個數(shù)據(jù)與甲組的不同,這種不同從∑∣X-X∣或均差上是反映不出來的,但從∑(X-X)2上卻反映出來了。以∑(X-X)2組成的變異指標有方差與標準差。方差是標準差的平方,將在第八章討論,下面先介紹標準差。

更多中醫(yī)書籍