摘要 目前,常用的實驗室間比對數據統計分析方(fāng)法有穩健(Robust)統計法、格拉(lā)布斯檢驗法(Grubbs)及科克倫(Cochran)檢(jiǎn)驗法。基於濟南(nán)MD传媒视频組(zǔ)織的2014年春季塑料薄膜阻隔性實驗室間比對活動,本文對穩健統計法、格拉布斯檢驗法及(jí)科克倫檢驗法進行分析比較,探討了三種數據評價方法在計算過程、離群值判(pàn)斷(duàn)等(děng)方麵的區別。
關鍵字(zì) 阻隔性,實驗室間比對,穩(wěn)健統計法,格拉布斯檢驗(yàn)法,科克倫(lún)檢驗法
文(wén)檔 點(diǎn)擊查看PDF文檔

  近(jìn)期,LabthinkMD传媒视频2014年春季塑(sù)料薄膜(mó)阻隔性實驗室間(jiān)比對(duì)活動已(yǐ)圓滿落幕(mù),本次(cì)實驗室間比對活動采用CNAS-GL02《能力(lì)驗證結果的統計處理和能力評價指南》中推薦的穩健(Robust)統計法(fǎ)對(duì)數據進行統計分析評價。而在國(guó)外(wài),實驗室間比對常用(yòng)的數據統計分析方法為ISO 5725.2-1994《測量方法與結果的準確度(正(zhèng)確(què)度與精密度) 第2部分 確定標準測量方法重複性與再現性的基本方(fāng)法》中推薦的格拉布(bù)斯檢(jiǎn)驗法(Grubbs)和科克倫(Cochran)檢驗法。三(sān)種統計方法在計算過程特別是離群值判斷方麵(miàn)存在較大差(chà)異。基於本次實驗室間比對活動,筆者對三種統計方法進行詳細介紹(shào)與分(fèn)析。

1. 數據統計方法簡介

1.1穩健統計法

  采用穩健統計法進行統計分(fèn)析(xī)的前提是(shì)假設分析的結(jié)果服從正態(tài)分布。在開始(shǐ)進(jìn)行統計分析之前,應確保所采集的數據是正確、合理的,並對數據(jù)中的粗大誤差和潛(qián)在問題進行(háng)識(shí)別。通常在數據統計過程中需要統計結(jié)果數、中位值、標準四分位間距(jù)(標準化IQR)、穩健CV、最小(xiǎo)值、最大值和極差七(qī)種統計量。這些統計量(liàng)的(de)計算是進(jìn)行實驗室結果統計評價的基礎。其中最重要的統計量是中位值和標準化IQR,它們是數據集中和(hé)分散的量度,屬於穩健統計量,不受數(shù)據中離群值的影響(xiǎng)。

  對實驗室(shì)檢測(cè)結果應使用基於(yú)穩(wěn)健總計統(tǒng)計量的Z比分數(中位(wèi)值和(hé)標準化IQR)進(jìn)行評價。對於分割(gē)水(shuǐ)平對樣品a和樣品b應統計計算兩個Z比分數——實驗室間Z比分數(ZB)和實驗室(shì)內Z比分數(ZW)。它們分別基於(yú)結果(guǒ)對的標準化和(S)和標(biāo)準化差(D)來進(jìn)行計算,標準化和(S)和標準化差(D)的計算(suàn)公(gōng)式(shì)如下:

20140808-3.png

  通過計算每(měi)個實驗室的標(biāo)準化和(S)和標準化差(D),可以統計(jì)出(chū)所有參加實驗室的S和D 的中位(wèi)值和標準化IQR,再根(gēn)據公式(3)和公(gōng)式(4)即可計算實驗室間Z比分數(ZB)和實驗室內Z比分數(ZW)。

20140808-4.png

  實驗室結果依據Z比分數(包括ZB和ZW)進行評定。20140808-5.png的結果為離群值,20140808-6.png時為可疑值(zhí)。正的實驗室間離群(qún)(即ZB≥3)表明該樣品對的兩個結果太高,負的實驗室間離群(qún)值(即ZB≤-3)表明其(qí)結果太低,而實(shí)驗室內離群值20140808-9.png則表明其兩個(gè)結果間的差值太大。

1.2科克倫檢驗法

  科克倫檢驗法應用於(yú)所有標準差都是在重複性條件下,且由(yóu)相同數(shù)目(n)的測試結(jié)果計算得出的情(qíng)形。實際中由於數據的缺失或剔除,測試結果數可能不同。所以假定在正常組織的試(shì)驗中,每個實驗室的測試結果數目不同所造成的影響(xiǎng)是有限且可以忽略的,科克倫檢驗中所用的n可取多數(shù)實驗(yàn)室的測試結果數。

  該統計方法是對標準差的最大值(zhí)進行(háng)評定,屬於單側檢驗。統計過程(chéng)為先將全組實驗室(shì)檢測結果標準差從小(xiǎo)到大排列,然後根據標準差的最大值計算科克倫檢驗的統計(jì)量,見公式(5)。查閱科克倫檢驗臨(lín)界值表,通過比較相同顯著水平下的臨界值來判定該(gāi)最大標(biāo)準差(chà)是否為離(lí)群值。如果標準差的最(zuì)大值是離群值,則將該值舍(shě)去後對剩餘(yú)的標準差重新計(jì)算科克(kè)倫檢驗的統計量。

20140808-10.png

其中,si為實驗(yàn)室的標(biāo)準差,smaxsi中最大值。

離群值的判斷:

a)當統計(jì)量小於等於5%的臨界值時(shí),認為該值是正(zhèng)常值;

b)當統計(jì)量(liàng)大於5%的臨界值且小於等於(yú)1%的臨界值時,該值為可(kě)疑值;

c)當統計量大(dà)於1%臨界值時,認為該值是統計離群值。

1.3格拉布(bù)斯檢驗法

  格拉布斯檢驗法(fǎ)適用於判定一組檢測(cè)結果(guǒ)中最大值或最小值是否為離(lí)群值,此方法通過(guò)計算平均值 和標準偏差SD然後再計算統計量(G),見公式(6)、公式(7)。通過查閱Grubbs檢驗臨界值表獲得一定顯(xiǎn)著性水平(α)下的(de)臨界值,比較統計量(G)與查到的臨界值。當統計量(G)大於臨界(jiè)值時,此數據即為離群值,並對剩餘數據繼續檢(jiǎn)驗,直到數據中無異(yì)常值為(wéi)止。

Grubbs檢(jiǎn)驗的統計量計算公式為:

20140808-11.png

其中,Xp為一(yī)係列(liè)數據(jù)xi(i=1,2,…,p)中的最大(dà)值; 為平均值;SD為標準偏差。

最小值(zhí)x1的統(tǒng)計量計算公式為:

20140808-12.png

其中,x1為一係列數據xi(i=1,2,…,p)中(zhōng)的(de)最小值; 為平均值;SD為標準偏差。

離群值(zhí)的判斷:

a)當統計量小於等(děng)於5%的臨(lín)界值時,認為該值是正常值;

b)當(dāng)統計量(liàng)大於5%的(de)臨界值且小於等於1%的臨界值時,該值為可疑值;

c)當統計(jì)量大於1%臨界值時,認為該值是統計離群值。

2.實驗室間比對結(jié)果(guǒ)分析

  本次塑料(liào)薄膜阻隔性實(shí)驗室間比(bǐ)對活動采(cǎi)用“分割水平”的(de)樣品設計,氧氣透過量的樣品分為A、B兩組,水蒸氣透過量(liàng)的樣品(pǐn)分為C、D兩組。在對實驗室檢測(cè)能力進(jìn)行評定時,不出具“合格”與否的結論,而是使用“滿(mǎn)意”、“可疑”或“離(lí)群”的概念。如果一個結果被評定為離群值,這意味著從(cóng)統計上看它明顯地(dì)不同於同組的其他結果。

2.1采用穩健統計法評定結果

  用穩健統計法計算各參加實驗室的實驗室間Z值(ZB)和實驗室內Z值(ZW)。通(tōng)過對(duì)檢測結果進行統計分析,本次氧氣透過量檢測項目發現實驗室間離群1家,實驗室間可疑2家(jiā),實(shí)驗室內(nèi)離群0家,實驗室內可(kě)疑6家;對於水蒸氣透過量檢測項目,此次有實驗室間離群2家,實驗室間可疑1家,實驗室內離群7家,實驗室內可疑9家。將實(shí)驗室(shì)Z值(zhí)(ZB和ZW)合並統計,本次(cì)氧氣透過(guò)量項目共有94%的實驗室結果滿意,5%的實驗室可疑,1%的實驗室離群(qún);水蒸氣透過量項目共有84%的實驗室結果滿意,8%的實驗室可疑,8%的實驗室離群。

            20140808-14.png

  由統計數據(jù)可見,實驗室內的(de)離群與可疑明顯多於實驗室間離群與可疑,說明實驗室內部檢測過程(chéng)中的隨機誤(wù)差比較多,而實驗室間的係統誤差要少一些。

2.2采用科克倫檢驗法評定結果

  用科克倫檢驗法進行數據統計(jì)時,需要(yào)計(jì)算統計量C,再與臨界值進行比較判定離群值。科克(kè)倫檢驗法是對檢測結(jié)果的標準偏差進行統(tǒng)計(jì)以剔除離群值。經(jīng)過統計計算,本次(cì)實驗室(shì)比對活動中,樣(yàng)品A的(de)可疑值(zhí)有1個,離群值(zhí)有9個(gè);樣品B有可疑值1個,離群值8個;樣品(pǐn)C有可疑值2個,離群值13個;樣品D有(yǒu)可疑值5個,離群值12個。

  根(gēn)據科克倫統計原理,采用此方法時,參與實驗室數量越多(duō),其對應的臨界值越小(xiǎo),即要求(qiú)標準偏差的離散程度要小。參(cān)與實驗室數量少時,對應的臨界值大,那麽對於數(shù)據標準偏差離散(sàn)程度(dù)的要求就不是那麽嚴格。因此,在此次實驗室間比對活動(dòng)參(cān)與實(shí)驗室較多,而數據的離散(sàn)程度偏大的情況下,科克倫(lún)檢驗法評(píng)定(dìng)剔(tī)除的離群值相對較多。

2.3采用格拉布斯檢驗法(fǎ)評定結果

  在此次實驗室間比對中,對同一種(zhǒng)樣(yàng)品的檢測(cè)結果呈(chéng)兩端離散的形式,所以在采用格拉布(bù)斯檢驗法進行數據統計時(shí),需要同(tóng)時對最大值和(hé)最小值計算統計量Gp和G1,再與臨(lín)界值G(α)比較。如果Gp>G1且Gp>G(α),則評(píng)定最大值為離群(qún)值;如果G1>Gp且(qiě)G1>G(α),則評定最小值為離群值。對於樣品A,經計算沒有發現可疑值和離群值(zhí);對於樣品B,經計(jì)算發現可疑值2個,離群值1個;對(duì)於樣品C,計算發現可疑值2個,離群值2個;對於樣品D,計算沒(méi)有發現可疑值和離群值。

  格拉布(bù)斯檢驗法是對實驗室檢測結果的平均值進行統(tǒng)計,從而剔(tī)除離群值。在數據量較少時,其對應的臨界值越小,那(nà)麽剔除離群值的概率就(jiù)較大。在數據量較大時,其對應的(de)臨界值越大,那麽剔除離群值的概(gài)率(lǜ)就較低。因此,在此次實驗(yàn)室比對活動中,采用該方法計算時發現的離群值較少。

2.4不同統計方法實驗室比對結果評定的比較

  對於(yú)本次實驗室間比對樣品的參考值,不同的統計方法依(yī)據不同的統計量來反映。穩健統計法采用中位(wèi)值反映樣品的(de)參考值(zhí),而科克倫檢驗與格拉布斯檢驗(yàn)則采(cǎi)用總平均(jun1)值。總平均值並不是對(duì)一組(zǔ)數據計算其平均值得到的,而是首先(xiān)通過科克倫檢驗法對標準偏差進行(háng)評價剔除離群值,然後通過(guò)格拉布斯檢驗(yàn)法剔除平均值的離(lí)群值,之後再對剩(shèng)餘的數據計算平均值即為總平均值。

通過對本次實驗室間比對數據的計(jì)算,得到的(de)參考值(zhí)與離群情況見表1、表2:

表1:實驗室間比對參考值比較

統計方法樣品A(cm3/m2·24h·0.1MPa)或ml/m2·day樣品(pǐn)B(cm3/m2·24h·0.1MPa)或(huò)ml/㎡·day樣品C(g/m2·24h)樣品D(g/m2·24h)
穩健統計法58.42917.6115.4332.859
科克倫檢驗+格(gé)拉布斯檢驗59.77017.8795.3682.987

表2:實驗(yàn)室間比(bǐ)對結果統計(jì)

統計方(fāng)法樣品滿意(個)可疑(個)離群(個)備注
穩健統計法ZB

樣品A+B

10121

樣品A、B用於氧氣透過量測試(shì);

樣品C、D用(yòng)於水蒸氣透過量測試。

樣品C+D

10812
ZW樣品(pǐn)A+B9860
樣品(pǐn)C+D9597
科克倫檢驗+格(gé)拉(lā)布斯檢驗樣(yàng)品A9519
樣品(pǐn)B9639
樣品C96415
樣品D99512

  由表1、表(biǎo)2可以看出,雖(suī)然通過穩健統計(jì)法判定(dìng)出的可疑值與離群值數量與通(tōng)過科(kē)克倫檢驗法和格拉布斯檢驗法剔除(chú)的可(kě)疑值與(yǔ)離群值數量有較大的差別,但是兩(liǎng)種統計方法計算的樣品參考值是很(hěn)接近的。由此可以看出,穩健統計法和由科克倫檢驗法與格拉(lā)布斯檢驗(yàn)法組合檢驗這兩種檢驗方法的統計參數(shù)受極端值(zhí)的影響都不(bú)大(dà)。

3. 總結

  通過對此(cǐ)次實驗室間比對數據(jù)的分析統計,可以看出(chū),穩健統計法不受數據(jù)量多少的影(yǐng)響,而且受極端值的影響也不(bú)大。而由科克倫檢驗(yàn)法(fǎ)與(yǔ)格拉布斯檢驗法組合檢驗的統計方法,受數據量多少的(de)影(yǐng)響較(jiào)大,而(ér)受極(jí)端值的影響較小。不過兩種統計方法相比較,穩健統計法在數據處理和計算程序上更加科學(xué)、直觀和(hé)簡潔方便。   

MD传媒视频-麻豆MD传媒MD0049入口-md豆传媒app地址入口免费看-国产麻豆MD传媒视频