標準樣品普及講座(12)標準樣品標準值的測量不確定度

發布時間:2005-10-05         發稿部門:全國標準樣品技術委員會 陳柏年 徐大軍

  1 標準樣品特性標準值的測量不確定度評定和GUM的關系
  從理論上講,測量不確定度僅僅是對一個具有溯源性的測量結果離散程度的描述,在《國際通用計量學基本術語》(VIM)中是這么定義的:與測量結果相聯系的參數,表征合理地賦予被測量之值的分散性。因此,要合理地評定一個測量結果的不確定度,就必須首先確認其溯源性上的特點,即:是溯源到SI框架體系?還是溯源到一個特定的測量程序?
  從實踐上講,雖然評定任何測量不確定度的技術依據都應是1993年由7個國際組織發布(1995年重新確認)的《測量不確定度表示指南》(GUM)。但是,由于1981年發布的ISO導則31《標準樣品證書內容要求》就已經提出了采用標準偏差(實際上就是測量不確定度)來評定標準樣品特性標準值的離散性(參照采用該國際導則的國家標準GB/T15000.4-1994第6.7條中也給出了采用標準偏差和不確定度來評定標準樣品特性標準值的實例)。因此,標準樣品特性標準值測量不確定度概念的提出實際上是上個世紀七十年代末,和1993版GUM的前身、國際計量局(BIPM)1980年提出的國際建議INC-(1980)《實驗不確定度表示》幾乎是同步的。而且由于GUM第1章中明確規定了該指南"主要涉及表示很好定義了的、物理量的測量不確定度",也就是說:1993年版GUM研究的重點是適用于能夠用數學物理方程定義的物理量;有關標準樣品的ISO導則研究的重點則是化學特性、生物特性等不屬于SI框架體系或采用該框架體系有困難的其它量。當然,在標準樣品特性標準值屬于SI框架體系時(即特性標準值主要依據測量儀器確定時,也就是可以采用第11講中規定的單個實驗室權威方法定值方式時),可以按GUM規定的程序進行測量不確定度評定。但是當標準樣品特性標準值主要依據特定的測量程序(即采用第11講中其它3種定值方式)時,標準樣品特性標準值一般就無法采用合適的數學模型(例如采用數學化學、數學生物、數學工程或數學感官方程)來定義,這時,就應該采用ISO導則35:2005《標準樣品的定值 總則和統計學原理》中規定的程序。實際上,這一點在GUM中也有明確的規定: GUM要求在這種情況下,必須另外選擇其它合適的評定程序,因為上述特定的測量程序一般無法用合適的數學模型來描述各種輸入量的離散性(例如化學分析中制備樣品程序、特定操作人員的操作手法)和標準樣品特性標準值離散性(即測量不確定度)之間的關系。從而就無法采用GUM中規定的不確定度傳播率來評定該標準值的合成測量不確定度。
  同時還應該特別注意:在評定標準樣品特性標準值的測量不確定度時,除了要評定測量程序引入的不確定度分量之外,還要評定樣料不均勻性、長周期穩定性和短周期穩定性引入的不確定度分量。因此,對大多數標準樣品而言,它標準值的測量不確定度中除了包含特定的測量程序引入的不確定度分量之外,還包含有樣料不均勻性、長周期穩定性和短周期穩定性引入的不確定度分量,這就需要采用不同于GUM中提出的、特定的評定程序。由于這個特定的評定程序涉及到標準測量方法(測量程序)、參加定值實驗室技術能力的一致性和被定值樣料的穩定性均勻性三個要素,所以它是一個既符合GUM規定的基本準則、又具有自己獨特要求的專業化的測量不確定度評定程序。
  
2 評定標準樣品特性標準值測量不確定度的統計數學模型
  根據ISO5725《測量方法和結果的準確度(精密度和正確度)》的規定,多個實驗室采用一個特定的測量程序對相同的被測量進行測量獲得的測量結果的統計數學模型如下:
  X =μ+δ+β+e
  這里: X是一個特定實驗室一次測量獲得的結果;
  μ是被測量的真值,理想條件下存在,但實際上是找不到的。
  δ是測量程序固有的系統誤差,不同的測量程序固有系統誤差的幅度不同;由于真值實際上是找不到的,所以這個誤差也常常是未知的,但可以通過測量不確定度評定對其進行合理的估計。
  β是重復性條件下,實驗室固有的系統誤差。每個實驗室都存在,但幅度不一樣。在復現性條件下服從正態分布,可以通過測量不確定度評定進行估計。
  e是重復性條件下,每次測量中引入的隨機誤差。每次測量都存在,雖然幅度不一樣,但在重復性條件下服從正態分布,可以通過測量不確定度評定進行估計。
  下面就簡單分析在確定標準樣品特性標準值時,如何評定它們引入的測量不確定度。
  2.1 測量程序(測量方法的細化)的系統誤差δ引入的不確定度
  當對在復現性條件下,參加定值的實驗室采用同一個測量程序獲得的檢測結果之間的差異進行考查時,由于對于同一個測量程序來說,它的系統誤差δ是固定不變的,不會反映在差異之中。因此對溯源到同一測量程序的標準樣品來說,可以忽略這個固定的系統誤差,在評定標準樣品的測量不確定度時不考慮它。但是,當采用幾個準確度水平相當的測量程序進行定值時,則首先要確定這些不同測量程序固有的δ是否相當, 或確實存在一個公認的約定真值μ(一般能溯源到SI框架體系的量都符合這個要求)時,就必須考慮測量程序固有的系統誤差δ引入的不確定度。
  2.2 實驗室的系統誤差β引入的測量不確定度
  對在重復性條件下,參加定值的單個實驗室采用同一個測量程序獲得一組檢測數據之間差異進行考查時,由于同一個實驗室的系統誤差β是固定不變的,所以不會反映在差異之中。但復現性條件下,不同實驗室的β是不同的。不過只要這些實驗室的技術能力相當,則ISO5725-2假定這個β的分布是正態的,可以采用實驗室間方差來評定
  β引入的方差被稱為實驗室間方差,表示如下:
  var(β) = σL2
  這里:σL包括操作員之間(包括操作手法和經驗)、測量設備之間(包括制造方面的差異、時間漂移、溫度漂移和測量標準校準時引入的差異)和時間不同(包括環境條件和控制條件變化)引入的變化。
  在采用實驗室間聯合定值方式時,這些分量沒有被分別處理,而是統計在復現性標準偏差中的。一般地說,β可以被考慮為是一個隨機性的系統誤差分量。即對于重復性條件,它是系統誤差;對于復現性條件,它是隨機誤差。
  當參加定值的各個實驗室測量獲得數據顯示出多峰值時,也就是不符合正態分布時,這就意味著:來自各個實驗室的數據缺乏一致性。也就是說,各個實驗室技術能力不相當,各個實驗室的β不具有隨機分布特性,無法采用統計方法評定β引入的測量不確定度。這時就要重新考核、確認各個參加定值實驗室技術能力的一致性。
  2.3 實驗室的隨機誤差e引入的測量不確定度
  e代表的是在重復性條件下,參加定值實驗室提供的每個檢測數據中引入的隨機誤差,按ISO5725的規定,e服從正態分布。采用重復性條件下的方差來評定,被稱為實驗室內方差,表示如下:
  var(e) = σw2
  由于不同實驗室操作人員水平的差異,所以雖然測量程序相同,因此不同的實驗室有不同σw。但是在對標準樣品定值時,由于要求所有實驗室的技術能力是相當的,所以這些差異可以不考慮。這樣,參加定值的所有實驗室可以獲得一個共同的實驗室內方差值。這個值是實驗室內方差的算術平均值,稱為實驗室內重復性方差,表示如下:
  var(e) (的平均值)= σr 2
  這個算術平均值包括所有參加定值實驗室的方差(排除提供的離群值)。
  2.4 擴展不確定度的確定
  一般按正態分布、置信水平為95%來確定擴展不確定度,包含因子k = 1.96 。但當有效自由度比較小(即參加定值的實驗室比較少、每個實驗室提供的重復性檢測數據比較少時),則按t 分布選擇包含因子,置信水平仍為95%。
  3 標準樣品特性標準值測量不確定度評定的基本數學模型
  應該知道:建立標準樣品特性標準值測量不確定度的數學模型,既不是一項常規性的工作,也不是一項嚴格的數學工作,而是一項非常專業化、非常復雜的工作,隨專業不同、特性定值方式的不同而不同,所以應該仔細地考慮與每個標準樣品研制程序相關的所有詳細情況(這些程序是用來制備樣料和對樣料定值的)。模型的基本要求之一是:那些對標準樣品特性值不確定度有顯著貢獻的所有因素應全部被包含。所以,為了確保完整,一個標準樣品的合成不確定度應該包含參加定值實驗室技術能力不一致因素、材料不均勻性、長(短)周期穩定性因素以及批量表征化引入的因素(特定的情況下也應包括測量程序固有的系統誤差引入的不確定度)。一個標準樣品的測量不確定度包含如下分量:
  * 實驗室技術水平不一致引入的不確定度;
  * 表征化時測量程序(測量方法的細化)引入的不確定度;
  * 轉換成單個包裝引入的不確定度(均勻性);
  * 交付給銷售商時引入的不確定度(短周期穩定性);
  * 從銷售商到用戶時引入的不確定度(長周期穩定性);
  確定一個標準樣品特性標準值的測量不確定度要考慮如下影響:
  * 材料完全表征化引入的不確定度;
  * 用戶一次僅僅使用一個樣品引入的不確定度;
  * 材料被用戶或生產者長期貯存引入的不確定度;
  * 材料必須運輸到用戶時引入的不確定度。
  這些因素都顯著地貢獻測量不確定度給一個標準樣品的特性標準值。對這些影響因素的正確理解是:應與正常測量相同。評定測量不確定度時,不需要考慮不適當的、錯誤的測量,不適當的應用和不適當的運輸等等引入的不確定度分量(這些檢測數據應作為異常值加以剔除)。這與GUM第3.4.8條的要求是一致的。第3.4.8條明確指出:雖然本指南提供了評定不確定度的框架,但是它不能代替批判性的思考、認識上的直覺(經驗)、專業上的技能。實際上,不確定度的評定既不是一個常規性的工作程序,也不是一個純粹的數學工作,它要依賴對被測量性質的詳盡了解(即測量人員的專業技能和經驗)。所以,一個測量結果的不確定度的質量和效用,最終依賴于對被測量的了解(經驗)、批判性的分析(直覺)、和對賦予它值的所有因素完整性的認識(哲學上的批判)。
實際統計數學模型如下:
  xCRM = xChar +δbb + δlts + δsts
  這里:
  xCRM表示標準值;
  xChar 表示對一批材料表征化獲得的特性值,或對在單個人工制造樣品定值情況下,從這個樣品獲得的特性值;
  δbb 表示由于瓶-瓶之間差異引入的誤差;
  δlts表示由于長周期引入的誤差;
  δsts表示由于短周期引入的誤差(這里沒有考慮實驗室能力不一致引入的誤差)。
  通常,采用這樣一種方式進行研究:對于一個特定的樣品,這些誤差項的值為零(即在對一個特定樣品進行測量時,該特定樣品本身不存在這些誤差),但是要注意:它們的不確定度不為零(因為測量不確定度反映的整批樣品在有效期內的離散性)。
  假定這些輸入量是獨立的,則一個標準樣品特性標準值的測量不確定度UCRM為(Uchar2 + Ubb2 + Ults2 + Usts2)的正平方根(如果不獨立,還要考慮協方差)。
  采用GUM中提供的不確定度數學模型,則瓶-瓶間不確定度分量Ubb、長周期穩定性不確定度分量Ults、短周期穩定性不確定度分量Usts分別相應于模型中的各個輸入量的測量不確定度。
  有時,長周期穩定性項還是時間的函數,例如放射性同位素類的CRM。對這類CRM定值時,應計算標準值與時間之間的依賴關系。
  對測量進行模型化的總的建議見ISO導則35:2005〈標準樣品定值 總則和統計學原理〉第7到10章。
  在有些情況下,不采用這個基本模型也是可以的。這些情況包括:樣品不需要運輸;證書上明確規定不確定度不包含樣品運輸;關于這些不確定度分量評定見ISO導則35:2005《標準樣品定值 總則和統計學原理》第7、8、9和10章。
  如果一個樣品對于在運輸中溫度的變化是敏感的,當溫度提高時,一個星期內樣品就會發生嚴重變化,而從生產者運送到用戶則需6個星期,這時候就必須在證書上加以說明(或在附加文件中規定)。
  4 GUM第8章中給出的測量不確定度評定程序
  一般來說,標準樣品特性標準值的測量不確定度按上述的原則進行評定。但是,當它具有溯源到SI框架體系特點時,則一般也可按GUM第8章給出的程序對標準樣品特性標準值測量不確定度進行評定。該程序摘要如下:
  4.1 找出標準特性標準值和各個輸入量之間的關系。即找出標準值和所有影響其變化的輸入量之間的數學關系式。這個關系式應包括所有可能顯著影響標準值不確定度的輸入量,我們將這個數學關系式稱為測量的數學模型。
  作為輸出量的標準樣品特性標準值Y和它所有的輸入量Xi之間的關系:
  Y = f(Xi)。
  這里:i = 1,2,3,……,N
  4.2 確定輸入量Xi的估計值xi,可以依據對一組已經獲得的觀察值進行統計分析得到;也可以依據其它非統計分析方法得到。
  4.3 采用A類方法評定輸入量得到的一組數據的標準不確定度,采用B類方法評定所有的其它量標準不確定度。
  4.4 評定任何輸入量之間的協方差。
  4.5 計算特性值y,并將這個值確認為標準值。
  4.6 采用GUM第5章給出的傳播率,來確定標準值的、與來自與輸入量相關的標準不確定度和協方差的合成標準不確定度。
  4.7 為了得到擴展不確定度U,確定包含因子k。這時候,可以假定:有理由為標準值的大部分落在區間[x-U,x+U]之內。選擇包含因子的依據是置信水平(常常為95%)、y的概率密度函數和自由度。
  4.8 按ISO指南31的要求,報告特性值、擴展不確定度U和包含因子k。