2020年7月16日木曜日

環境計量士のための Point 解説 不確かさ(2)

4.不確かさの算出方法

不確かさは、次の1~4のステップを経て見積もっていきます。

  1. 不確かさ要因をピックアップする。

  2. 不確かさ要因によってどのくらいばらつくのかを実験等で求め、標準偏差として表す。これを標準不確かさという。

  3. すべての不確かさ要因の標準不確かさを求めたら、それらを合成し、測定結果のばらつきである合成標準不確かさを求める。

  4. 最終的な不確かさは、この合成標準不確かさとして報告して問題ない。しかし、これを定数倍した拡張不確かさを用いて、「±拡張不確かさ」という信頼区間の形で報告することが一般的となっている。

これから試験でよく問われる太字の個所を1つずつ解説していきますが、その前に「不確かさ要因」の話を少しだけします。

「不確かさ要因」とは、測定結果にばらつきを与える要因のことです。
たとえば、試薬や水の純度が悪ければ、調製した溶液の濃度に影響を与えてしまいます。また、計量器具の公差が大きいと、溶液の濃度に与える影響も大きくなります。

このように、最終的な結果(濃度)に影響を与えてしまう試薬の純度や計量器具の公差は「不確かさ要因」としてピックアップされます。


5.標準不確かさ

標準不確かさの求め方には、タイプAとタイプBの2通りが『計測における不確かさの表現ガイド(GUM)』に規定されています。


タイプA

母集団から標本を抽出したときの平均値の変動(標準偏差)を算出する方法。その母集団は、実際に自分で測定を行い、複数のデータを得て、そのデータから推定します。

タイプB

タイプA以外の方法を用いて標準偏差を求める方法。たとえば、ピペットの公差などがこれに該当します。


5.1 タイプAの評価法

たとえば、小さじ1杯の食塩の重さについて繰り返し5回の実験を行ったところ、次のデータを得たとします。


平均値(標本平均)が6.7g、 標本標準偏差が0.5g


ここで注意したいのは、標本標準偏差は標本平均のばらつき(母集団から標本を抽出したときの平均値の変動)ではないということ。

それじゃあ、この標本標準偏差は何を意味するの?って話になるよね。

標本標準偏差は、5回の測定値が平均的にどのくらいばらついているのかを表しています。しかし、私たちが知りたいのは標本平均のばらつきであって、5回の測定値のばらつきではありません。

そこで、標本平均のばらつきの算出方法を調べると、次のことが分かりました。

  1. 繰り返し測定を行ってデータを n 個取る。(小さじで食塩を5回秤量した。)

  2. そのデータから標本平均値と標本標準偏差を算出する。(標本平均が6.7g、標本標準偏差が0.5g)

  3. 標本標準偏差を√nで割る。

1と2については既にデータの算出まで終えているので、あとは標本標準偏差を√nで割るだけ。

繰り返し5回の実験を行ったのだから、標本標準偏差である 0.5 を √5 で割った 0.22g が小さじ 1 杯の食塩の標準不確かさとなる。


5.2 タイプBの評価方法

タイプBはタイプA以外の方法、すなわち実験を行わずにばらつきを算出する方法です。

具体的には、何らかの情報から測定結果が含まれる範囲(公差など)を見つけ出し、測定結果が矩形分布(一様分布)すると仮定する。そして分布の半幅を√3で割ることで標準不確かさを算出します。

たとえば、公差が±5mlのメスシリンダーを使用して水1リットルを計量した場合、公差である5mlを√3で割った2.89mlが標準不確かさとなります。


5.3 おまけ

ここから先は興味がなければ、飛ばしても構いません。


なぜ標本標準偏差を√nで割るのか?

標本平均=母平均、標本標準偏差=母標準偏差と仮定すると、測定の母集団が推定できます。
すると、繰り返し測定を行って得た n 個のデータは、この母集団からランダムに抽出したデータということになります。

そして、母集団から「標本を抽出して、標本平均を算出する」これを何度も何度も繰り返すと、多数の標本平均が得られる。この得られた多数の標本平均は、大小さまざまな値でばらついているから、標準偏差でそのばらつきを表すことができる。これが標本平均のばらつき。

この標本平均のばらつきには重要な性質があって、母集団の標準偏差(σ)を√n で割ったものと等しくなるんだ。
式で表すと次のようになる。

標本平均のばらつき=σ√n

標本標準偏差=母標準偏差と仮定しているから、標本平均のばらつきは、標本標準偏差を√nで割ったものと等しくなる。
 
標本平均のばらつき=標本標準偏差√n


矩形(くけい)分布とは?

確率分布の1つで、範囲内のどこにでも同じ確率で存在することを意味します。
これを図にすると範囲内の yの値(高さ)はどこも μ と同じになるから、その形は長方形になります。そして、±aという範囲が与えられていれば、その標準不確かさは a/√3になることが分かっています。

もし、極端な値が存在することがないと分かっている場合、その分布は両端に向かってゼロに近づいていくから、その形は三角形になる。そして、±aという範囲が与えられていれば、その標準不確かさは a/√6になることがわかっています。