Application Note SoftMax Pro 7 ソフトウェアでの最適なweighting factorの選択

  • 最大21のcurve fitを選択
  • 同じグラフ上の複数のcurveに、カスタムまたは標準のweightingを個別に適用
  • Weighting Factors Tested protocolをダウンロード
資料ダウンロード

PDF版(英語)

はじめに

適切なweighting factorを選択することは、最良のcurve fitを得るために非常に重要であり、したがって、curve fitモデルを測定データ点にできるだけ近づけるcurve fit parameter値を得るために重要です。 weightingは、各濃度におけるdata pointの影響度を調整し、特定のdata pointやcurveの特定の領域に、より重要(またはweighting)です。

Weightingはデータの誤差をモデル化したものであり、曲線を記述する異なるデータ点における絶対誤差の差を考慮するために開発されたものです *1 。4パラメータ(4P)および5パラメータ(5P)のdose-response curve fitでは、濃度が高くなるにつれて複製間のばらつきが大きくなるため、絶対誤差は一般にcurveの上部で下部よりも大きくなります。curve上部の点の標準偏差が大きいと、curve fitとcurveパラメータの推定に大きな影響を与える可能性があります。

適切なweighting factorを選択することで、反応の分散が最も小さい領域では曲線をより適切にフィットさせ、分散が最も大きい領域ではより緩やかなフィットを実現できます *2。適切なweighting factorを選択して適用するには、データセット内のばらつきがどのように分布しているかを理解することが重要です。ばらつきの分布がわからない場合は、このアプリケーションノートに記載されているように、さまざまなweighting factor関数を評価することができます。

Weightingの使用時期

Curve weightingとweighting factorの選択は、メソッド開発中または十分な量のデータが利用可能な場合、メソッドバリデーション中に最適な curve fitが評価された後に行うべきです。すべての curve fitモデルにおいて、X(一般に濃度)は独立変数であり、Y(反応)は従属変数です。同分散データ(すべてのサンプル濃度で標準偏差が同じ場合)では、weighting factorを適用しないweightingなしのfitが最も適切なfitです。しかし、weightingは、図13に示すように標準偏差がサンプル濃度とともに増加するような異分散データで有用になります。

図1. Heteroscedastic data。Y軸に沿った散乱は、濃度が高くなるにつれて増加。

4Pや5P curve fitのようなcurve fitの中には、データ点と curveの間の垂直方向の誤差を最小にするように働くものがあります。

そうすることで、低濃度でのcurve fit は、これらの点からcurveが上方に引っ張られるため、多くのデータ点を見逃してしまう可能性があります。このため、低濃度での水平方向の補間が不正確になります。正しい係数でweightingをすることで、この問題を克服し、最も正確なcurveの推定値を得ることができ、したがって逆算された値から最も正確な濃度の推定値を得ることができます。

Weighting factors

curve fitのパラメータと推定値の精度と正確さを達成するために、いくつかのweighting factorが利用できます。最も一般的なweighting方法は、反応値の逆数に関連する要因でデータを調整するものです *3 :1/Y2 または 1/Y。1/Y2は相対weightingと呼ばれ、Yがより大きい場合に点から曲線までの平均距離がより大きくなるが、相対距離(距離/Y)が一定である場合に適しています。1/YはPoisson weightingと呼ばれ、Y値の誤差がPoisson distributionに続くときに有効です。これはデータの散らばりが計数誤差によるものである場合です。

他のweighting方法は、濃度と逆比例する要因でデータを調整するものです:1/X2または1/X。これらはグラフの左側のポイントを右側よりも加重します *4 。標準偏差の逆数のweighting係数である1/Std2は、散らばりの少ないデータ点により多くの重みを割り当てることができます。ただし、ばらつきの一貫した差を反映する複製が多数ある場合にのみ使用します。ガウス分布に従う変動には平方和の逆数を使用しますが、異常値の影響を減らすTurkey Biweightを使用します。この方法と他のweighting方法については、ここではご説明しません。

SoftMax Pro 7でweighting factorを使用する方法

デフォルトでは、SoftMax Pro® 7ソフトウェアはcurve fitにweightingを適用しません。これはFixed Weightと呼ばれ、weighting factorはcurve fitのすべてのデータポイントに対して1が設定されます。また、図2に示すように、global fitを適用したり、個々のcurveにweightを行う機能もあります。

図2. SoftMax Pro 7でweightingを適用する方法。 (A) グラフメニューのCurve Fit Settingsアイコンを選択する。(B) Curve Fit Settingsウィンドウからweightingタブを選択する。(C) ドロップダウンメニューをクリックしてweightingするcurveを選択します。選択したグラフのcurveのみが表示されます。(D) "Apply Weighting "を選択します。同じグラフ上にある異なるcurveは、独立してweightingすることができます。(E) =f [x] の数式アイコンを選択し、1/Values@Standards のような数学関数を入力します。(F) weighting factorがcurveに適用され、凡例のグラフの下に表示されます。

SoftMax Pro 7でweighting factorの良さを測定

前回のアプリケーションノート「SoftMax Proで最適なcurve fitを選択する」でご説明したように、fitの良し悪し、つまりcurve fitに適用されたweightingの良し悪しは、二乗誤差和(SSE)と赤池情報量規準(AIC)法を用いて測定することができます。

"Weighting factors tested in SoftMax Pro"と題されたプロトコルが開発され、最も一般的なweighting factorの必要な計算が実装されています: 1/Y、1/Y2、1/Std2をSSE法とAIC法を用いてテストし、比較することができます。このプロトコルは、プロトコル共有サイトからダウンロードできます。図3は、データセットを通してほとんど散らばりがないため、weightingを必要としないはずのhomoscedastic dataの例である。データは5P curve fitモデルに当てはめ、様々なweighting factorを適用しました:weightingなし(図3A)、1/Y(図3B)、1/Y2(図3C)、1/Std2(図3D)。

図3. さまざまなweighting factorを適用した5P curve fitモデルにfitしたhomoscedastic dataのweighting評価:(A)weightingなし、(B)1/Y、(C)1/Y2、(D)1/Std2。散布図評価とその結果を図4に、データの残差Plotを図5に示します。

図4. 図3に示された homoscedastic dataのスキャッター評価。 (A) 濃度結果報告全体で標準偏差が一定であることを示すグラフ。 (B) R2値、SSE、AIC、およびAICc。 (C) プロトコルのweighting resultsセクションでは、両方の方法において、5P curveに最も適合するweightは存在しないことが結論付けられています。

図5. 図3に示したhomoscedastic dataの残差Plot。残差はゼロの周りにランダムに散らばっているように見え、このモデルがデータをよく説明していることを示しています。

次の例は、heteroscedastic dataの場合を示しています(図6-8)。ここで標準偏差は、反応が増加するにつれて増加し、散乱を発生させます(図7A)。データを5P curve fitモデルにあてはめ、さまざまなweighting factorを適用しました:weightingなし(図6A)、1/Y(図6B)、1/Y2(図6C)、1/Std2(図6D)。結果は図7に要約され、1/Y2 weighting factorがデータセットに最もフィットしたことを示しています。

図6. (A)weightingなし、(B)1/Y、(C)1/Y2、(D)1/Std2。散布図評価とその結果を図7に、データの残差プロットを図8に示します。

図7. 図5に示された異方分散の散布図評価。 (A) データセット内の散布と変動を示したグラフ。 (B) R2値、SSE、AIC、およびAICc。 (C) プロトコルのweighting resultsセクションでは、両方の方法において、1/Y2の重みが5P curveに最も良い適合を示したことが結論付けられています。

図8. 図6に示したheteroscedastic dataの残差Plot。残差はゼロの周りにランダムには現れず、これは5Pモデルが、適用されたweightingに関係なく、データをうまく説明していないことを示しています。

結論

SoftMax Pro 7ソフトウェアで、選択したcurve fitモデルで最も一般的なweighting factorを検定するためのSSE法とAIC法を用いたプロトコルが開発されました。これらの統計的検定は、異なるweighting factorを適用したときの適合度を比較するのに役立ち、最も適したweightingを確信を持って選択することを可能にします。ただし、ばらつきを考慮するために、かなりの量のdata pointを確実に使用することが不可欠です。

参考文献

  1. Gottschalk, P., Dunn, J. 2005. The 5-Parameter logistic: A characterisation and comparison with the 4-Parameter logistic, Analytical Biochemistry, 54-65.
  2. Ledvij,M. 2003. Curve fitting made easy, The Industrial Physicist.
  3. Dolan, J., 2009. Calibration Curves, PartV: Curve Weighting, LC.GC.
  4. Kiser, M., and Dolan, j. 2004. Selecting the best curve fit, LC.GC Europe.

SoftMax Proソフトウェアについてさらに詳しく>> 

資料ダウンロード

PDF版(英語)