用量探索試験と私 #3：最小有効用量

至適用量（optimal dose）と最小有効用量（minimum effective dose，MED）

私が就職した1996年前後，というより今もそうかもしれませんが，用量探索試験の目標は以下の2点で集約されていたように思います。

少なくとも「薬として有効」な用量を選ぶ
同じ有効性ならば，安全性の観点からできるだけ低い用量を選ぶ

当時は「至適用量」という表現でこの考えを表していたように記憶しています。

実際の臨床試験では安全性データも加味して，現実的に「至適用量」を決めることになりますが，ここでの事例ではどうやってこの「至適用量」を探り出すか？

当時多く引用されたのは「最小有効用量（minimum effective dose，MED）」の考え方で，簡単に言えば「十分な有効性を示す用量のうちで最小のもの」を探ろうというものです。実に単純。

そこで当時は「プラセボ対照試験であれば，プラセボと有意な差のある最小用量を見つければよい」という考えに至ったようです。ただし，単純に対比較を繰り返すと第1種の過誤率増大を招くので，適切に調整をする必要があります。

多重比較

ここでは「Bonferroni法」「Dunnett法」の2種類の調整を用いて片側P値を計算しました。結果は以下の通り。


比較	未調整P値	Bonferroni調整済　　P値	Dunnett調整済　P値
0 vs. 0.05	0.3103	1.0000	0.6033
0 vs. 0.2	0.0208	0.0831	0.0655
0 vs. 0.6	0.0052	0.0206	0.0178
0 vs. 1	0.0043	0.0173	0.0151

有意水準を片側2.5%と設定すると，有意差ありとなった結果には下線を引いています。多重性は調整が必要なので，Bonferroni法もしくはDunnett法を主解析と定義すれば，

MEDは0.6
1をその後検討対象とするかどうかは要検討
その他の用量は以後の検討対象から外す

という結論になりそうです。

この結論の問題点

上記のMEDを巡るロジックについては，当時もいくつか問題点が指摘されていました。

問題点1：サンプルサイズによってMEDの結論が変わり得る

統計的検定のみをMEDの基準にしてしまうと，サンプルサイズが小さいとMEDを高く推定する傾向が強くなるのが道理です。逆に言えば，サンプルサイズがとてつもなく大きい用量探索試験では，かなり低い用量でもMEDになり得る。なんだかおかしい話です。

問題は「薬として有効」の基準が統計的検定の結果しかない，つまり「効果ゼロでなければいいや」という発想にあります。

MEDの評価基準は決め事なので「これでいいのだ」とスポンサーが言うのは勝手ですが，元の至適用量の概念からは逸脱しています。

問題点2：用量反応関係が全く考慮されない

上記結論は「プラセボとの多重比較を並べた」だけで，結論として用量反応関係につなげることは難しいです。

ある種の用量反応関係が成り立てば検出力が高い
その用量反応関係が成り立たなければ，検出力が低くなる

ような「感度のよい」手法の方が望ましいと思います。

このブログの人気の投稿

研究ログ：ノンパラメトリックANCOVA

ノンパラメトリックANCOVAとは？確率的順序で表される治療効果に対して共変量の平均値の差による回帰モデルを仮定して解析する手法。その回帰モデルでは，「共変量の平均値の差は0である」という制限を課した上で治療効果が推定される。この仮定はデータがランダム化臨床試験から得られたものという前提条件に由来する。ノンパラメトリックANCOVAの利点このモデルでは，確率的順序の推定値と共変量の標本平均の群間差を結合したベクトルに対し，「共変量の平均値の差が0」という射影行列を用いてモデル化する。このモデルさえ仮定すれば，確率的順序は重み付き最小二乗法を用いて推定される。このモデルに必要なのはデータがランダム化臨床試験から得られたという事実のみである。ノンパラメトリックANCOVAの問題点モデルは応答変数・共変量共に「平均値の差」を扱うものなので，個々の被験者の共変量に対する個々の被験者の応答の予測はできない。また，この手法は層間・サブグループ間で治療効果の交互作用の存在を想定しておらず、またその評価も検討されていない。特に連続型共変量の場合，「平均値の差を扱う」モデルの性質上，「共変量の値（差ではない）によって治療効果が異なる」という説明が難しい。理論的側面としては，検定・信頼区間はWald型なので，データの状況次第（サンプルサイズが小さい，確率的順序が0または1に近い）では信頼区間の限界値が0または1を超える場合がある。参考文献 Kawaguchi A, Koch G, Wang X (2011), Stratiﬁed Multivariate Mann-Whitney Estimators for the Comparison of Two Treatments with Randomization Based Covariance Adjustment. Statistics in Biopharmaceutical Research, 3(2), 217-231

用量探索試験と私 #7：いよいよ登場MCP-Mod

MCP-Mod概略いよいよ本題です。 MCP-Modの原著は2005年公開。その名の通り「多重比較（MCP）」と「用量反応関係のモデル化（Mod）」の2部構成で，あらかじめ代表的な用量反応関係モデル候補を決めておく個々のモデルにいくつかの初期値を与え，各モデルにフィットするような用量群の平均パラメータについての対比を決める 2で決めた対比を，多重性を調整して同時に検定する 3で有意差のあった対比に対応する用量反応関係モデルの中で当てはまりが最もよい（AICが小さい）ものを用量反応関係モデルに採用するという手順になっています。 biomデータに適用早速実演ですが，話を簡単にするために，用量反応関係モデル候補は以下の3つにしました。線形モデル（単調増加） Emaxモデル（ある用量でプラトー） 2次関数（Downturn）対比検定（片側）検定結果は以下の通り線形モデル：p=0.0034 Emaxモデル：p≺0.0001 2次関数：p=1.0000 従って，2次関数モデルはここで脱落し，線形モデルとEmaxモデルの選択になります。 AICによる選択 AICは以下の通り線形モデル：7.5549 Emaxモデル：6.2981 従って，biomデータが上記3つのモデル候補の中でもっともよく当てはまるのはEmaxモデルとなります。グラフにすると… このグラフを見て臨床用量候補を決めろと言われれば… Emax曲線が見た目プラトーになっているのは用量0.4以降用量1でのEmax曲線の95%信頼区間幅が用量0.6よりやや広いのが気になる臨床用量候補には0.6を選ぶのが無難結局これまでと一緒か…。その頃私は：ざわざわ… 学位取得はうまく行かない一方で今の妻との交際は順調，2007年に結婚。こんな私でも結婚できるんですね～。さらに，その翌年の元日には長男誕生。プライベートはまさしく順調という感じに進んだ時期でしたが，仕事はかなり荒れ気味に。人に仕事を振れない，「人をリードする仕事」があることを知らない，といった点は私の問題でしたね。でもそれはそれで学ぶことの多かった時期でもあり，私にとってはやはり必要な時期だったのでしょう。ただし会...

用量探索試験と私 #4：最大対比法

「対比」の評価の拡張：最大対比法対比較によるMEDの「検定」の問題点が指摘されていた1990年代中～後半、最大対比法という方法論が提唱され始めました。対比の概念自体は当時も既存のものでしたが，複数の対比を同時に検討するのが新しい点。それに伴う多重性への対応が問題でしたが，データのリサンプリングにより同時分布をシミュレートするという，最も単純な，しかしコンピュータの性能を最大限活かしたアプローチで見事解決。背景にはSASのMULTTESTプロシジャのリリースがあったようですが，当時私はすごく感動を覚えていたように思います。最大対比法の特徴を改めて考えると， Dunnett法等の多重比較手法も網羅している検定結果は「用量間で応答分布に差がない」という帰無仮説を棄却できるかどうかの判断根拠あとは当てはまりの良さそうな対比を選び，それに基づき臨床用量候補を選び出すだけといった所でしょうか。かなりモザイク模様ではありますがDR推定問題も考慮している点で実用的な手法だと思います。 Rによる最大対比法今回の解析は全てRを用いたものです。Rでもリサンプリング法を実装するmulttestパッケージがかつては存在しましたが，今はリタイアしているらしい。今はmultcompという別のパッケージで実装するよりなさそうですが，このパッケージではリサンプリングではなく理論的な多変量分布を用いて複数対比の評価を行います。 biomデータの解析結果結果は以下の通り。比較対比調整P値 0.05でプラトー (-4,1,1,1,1) 0.017 0.2でプラトー (-7,-2,3,3,3) 0.0019 0.6でプラトー (-9,-4,1,6,6) 0.0013 線形 (-2,-1,0,1,2) 0.0014 1で降下 (-8,-3,2,7,2) 0.0022 対比の設定については議論の余地があるものの，この結果から分かることは， P値は全て2.5%より小さいので，有意水準を片側2.5%とすれば，プラセボに比して実薬が有効であろうことは推察できる。もっともP値が小さいのは「0.6でプラトー」なので，この結果から選ぶ臨床用量候補としては0.6と1ということになるただし「線形」対比もP値としては近いので，用量1...

つーさんとつみちゃんの日記

このブログを検索