スキップしてメイン コンテンツに移動

用量探索試験と私 #5:順位和検定と用量探索試験

ある担当業務での経験

最大対比法がかなり浸透していた2000年前後,私はあるプラセボ対照用量探索試験を担当しました。それは疼痛スコア改善をエンドポイントにする試験で,たしか50点満点くらいの主観評価だったと思います。

今の私なら遠慮せず最大対比法を適用していたはずですし,おそらく私以外の人が担当していたらやっぱり最大対比法を適用するでしょう。それは今の勤め先の外資系製薬企業での対応そのものです。

しかし,当時の私は「50点満点正規性は仮定できない,順位和検定ベースで解析を」と固く考えてしまったんですね~。

しかし,最大対比法は,そしてMCP-Modも順位和検定には対応していません。こまった話ですが,「順位和検定は用量探索試験の主要解析で使うな」ということですかね。上記のようなデータの解析を今風に考えれば,「適切な閾値で二値化して最大対比法またはMCP-Mod」ということになりそうです。その「適切さ」が難しいのですが。

ステップダウン法っぽい手法?

そんな了見のない当時の私はどうしたか?

当時は多重比較の流行が単純な調整手法からステップダウン的手法に移りつつある時期だったこともあり,また順位データでの多重比較で第1種の過誤率を制御できるのかどうか確信できなかったということもあったので,DR推定問題はさておいて,仮説族を以下のように設定しました。
  • H0all: 用量間に有効性に関する単調増加な用量反応関係はなく,有効性は用量間で均一
  • H01:最高用量とプラセボ群の有効性は等しい
  • H02:次に高い用量とプラセボ群の有効性は等しい
  • H03:次に高い用量と・・・
  • ・・・
仮説の数がn個あるとき,(各単独の仮説を含めた)全ての積仮説の数は2のn乗-1になりますが,単調増加性を仮定すると,以下の手順で所定の第1種の過誤率は制御できます。
  1. 全用量+プラセボ群における傾向性検定を適用する。
  2. 1で所定の有意水準を達成できなければStop,達成できれば最高用量群とプラセボ群を所定の有意水準で比較する
  3. 2で有意水準を達成できなければStop,達成できれば次に高い用量群とプラセボ群を所定の有意水準で比較する
  4. (以下同様)
当時の私の主張は以下のようなものだったと思います。
  • プラセボ群との対比較は重要,それもできるだけ検出力の高い手法で。
  • 単調増加性を仮定すれば,ステップダウン法がよいだろう。これなら順位和検定も適用可能だし。
  • その前提として,単調増加性の確認は必要なので,傾向性検定を適用しよう。
この手順は厳密にはステップダウン法ではありませんが,後に普及するゲートキーピング法の考え方ではあります。

 企業の統計担当者として今の目で見ると色々問題はありますが,やっぱり若いというのはいいですね。

biomデータに同じ手順を適用すると…

片側2.5%の有意水準での結果は以下の通り:
  1. Jonckheere検定(傾向性検定):p=0.0002=>単調増加性あり
  2. 0 vs. 1: p=0.0034=>有意差あり
  3. 0 vs. 0..6: p=0.0077=>有意差あり
  4. 0 vs. 0.2: p=0.0098=>有意差あり
  5. 0 vs. 0.05: p=0.2068=>有意差なし
ということで,用量0.05以外はすべて臨床用量候補に名乗りを上げることに。0と0.2の比較結果が多重比較の結果と違ってくるのは興味深いですね。

その頃私は:初の海外出張,そして東京に転勤

冒頭の担当業務を始めた2000年=ミレニアム(死語)前後は色々ありました。

まず初の海外出張。場所はアメリカのコロラド州デンバー,目的は学会参加でしたが,今ならなかなか行かせてもらえないでしょう。「昔はよかった」ということですね。

この学会で見たもの聞いたものは,当時の私にとっては衝撃でした。明確な考えではなかったけど,「変化について行かないと」とぼんやりと感じたように思います。

次に更なる合併と東京転勤。2001年11月,Mという財閥系の製薬企業との合併に伴い,再び東京勤務に。このMという会社自体,2社が合併してできたので,都合2+2=4社の所帯になったということですね。

当時は内資系製薬企業同士の合併が続いていましたね~。「小さい会社じゃ世界で太刀打ちできない」的発想だったのかもしれませんが,世界で戦うには規模ではなくビジネスの種を持っているかどうかが重要だと思います。


コメント

このブログの人気の投稿

研究ログ:ノンパラメトリックANCOVA

ノンパラメトリックANCOVAとは? 確率的順序で表される治療効果に対して共変量の平均値の差による回帰モデルを仮定して解析する手法。その回帰モデルでは,「共変量の平均値の差は0である」という制限を課した上で治療効果が推定される。この仮定はデータがランダム化臨床試験から得られたものという前提条件に由来する。 ノンパラメトリックANCOVAの利点 このモデルでは,確率的順序の推定値と共変量の標本平均の群間差を結合したベクトルに対し,「共変量の平均値の差が0」という射影行列を用いてモデル化する。このモデルさえ仮定すれば,確率的順序は重み付き最小二乗法を用いて推定される。このモデルに必要なのはデータがランダム化臨床試験から得られたという事実のみである。 ノンパラメトリックANCOVAの問題点 モデルは応答変数・共変量共に「平均値の差」を扱うものなので,個々の被験者の共変量に対する個々の被験者の応答の予測はできない。 また,この手法は層間・サブグループ間で治療効果の交互作用の存在を想定しておらず、またその評価も検討されていない。特に連続型共変量の場合,「平均値の差を扱う」モデルの性質上,「共変量の値(差ではない)によって治療効果が異なる」という説明が難しい 。 理論的側面としては,検定・信頼区間はWald型なので,データの状況次第(サンプルサイズが小さい,確率的順序が0または1に近い)では信頼区間の限界値が0または1を超える場合がある。 参考文献  Kawaguchi A, Koch G, Wang X (2011), Stratified Multivariate Mann-Whitney Estimators for the Comparison of Two Treatments with Randomization Based Covariance Adjustment. Statistics in Biopharmaceutical Research, 3(2), 217-231

用量探索試験と私 #7:いよいよ登場MCP-Mod

MCP-Mod概略 いよいよ本題です。 MCP-Modの原著は2005年公開。その名の通り「多重比較(MCP)」と「用量反応関係のモデル化(Mod)」の2部構成で, あらかじめ代表的な用量反応関係モデル候補を決めておく 個々のモデルにいくつかの初期値を与え,各モデルにフィットするような用量群の平均パラメータについての対比を決める 2で決めた対比を,多重性を調整して同時に検定する 3で有意差のあった対比に対応する用量反応関係モデルの中で当てはまりが最もよい(AICが小さい)ものを用量反応関係モデルに採用する という手順になっています。 biomデータに適用 早速実演ですが,話を簡単にするために,用量反応関係モデル候補は以下の3つにしました。 線形モデル(単調増加) Emaxモデル(ある用量でプラトー) 2次関数(Downturn) 対比検定 (片側)検定結果は以下の通り 線形モデル:p=0.0034 Emaxモデル:p≺0.0001 2次関数:p=1.0000 従って,2次関数モデルはここで脱落し,線形モデルとEmaxモデルの選択になります。 AICによる選択 AICは以下の通り 線形モデル:7.5549 Emaxモデル:6.2981 従って,biomデータが 上記3つのモデル候補の中で もっともよく当てはまるのはEmaxモデルとなります。 グラフにすると… このグラフを見て臨床用量候補を決めろと言われれば… Emax曲線が見た目プラトーになっているのは用量0.4以降 用量1でのEmax曲線の95%信頼区間幅が用量0.6よりやや広いのが気になる 臨床用量候補には0.6を選ぶのが無難 結局これまでと一緒か…。  その頃私は:ざわざわ… 学位取得はうまく行かない一方で今の妻との交際は順調,2007年に結婚。こんな私でも結婚できるんですね~。さらに,その翌年の元日には長男誕生。 プライベートはまさしく順調という感じに進んだ時期でしたが,仕事はかなり荒れ気味に。人に仕事を振れない,「人をリードする仕事」があることを知らない,といった点は私の問題でしたね。 でもそれはそれで学ぶことの多かった時期でもあり,私にとってはやはり必要な時期だったのでしょう。 ただし会...

用量探索試験と私 #4:最大対比法

「対比」の評価の拡張:最大対比法 対比較によるMEDの「検定」の問題点が指摘されていた1990年代中~後半、最大対比法という方法論が提唱され始めました。 対比の概念自体は当時も既存のものでしたが,複数の対比を同時に検討するのが新しい点。それに伴う多重性への対応が問題でしたが,データのリサンプリングにより同時分布をシミュレートするという,最も単純な,しかしコンピュータの性能を最大限活かしたアプローチで見事解決。背景にはSASのMULTTESTプロシジャのリリースがあったようですが,当時私はすごく感動を覚えていたように思います。 最大対比法の特徴を改めて考えると, Dunnett法等の多重比較手法も網羅している 検定結果は「用量間で応答分布に差がない」という帰無仮説を棄却できるかどうかの判断根拠 あとは当てはまりの良さそうな対比を選び,それに基づき臨床用量候補を選び出すだけ といった所でしょうか。かなりモザイク模様ではありますがDR推定問題も考慮している点で実用的な手法だと思います。 Rによる最大対比法 今回の解析は全てRを用いたものです。Rでもリサンプリング法を実装するmulttestパッケージがかつては存在しましたが,今はリタイアしているらしい。今はmultcompという別のパッケージで実装するよりなさそうですが,このパッケージではリサンプリングではなく理論的な多変量分布を用いて複数対比の評価を行います。 biomデータの解析結果 結果は以下の通り。 比較 対比 調整P値 0.05でプラトー (-4,1,1,1,1) 0.017 0.2でプラトー (-7,-2,3,3,3) 0.0019 0.6でプラトー (-9,-4,1,6,6) 0.0013 線形 (-2,-1,0,1,2) 0.0014 1で降下 (-8,-3,2,7,2) 0.0022 対比の設定については議論の余地があるものの,この結果から分かることは, P値は全て2.5%より小さいので,有意水準を片側2.5%とすれば,プラセボに比して実薬が有効であろうことは推察できる。 もっともP値が小さいのは「0.6でプラトー」なので,この結果から選ぶ臨床用量候補としては0.6と1ということになる ただし「線形」対比もP値としては近いので,用量1...