スキップしてメイン コンテンツに移動

用量探索試験と私 #8:最新の多重比較手法

ステップダウン法っぽい手順の再考

また本題を外れます。
以前「ステップダウン法っぽい手順」と称して以下の手順を紹介しました。
  1. プラセボ群を含む全ての用量群における応答の単調増加性を検定する。
  2. 1で単調増加性が確認できた場合に限り,高用量から順にステップダウン法でプラセボ群と対比較し,有意差が認められなくなった時点で検定を止める。
この手順を採用した時にも開発チームから指摘されていた点ですが,素朴に

「単調増加性をそこまで仮定していいの?」

「ステップダウン法で最初に有意差なかったら終わりでしょ?でも次の用量でもしプラセボ群と差があっても比較できないんだよね?」

という疑問が残ります。
当時の私は

「いやいや,本当に効く薬なら単調増加性は成り立つはずでしょ?プラセボ群も含めてるし。」

と言い張っていました。

今の視点で言えば,私の主張には以下の問題があります。
  • ある種の薬剤においては,ある用量以上で平均反応が減少に転じるDownturn型の用量反応関係を示すことがある。
  • そうでなくても,もし選んだ用量が高すぎもしくは低すぎであれば,実薬群の用量反応関係はフラットなものに近くなり,単調増加的にならない可能性がある。
担当していた件の薬剤の性質上,開発チームはきっと効果に疑問を持っていたのでしょう。それでも私の主張を通してくれたチームの方々にはただただ感謝です。

改善案

第2相試験であることを考慮すれば,当時のチームの指摘に対応した改善手順は以下のようになるでしょう。
  1. プラセボ群とそれ以外の全ての用量を併合した実薬群の応答を2群比較の形で行う。
  2. 1で有意差が確認できた場合に限り,プラセボ群と各用量群をHolms法で対比較する。
要は「単調増加性」の確認を直接行わないという方針への変更です。Holms法はBonferroni法の変法の1つで,個々の比較に対するp値を小さい順に並べ,ここでは比較の数は4なので,最も小さいp値に対しては4倍,次に小さいp値に対しては3倍,次は2倍,最も大きいp値はその値自信を調整p値として検定するものです。

こう書くと目新しさはないのですが,これを「有意水準の分配?」という見方で説明すると以下のようになります。
  1. プラセボ群と実薬の併合群を片側2.5%の有意水準で比較する。
  2. 1で有意差が認められなければプラセボ群と用量群の対比較は実施されない。 有意差が確認されれば,4組の対比較に対し均等に2.5%の有意水準を「分配」する。
  3. 4組の対比較をいったん片側2.5/4%で実施する。
  4. 3において全てで有意差が認められなければ検定は終了する。いくつかの対比較で有意差が認められた場合,その比較における有意水準2.5/4%を残り3組の対比較に均等に「分配」する。
  5. 3で有意差が認められた対比較のうち,p値の最も小さい対以外の対比較を,2および4で「分配」された総有意水準で実施する。
  6. 5において全てで有意差が認められなければ検定は終了する。いくつかの対比較で有意差が認められた場合,その比較における有意水準を残り2組の対比較に均等に「分配」する。
  7. 5で有意差が認められた対比較のうち,p値の最も小さい対以外の対比較を,2,4,6で「分配」された総有意水準で実施する。
  8. 7において全てで有意差が認められなければ検定は終了する。いくつかの対比較で有意差が認められた場合,その比較における有意水準を残り1組の対比較に「分配」する。
  9. 7で有意差が認められた対比較のうち,p値の最も小さい対以外の対比較を,2,4,6,8で「分配」された総有意水準で実施する。
  10. 検定終了
この手順の面白いところは,以下のような一般化が可能なところです。
  • 上記手順2では「プラセボと併合群の比較で有意差が認められなければ対比較は実施しない」と制約しているが,Bonferroniの不等式に基づき有意水準を対比較と2の比較で「分配」し,2で有意差がなくても対比較を実施する。
  • 有意差の認められた対比較の有意水準を「均等に分配」するのではなく,ビジネス上の戦略などを加味して,重みをつけて「分配」する。
なお,このアプローチは文章による説明が難しいので,2009年前後にグラフィカルアプローチという形で提案されています。

biomデータへの適用結果

結果は以下の通りです。
  • プラセボ群と実薬併合群:有意差あり
  • プラセボ群と用量1群:有意差あり
  • プラセボ群と用量0.6群:有意差あり
  • プラセボ群と用量0.2群:有意差なし
  • プラセボ群と用量0.05群:有意差なし

その頃私は:転職

2000年代後半は「5社合併」の大所帯での仕事が色々軋み始めた時期でした。

多様性とは真逆なスタッフの配置,過去の成功体験へのこだわり,…。この点についてはこの「5社目」で特に強くなりました。かなり居心地の悪さはありました。「口は笑ってても目が笑わない」上司と話すのもこの時期初経験。

そして社員間でも嫌がらせが見られたり,それを見て見ぬふりをしたり…。

ちょうどそんなときに転職エージェントから声がかかりました。まさしく渡りに船,色々候補会社がありましたが,一緒に仕事をしたことのあった今の外資系会社に転職。

転職して思ったのは「女性の割合がかなり多い」ことと「人と人の距離感がやや遠い」こと。前者は特に驚きでした。今もそうですが,これは「女性に活躍の場を与えよう」という考えではなく,「必要な人を雇っていたら女性が多くなった」という結果です。後者は転職組が大半なので当然の成り行き。

ただ,転職当初,元先輩(転職前の会社の)二人から言われたコメントが対照的で面白い。

先輩F:「周りには100人の敵がいると思ってがんばれ」

先輩I:「君の人柄があれば大丈夫」

このお二方のキャラクターそのままが出たコメントではあるのですが,じつはこの方々も私に先んじて転職していて,Fさんは内資系(一族)会社,Iさんは外資系企業に転職しています。このお二人には今も頭が上がりません。

家庭は順調。子供も無事に育ち,妻も働くので保育園に預けることに。1歳から預けるということで,当初私は子供の行く先をかなり心配していました。でも,しばらくすると子供も親も慣れました。私の心配性はどうしようもないですね。

いずれにせよ,私の人生はちょっとギアチェンジした時期でした。



コメント

このブログの人気の投稿

研究ログ:ノンパラメトリックANCOVA

ノンパラメトリックANCOVAとは? 確率的順序で表される治療効果に対して共変量の平均値の差による回帰モデルを仮定して解析する手法。その回帰モデルでは,「共変量の平均値の差は0である」という制限を課した上で治療効果が推定される。この仮定はデータがランダム化臨床試験から得られたものという前提条件に由来する。 ノンパラメトリックANCOVAの利点 このモデルでは,確率的順序の推定値と共変量の標本平均の群間差を結合したベクトルに対し,「共変量の平均値の差が0」という射影行列を用いてモデル化する。このモデルさえ仮定すれば,確率的順序は重み付き最小二乗法を用いて推定される。このモデルに必要なのはデータがランダム化臨床試験から得られたという事実のみである。 ノンパラメトリックANCOVAの問題点 モデルは応答変数・共変量共に「平均値の差」を扱うものなので,個々の被験者の共変量に対する個々の被験者の応答の予測はできない。 また,この手法は層間・サブグループ間で治療効果の交互作用の存在を想定しておらず、またその評価も検討されていない。特に連続型共変量の場合,「平均値の差を扱う」モデルの性質上,「共変量の値(差ではない)によって治療効果が異なる」という説明が難しい 。 理論的側面としては,検定・信頼区間はWald型なので,データの状況次第(サンプルサイズが小さい,確率的順序が0または1に近い)では信頼区間の限界値が0または1を超える場合がある。 参考文献  Kawaguchi A, Koch G, Wang X (2011), Stratified Multivariate Mann-Whitney Estimators for the Comparison of Two Treatments with Randomization Based Covariance Adjustment. Statistics in Biopharmaceutical Research, 3(2), 217-231

用量探索試験と私 #7:いよいよ登場MCP-Mod

MCP-Mod概略 いよいよ本題です。 MCP-Modの原著は2005年公開。その名の通り「多重比較(MCP)」と「用量反応関係のモデル化(Mod)」の2部構成で, あらかじめ代表的な用量反応関係モデル候補を決めておく 個々のモデルにいくつかの初期値を与え,各モデルにフィットするような用量群の平均パラメータについての対比を決める 2で決めた対比を,多重性を調整して同時に検定する 3で有意差のあった対比に対応する用量反応関係モデルの中で当てはまりが最もよい(AICが小さい)ものを用量反応関係モデルに採用する という手順になっています。 biomデータに適用 早速実演ですが,話を簡単にするために,用量反応関係モデル候補は以下の3つにしました。 線形モデル(単調増加) Emaxモデル(ある用量でプラトー) 2次関数(Downturn) 対比検定 (片側)検定結果は以下の通り 線形モデル:p=0.0034 Emaxモデル:p≺0.0001 2次関数:p=1.0000 従って,2次関数モデルはここで脱落し,線形モデルとEmaxモデルの選択になります。 AICによる選択 AICは以下の通り 線形モデル:7.5549 Emaxモデル:6.2981 従って,biomデータが 上記3つのモデル候補の中で もっともよく当てはまるのはEmaxモデルとなります。 グラフにすると… このグラフを見て臨床用量候補を決めろと言われれば… Emax曲線が見た目プラトーになっているのは用量0.4以降 用量1でのEmax曲線の95%信頼区間幅が用量0.6よりやや広いのが気になる 臨床用量候補には0.6を選ぶのが無難 結局これまでと一緒か…。  その頃私は:ざわざわ… 学位取得はうまく行かない一方で今の妻との交際は順調,2007年に結婚。こんな私でも結婚できるんですね~。さらに,その翌年の元日には長男誕生。 プライベートはまさしく順調という感じに進んだ時期でしたが,仕事はかなり荒れ気味に。人に仕事を振れない,「人をリードする仕事」があることを知らない,といった点は私の問題でしたね。 でもそれはそれで学ぶことの多かった時期でもあり,私にとってはやはり必要な時期だったのでしょう。 ただし会...

用量探索試験と私 #6:ゲートキーピング法

ゲートキーピング法 前回触れた「ゲートキーピング法」の補足です。 2000年代前半,多用量群だけでなく「多変量」「多時点」「多集団」にも適用可能な汎用的多重比較手法のニーズが高まってきました。 前回のbiomデータの解析では,以下の2段階で検定を実行しました。 プラセボ群を含む全ての用量群における単調増加性の存在をJonckheere検定で確認する。 1で単調増加性が認められた場合に限り,プラセボ群と用量群の比較を高用量からのステップダウン法でWilcoxon検定により実施する。 これをゲートキーピング法の言葉で表現すると, 「プラセボ群を含む全ての用量群において単調増加性はなく,分布は全て等しい」という帰無仮説族F1(実際は1つだけの仮説)と「プラセボ群と個々の用量群で分布は等しい」という4つ(4用量分)の仮説を含む帰無仮説族F2を設定する。さらに,F2に含まれるプラセボ群と用量1,0.6,0.2,0.05の分布に関する帰無仮説をそれぞれF21,F22,F23,F24とする。 F1とF2は直列ゲートキーピング法で検定する。つまり,F1はF2の検定のためのゲートキーパーであり,F1が棄却されない限りF2を検定することはない。 さらにF21~F24も直列ゲートキーピング法で検定し,F21はF22の,F22はF23の,F23はF24のゲートキーパーである。各ゲートキーパーの帰無仮説が棄却されない限り,その後に続く帰無仮説が検定されることはない。 となるでしょうか。 もし,プラセボ群との対比較がDunnett法等ステップダウン法でない同時比較だった場合,3の手順は以下のようになります。 「F21~F24を 並列 ゲートキーピング法で検定する。F21~F24の各帰無仮説の棄却は,自身が棄却されさえすればよいが,適切に多重性を調整する。」 ゲートキーピング法は汎用的な多重比較の考え方なので,「複数変数」「複数時点」「複数サブグループ」等,色々な状況で適用可能です。 仮説族を「直列に配線」するか「並列に配線」するかは,その仮説族の重要性に依存します。上記手順は,当時の私が「薬剤の単調増加性」を重視した結果です。 その頃私は:挫折?と幸運 さて、勤め先の合併に伴い東京に舞い戻った私ですが,当時開講された社会人向け医薬統計大...