2019.12.02

EMA Journal Club 第1回 質問2の解説

第1回JC 根拠となる論文の提示、論文の種類とヒエラルキー

 喘息におけるMgについて少し文献を使って調べてみよう。いったいどんなエビデンスがあるだろうか。エビデンスの強さを整理してみよう。

 EBMにおいて、エビデンスは階層化されている。予防と治療においての決断に関するエビデンスの階層が有名であるが、以下のようになっている。

名称未設定

 RCTとは治療群、対照群を無作為(ランダム)に割り付けてバイアスを排除することを目的とした試験であり、無作為割付けを行わない観察研究よりもエビデンスレベルははるかに高い。1つのRCT、1つの観察研究共に、systematic reviewと呼ばれる複数の文献を系統的に評価する手法を取った研究にはかなわないが、systematic reviewと言えどもそれが複数の観察研究から成るものでは、1つのRCTよりエビデンスレベルは低い。とんちんかんなデータを100個集めても、まともなデータ1つには敵わないということである。多数決が必ずしも正解ではない。日本語の「3人寄れば文殊の知恵」は当てはまらない。むしろ数が集まることにより一見正当な答えに見えてしまい、とても危険をはらんでいる(今後のJCで扱いますので楽しみにしていてください)。

 観察研究は曝露因子(例えば高血圧)とoutcome(例えば脳卒中や心筋梗塞)の因果関係について交絡因子(例えば年齢、性別、糖尿病など)を調整して調べるものである。観察研究といっても、おおまかに3種類に分けられる。ある一時点での評価をするものを横断研究、前向きにこれから起こることを検討していくものをコホート研究、後ろ向きに起きたことを検討していくものを症例対照研究と言う。一般的にはコホート研究の質が高いとされるが、前向き故に、追跡から脱落した患者の評価が問題になる。症例対照研究では曝露因子の調査時に思い出しバイアスがかかることが問題になる。

 RCTは治療効果を検討するにはとても有用である。なぜならばバイアスの中で特に治療効果の評価に影響を与える交絡因子すべてをランダム化によって一気に排除することができるからである。観察研究では未確認の交絡因子を排除できない。そのため一般的には観察研究よりもエビデンスが高いとされている。

 しかし観察研究は患者の選択バイアスを排除することにおいて有利であり(RCTはコンプライアンスの良い患者が選択される傾向にあるため)、一概にRCTに劣るわけではない。研究そのものの妥当性(内的妥当性という)はともかく、実際の患者に当てはめる際の妥当性(外的妥当性という)は観察研究において高い。また頻度は低いものの重篤な薬の副作用は、RCTでは十分な評価ができないことが多く、観察研究のほうが優れていることが多い。

 N-of-1RCTというのは、別の集団を対象にしたエビデンスを元に、実際の目の前の患者にそれが適応できるものなのかどうかを、医師、患者共に盲検化し、実際に証明するものである。例え5人に1人効果のある治療だとしても、あなたの目の前の患者がその1人に当てはまるのか、残りの4人に当てはまるのかは分からない。これは慢性疾患が主に対象となり、われわれ救急領域にはあまり適したものではない。

 では情報はどのように調べるか。そもそも情報源はどのようなものがあるかもう一度整理する。大きく分けて4つである。研究、サマリー(systematic reviewとガイドライン)、synopsis、systemの4つである。

 1つめの研究はまさにその名の通りである。一次研究があってこそのエビデンスではあるが、数は膨大で、研究の質も様々である。例はRCT、観察研究などである。

 2つめのsummary(systematic reviewとガイドライン)とは、一次研究から得たエビデンスを要約しているものである。例はsystematic reviewや各国のガイドライン、ACEP Clinical Policyなどである。

 3つめのsynopsis(シノプシス=概要)とは、研究やsystematic reviewを専門家が吟味し評価したものである。専門家からのガイドやアドバイスなどが加えられたり、原著論文では掲載されていないが重要なstudy designなどに触れられることもある。例はACP Journal Clubなどがある。

 4つめはsystemは教科書型情報源であり、一次研究からsystematic review、ガイドラインなどを統合して、総合的な指針などを示すものである。例としてはUp To DateやClinical Evidence、eMedicineなどがある。

 

 年々発表される文献数は増大しており、一次研究から全ての文献に目を通すなど不可能である。そのため一次研究からsystemまでをうまく使い分け、幅広い情報を得ていかなければならない。ある研究によると、エコーの専門家になるために一次研究を含めた全ての研究に目を通すと成ると、尋常じゃない時間を日々費やしたとしても、約40年かかるという・・・。達成と同時に定年退職である。満足感と共に人生が終わるのか、むなしくなるかはあなた次第であるが。

 推奨としては、まずはsystemと呼ばれる教科書型情報源にアクセスし、その後synopsisやsummaryに必要に応じてアクセスする。それでも解決できない問題点については、一次文献を探すためPubMedなどの大規模文献データベースで検索するといった方式がよい。

 ではエビデンスの種類も分かった、情報源の種類も分かったなら次はどうしたら良いだろうか。まずは自分の疑問を明確にすることである。

 疑問は治療、害、鑑別診断、診断、予後の大きくわけて5つに分けられる。この目の前の患者に対してどうしたら良いのかといった治療、予後についての前向きな疑問(foreword question)に対してはPICO (=PECO)での疑問の形式化が有用である。また患者や疾患における一般的な問題における疑問はbackword questionと言われ、5W1H(who, what, where, when, why, how)が有用である。例としては今回のように目の前の喘息患者にMgを投与すべきかどうかといった疑問についてはPICOを用い、喘息の重症度診断はどうやって行うのかといったことは5W1Hを用いるべきである。

 PICOは自分自身の疑問を明確にする際だけでなく文献で扱う疑問点を明確にする際、PubMedなどを用いて文献検索を行う際などにも有用なのでぜひとも覚えて頂きたい。

PICO

では冒頭の症例に戻って疑問を形式化してみよう。PICOに沿って行うと、

  P 喘息発作の患者に、

  I 静注Mgを投与すると、

  C 静注Mgを投与しない場合と比較して、

  O 死亡、入院、呼吸機能はどう変化するだろうか

となる。

 まず教科書を読んでみよう。ERの成書と呼ぶにふさわしいTintinalliでは、

「FEV1<25%predictedのような急性の最重症発作では静注Mgは適応であるが、軽症から中等症の発作では適応ではない。(Rowe BH, Bretzlaff JA, Bourdon C, et al: Magnesium sulfate for treating exacerbations of acute asthma in the emergency department. Cochrane Database Syst Rev 2: CD001490,

2000.)(中略)。投与方法は1~2gを30分以上かけて投与する。」

とされている。

 またsystemの代表的存在であるUp To Dateでは、

「生命の危機のある発作や、1時間の通常の治療後もPEFRがpersonal best PEFRの<40%の場合、静注Mgが推奨される。投与方法は2gを20分以上かけて行う。(Rowe BH et al:Intravenous magnesium sulfate treatment for acute asthma in the emergency department: a systematic review of the literature. Ann Emerg Med. 2000;36(3):181-90.)」

とされている。

 

 これらの根拠となっているコクラン、Annals of Emergency Medicineに掲載された上記サマリーを参照してみる。PICOを当てはめてみると、

PICO2

となる。どうやら冒頭の症例での疑問と大筋一致するようである。

 このsystematic reviewは組み入れ基準、除外基準も明確であり、評価者間での一致も高い。Systematic reviewとしては合計7つのRCTを組み込んでおり、それぞれのRCTの質も高く、systematic reviewの方法の質も高い(systematic reviewの質の評価については今後のJCを参考にしてください)。

 対照群はβ刺激薬の吸入(詳細なし)、ステロイド(多くはメチルプレドニゾロン125mg IV)を使用し、Mgは多くは1時間以内(2つの研究が90min後)に、多くの成人の研究は2g(1つは1.2g)、小児では25~100mg/kgの投与であった。投与時間は20分以上かけて投与するものが多かった。

 重症発作の定義は「予測%FEV1<25%(1時間の吸入治療後)」、「受診時の予測% FEV1≦30%」、「PEFR<200ml+2回の吸入かつ1時間以上経過後にPEFRが倍増しなかった場合」、「3回の吸入治療後の予測%PEFR<60%」、「“重症喘息発作”+初期治療に反応しない」など様々であったが、placebo群の入院率が1つのRCTを除きほぼ一貫性を持っていたため、同様の患者群が含まれていると推測される。

 結果としては、7つのRCTで合計668人が参加。結果を以下に表す。

PICO3

※ 下線は統計学的有意差があったことを示す

全体で見ると異質性が高く、研究間でのばらつきが高いことが示唆されたが、

重症、軽症〜中等症で分類すると、異質性は共に低く、研究間でのばらつきは小さいことが示唆され、同等の結論を持っている可能性が高いと推測された。視覚的にもそれぞれの研究は重症度で分類した場合には、一貫性を持っていると読み取れる(実際の図表は掲載できませんので、文献を直接参考にしてみてください)。しかもそれらの結果は偶然では説明できない範囲にあった。(これらの研究間のばらつきを示す異質性については、後のJCでまた話題にあがると思います。)

 サブグループ解析は特に注意が必要であるが、サブグループ解析について注意しなければいけない7点を確認すると、信用に足るものであることが分かる。(医学文献ユーザーズガイドもしくは今後のJCを参照してください、)

 バイタルサイン、有害事象については統計的に有意差のあるものは認められなかった。しかし一般的に害(有害事象)を検討するためにはRCTは不適切なことが多いため、注意が必要である。

 

まとめると

PICO4

 となる。

 今回のJCはsystematic reviewの読み方を伝えるのが目的ではないため、systematic reviewの読み方・評価の仕方を詳細に説明するのは避けさせていただくが、

① system、synopsisは求めている情報が得られれば非常に有用であること

② 重要文献については原著を吟味することにより、明確になっていること、現時点では明確になっていないことがさらに理解できること

③ system、synopsisに掲載されていない情報でも、系統だった批判的吟味ができるようになれば実際の臨床現場に用いることができるようになること

、以上3点をご理解いただけたら幸いである。