TOP

/

研究

/

【JAMA Psychiatry筆頭著者が徹底解説】システマティックレビュー&メタアナリシス - Part 1:論文を正しく集め、読み、統合する技法とは? - ゼロから学ぶ医学研究デザイン

研究

【JAMA Psychiatry筆頭著者が徹底解説】システマティックレビュー&メタアナリシス - Part 1:論文を正しく集め、読み、統合する技法とは? - ゼロから学ぶ医学研究デザイン

2025.09.23

システマティックレビューとメタアナリシス(Systematic Review and Meta-Analysis, SR&MA)は、複数の一次研究(主にRCT)を体系的に収集し、結果を批判的に吟味し、統計的に統合することで強力なエビデンスを創り出す研究手法であり、従来からエビデンスの頂点と位置付けられてきました。

一方で、「システマティックレビューとメタアナリシスだからといって、エビデンスレベルが高いとは限らない」などという意見を聞いたことがある方も多いのではないでしょうか?

実際に、世の中には質の低いSR & MAが数多く出回っており、注意が必要です。

そのため、SR & MAについて正確な知識を身につけ、適切に活用するとともに、既存のSR & MA論文を批判的に読み解くリテラシーを備えることが重要です。

本記事では、主にランダム比較試験(RCT)を対象としたSR & MAに焦点を当て、SR & MAの基礎から実践手順、そして論文の実例について、全4回にわたって徹底解説していきます。


初回となる本稿では、まずはSR & MAの概要と、その対象となるRCTの基本を押さえた上で、なぜSR & MAが必要なのか、そしてどのような強みや魅力、限界や注意点があるかについて徹底解説します。

mMEDICI Library | ひらけ、叡智の扉

叡智の扉を、全ての人が開けるように——。

学びは、限られた豊かな人々だけの特権ではありません。

経済的困難に直面する人、地方で学習資源に恵まれない人、家事や育児・仕事に追われる人。

mMEDICI Libraryではそんな人々にこそ、最高の学びを届けるため、研究・キャリア・学習・受験のあらゆるテーマでパブリックヘルスの叡智を集めました。

隙間時間にスマホひとつで、誰もが「一流の知」に触れることを叶えていきます。

「ここを開けば、誰しもが悩みを解決できる」、そんなメディアを目指します。

この記事のまとめ

この記事を読むと分かること

  • SR & MAとは何か

  • なぜRCTのSR & MAが必要か

  • SR & MAの強みと魅力、限界と注意点

この記事は誰に向けて書いているか

  • 医学研究を初めて学ぶ医療職

  • SR&MAを聞いたことがあるが、どのような研究か、なぜ重要かがわからない初学者

  • SR&MA論文をどのように読めば良いかわからない初学者

ゼロから学ぶ医学研究デザインシリーズ

vol.1:システマティックレビュー&メタアナリシス
  - Part1:論文を正しく集め、読み、統合する技法とは?(本記事)
  - Part2:これだけは押さえておきたい SR&MAの基礎知識
  - Part3:教科書が教えてくれない SR&MA実践のための9ステップ

執筆者の紹介

氏名:古川 由己(Yuki Furukawa)
関連リンク:ブログGoogle scholar, Research MapX (Twitter)
所属:東京大学 大学院医学系研究科 脳神経医学専攻 臨床精神医学教室 / ミュンヘン工科大学医学部精神科・心理療法科
自己紹介:日本専門医機構認定精神科専門医、精神保健指定医。臨床と並行してメタアナリシスを中心とした臨床研究を主導。筆頭著者として、JAMA Psychiatryなどのトップジャーナルに論文を発表。著書に『ねころんで読める(けどねころんじゃいけない)不眠症』。不眠の認知行動療法 (CBT-I) などの心理療法や、精神科疾患の薬物療法について、臨床で抱いた疑問に取り組んでいる。mMEDICI mERASMUSで「【JAMA Psychiatry筆頭著者が教える】 システマティックレビュー&メタアナリシス入門 ~論文を正しく集め、読み、統合する技法~」の講師を務める。

はじめに

本稿では「ランダム化比較試験(RCT)を対象にしたシステマティックレビューとメタアナリシス(SR & MA)」について解説していきます。

システマティックレビューとメタアナリシスは、複数の研究(ここではRCT)から得られた結果を統合することで、より強力なエビデンスを生み出すための研究手法です。

そのため、統合の対象となるRCTがどのような研究デザインなのかを正しく理解することが、SR & MAについて学ぶ上で欠かせん。

本項の前半ではSR & MAの概要を理解した上でRCTの基本と「なぜRCTのSR & MAが必要なのか」を学び、後半では、SR & MAの強みと魅力、限界と注意点について解説します。

1.SR & MAとは?

システマティックレビューは、あらかじめ設定した研究疑問や選定基準、検索式に基づき、複数のデータベースから文献を網羅的に収集し、質を評価してまとめる研究手法です。

(SRと似た文献レビューの手法としてナラティブレビューがありますが、これは著者の経験や関心に基づき関連文献を選び、背景や全体像を解説する総説です。分野の概要をつかみやすく柔軟な構成が可能ですが、文献の選定や解釈に主観が入りやすく、網羅性や再現性は低くなります。

SR は文献の選定基準を明確にして再現性を担保し、文献の選定におけるバイアスを最小限に抑えられるため、医療ガイドラインの根拠としても利用されます
(そのため、厳格なSRの実施には膨大な時間と労力がかかります)。


そして、メタアナリシス(MA)は、システマティックレビューで見つかった臨床試験の結果を統合して、一つの結果を出す統計学的な手法です(ものすごくざっくりと言うと、“洗練された足し算”です)。

システマティックレビューとメタアナリシスと組み合わせることで、臨床疑問に対する文献を網羅的に収集し、それらの結果を統計学的に統合することで、単独の研究結果からは見えないより正確な結論を導くことができるのです。

(SRとMRの理論や具体的な実施方法については、次回以降の記事で詳細に解説していきますので、まずは概要を掴むことができれば大丈夫です。)

2.RCTの基本を理解しよう

ここからは、SR & MAの対象となるランダム化比較試験(RCT)の基本について理解していきましょう。

まず、医学研究の主な目的は、治療(介入)により、患者さんの状態(アウトカム)がどのように変化するのか(因果関係)を調べることにあります。

介入とアウトカムの因果関係

例えば「薬を飲んだら、体調が良くなった」という結果は一見して当たり前のようにも思えますが、実はこの因果関係を明らかにすることは簡単ではありません。

もう少し具体的に考えてみましょう。市中肺炎の患者さんに「3日間の抗菌薬治療」を行う場合と、「10日間の抗菌薬治療」を行う場合とで、どちらが治療開始15日後の肺炎の治癒率が高いかを比較するとします。

そして、治療成績を調べたところ「3日間の抗菌薬治療」を受けた人の方が肺炎の治癒率が良かったとします。

果たして、この結果から「3日間の抗菌薬治療」の方が治療効果が高いと主張できるでしょうか?

恐らく、多くの方が直感的に違和感を覚えるのではないでしょうか。つまり、「3日間の治療を受けた人は、そもそも軽症だったため治癒率も高かった」「10日間の治療を受けた人は、そもそも重症だったため治癒率も低かった」と考えるのが自然でしょう。

つまり、介入にもアウトカムにも影響を与える第三の要因、交絡因子が存在することで、単純に「3日間の抗菌薬治療が肺炎の治癒に有効であった」と判断することはできないのです。

交絡因子の関係

また、交絡因子は重症度だけではありません。年齢や性別、遺伝的な要因など様々な要因が「介入」と「アウトカム」に影響を与える交絡因子である可能性があります。

このように、医学研究において「介入」と「アウトカム」の因果関係を明らかにするためには、交絡因子に対してどう対処するかが最も重要な課題と言えます。

そして、ランダム化比較試験(RCT)は、これらの交絡因子(未知のものも含む)を調整することができる非常に強力な手法なのです。


それでは、RCTではどのようにして交絡因子の問題を解決するのか、「肺炎に対する抗菌薬治療」の例で考えてみましょう。

RCTでは、患者さんを「3日間の抗菌薬治療を受けるグループ」「10日間の抗菌薬治療を受けるグループ」に、コイントスのようにランダムに割り付けます。

このように二つのグループ間をランダムに分けることで、治療期間以外の要因(重症度、年齢、性別などあらゆる要素)も均等に振り分けることができます。

ランダム化と交絡因子の関係については、こちらの記事で詳しく解説しています。
【疫学専門家監修】Exchangeability(交換可能性)を徹底解説 - Randomization(ランダム化)により実現する因果推論の必須条件

そのため、もしもグループ間で「肺炎の治癒率」に差があった場合、それは「抗菌薬治療の期間の違いよるもの」と強い根拠を示すことができます。

このように、RCTは「介入とアウトカムの因果関係を、交絡因子の影響を最小化しながら検証できる」という点で、医学研究における最も強力な研究デザインなのです。

3.RCTだけでは不十分?  - なぜSR & MAが必要なのか

前章では、RCTは交絡因子の影響を最小化し、因果関係を明らかにする強力な研究デザインであるとご紹介しました。

しかし、実際にはRCT単体の結果だけでは根拠が十分と言えない場面が少なくありません。

その代表的な理由を二つご紹介します。

1.統計的検出力の問題

典型的な理由として、一つ一つのRCTでは規模が不十分で、十分な確度をもって治療効果を検出できない場合があります。

例えば、単一のRCTではサンプルサイズが限られ、仮に本当は効果があったとしても、統計的に有意にならないことがあります。

しかし、複数のRCTをSR&MAによって統合することで検出力が向上します。

だからこそ、エビデンスピラミッドにおいて、RCTのSR & MAがRCTよりも上位に位置づけられているのです。


ここで、RCT単体の結果では治療効果の根拠が不十分でも、SR&MAによって治用の有効性が明らかになった有名な事例であり、コクラン共同計画(Cochrane Collaboration)のロゴのモチーフともなった事例をご紹介しましょう。

コクランは、医療介入の効果に関する系統的レビューとメタアナリシスを作成して公開する国際的な非営利団体です。
コクラン共同計画(Cochrane Collaboration)のロゴ

このコクランのロゴは、未熟児へのコルチコステロイド投与の効果を示すメタアナリシスのforest plotがもとになっています。

一本一本の横線が、一つ一つのRCTに相当します。

中央の縦線よりも左にあるものは、コルチコステロイド投与によって死亡率が低下したことを示し、真ん中の縦線に被っているものは、いわゆる統計学的有意差に達することがなく、コルチコステロイド投与の有効性を示さなかったことを意味します。

つまり、「七つのRCTを実施して、いわゆる統計学的有意差がついたのは二つだけ」ということになります。

しかし、メタアナリシスによって七つのRCT全体を統合すると、一番下のひし形で示されるように、死亡率が低下することが明らかになりました。

このメタアナリシスを契機に、未熟児へのコルチコステロイド投与の臨床実装が進み、多くの命が救われてきました。

単独のRCTでは効果を証明できなくても、SR & MAによって初めて明確に有効性が示された非常に象徴的な事例ですね。

2.外的妥当性の問題

RCTにはもう一つの注意点があります。それは、「そのRCTで明らかになった介入の効果は、あくまでもそのRCTの条件(対象集団や介入の種類など)における結果」という点です。

つまり、「別の集団を対象とし、別の条件で介入を行った場合においても、同様の効果が得られるか?」、いわゆる外的妥当性という問題がつきまといます。

SR & MAは複数のRCTを統合することで、(ある程度似ている)別の集団や別の条件においても同様の効果が得られるのかを検証することができるため、単独のRCTよりも外的妥当性が高いとされます。

別の集団、別の条件でも同様の効果が得られる場合は、より精緻な結果が得られます。


このように、RCTの弱点とも言える「検出力」と「外的妥当性」の問題を補うのが、SR & MAの大きな役割なのです。

だからこそ、エビデンスピラミッドの頂点に位置づけられてきたのですね。

4.SR & MAの強みと魅力 - 臨床家がSR&MAを学ぶべき理由

1.低コストで高エビデンス

新規でRCTを実施よりもはるかに少ない予算と期間で、RCTより上位のエビデンスを提示できる可能性が、SR & MAのメリットと言えます。

新たにRCTを行うには(仮に規模がそこまで大きくなくとも)膨大な費用と時間、そして労力が必要ですが、既存のRCTの結果を統合するSR & MAはそれらを大幅に節約することができるのです。

より低コストで、よりエビデンスレベルの高い結果が得られるのであれば、実施しない理由はありませんよね?

臨床をしながら並行して行える研究としては、多くの場合ベストチョイスになるのではないでしょうか。

もちろん、臨床的意義のあるリサーチクエスチョンに対して、質の高い厳格なSR & MAを実施するには、それ相応の時間と労力、そして専門性が必要です。

SR & MAが「楽をして簡単に論文数やインパクトファクターを稼げる研究手法」と安易に考えるのは大きな誤解ですし、質の低いSR & MAを出版することの弊害も理解しておかなければいけません。

2.臨床疑問を直接解決できる

SR & MAは、日々の臨床の中でふと湧いた疑問を、既存文献の統合という形で検証できます。日々の臨床経験を研究に直結させることができるのです。

自分が抱いた疑問に対して自ら研究を立ち上げ、現状における最善の知見を得ることができるのは、臨床に従事する医療職にとって非常に魅力的な研究手法と言えるでしょう。

3.論文執筆・研究スキルの基盤が身に付く

SR & MAの実施過程では、文献検索、批判的吟味、統計解析、結果解釈など、あらゆる研究において必要なスキルを培うことができます。

また、自分でSR & MAの実施を経験することで、他のSR & MA論文を読む時の視点も大きく変わります。検索式の妥当性、組み入れ基準の適切さ、統計モデルの選択など、より建設的に読み解くことができるようになるのです。

このように、SR & MAは研究初心者にとっても、非常に有用な“研究スキルトレーニングの機会”となります。

5.SR & MAの限界と注意点

複数のRCTから、単独のRCTからは見えないより正確な結論を導くSR & MAですが、もちろん万能なわけではありません。

SR & MAに取り組む際に知っておくべき限界と注意点について整理します。

1.一次研究の質と量に依存する

SR & MAの結果の確かさは、組み入れる一次研究であるRCTの質と量に依存します。

例えRCTとはいえ、質の低いRCT(アウトカムの定義が曖昧、追跡率が低い 等)も存在します。そのような研究ばかりをまとめても、得られる結論は信頼することはできません。

よく使われる表現に、“Garbage in, garbage out(質の悪い情報からは、質の悪い結論しか出てこない)”があります。

そのため、一次研究を適切に批判的吟味し、その質を加味して結果を解釈することが何より大切です。くれぐれも、“Garbage in”から得られた結果から、確かなエビデンスがあるかのように結論付けないように気をつけましょう。

意義のある臨床疑問に対してSR&MAを適切に行うことで、例え質の高いRCTが見つからなかったとしても、“その臨床疑問に対して信用のできるエビデンスが存在しない”ということを示すことには意義があります。

2.出版バイアス/報告バイアス

SR&MAを行う際に特に注意しなければならないのが「出版バイアス」と「報告バイアス」です。

出版バイアスとは、研究結果がポジティブ(有効性がある、差がある)だった場合に論文として公表されやすく、逆にネガティブ(有効性がない、差がない)な結果は公表されにくい、という傾向を指します。

実際、多くのジャーナルは「効果がなかった研究」よりも「有効性が示された研究」を好んで採択する傾向があるため、ポジティブな研究が文献データベースに偏って蓄積されがちです。

一方、報告バイアスとは、同じ研究の中で「ポジティブな結果が得られたアウトカムは報告するが、ネガティブなアウトカムは報告しない」といった選択的な報告のことです。

こうしたバイアスを補正するために、いくつかの方法が提案されています。例えば、メタアナリシスの対象研究を統計的に評価し、対称性が崩れていないかを検出するEgger検定などがあります。

また、臨床試験の事前登録制度が導入され、あらかじめ試験の存在とアウトカムを登録することで「公表されなかった研究」や「都合の悪い結果の隠蔽」を減らす努力も行われています。

とはいえ、これらの方法で出版バイアス/報告バイアスを完全に防ぐことはできません。

したがって、SR & MAの結果を解釈する際には「報告されていない研究が存在するかもしれない」「結果が過大評価されているかもしれない」という視点を常に持つことが大切です。

3.競争の激しさ

SR&MAは既存の一次研究を統合するという性質から、研究の立ち上げや論文の出版のハードルが低い部類とも言えます。

そのため、注目領域では短期間に複数のSR&MAが出ることも珍しくありません。結果として、同様のテーマを扱う研究が数多く公表されることで、タイミングを逃すとインパクトは低下してしまいます。

長谷川耕平先生のSNS(X)での投稿がこの問題を的確に指摘しています。

筆者もSR & MAに5年程取り組む中で、何度か「先を越された」という経験があります。研究の実施のハードル自体は低い部類ですが、その分、競争が激しいということを念頭におく必要があります。

4.「他人の褌で…」という印象

SR & MAは一次研究を行わずに既存データをまとめる研究手法であるため、オリジナリティが低いと見られる場合があります(SR & MAに取り組む筆者自身もしばしばそう思うことがあります。医学研究に限らず、斬新な基礎研究など、優れた一次研究に出会う度に畏敬の念を覚えます)。

しかし、SR & MAは決して「楽な研究」ではありません。むしろ、膨大な文献を網羅的に収集し、厳格な基準で選定・評価し、統計的に統合していく過程は地道かつ高度な作業の積み重ねです。

また、ネットワークメタアナリシスや用量反応メタアナリシスという応用的な手法を使うことで、一次研究では直接答えられなかった問いに答えることができるというのも魅力です。

そして、質の高いSR & MAは臨床や政策決定に直結するため、学術的・社会的価値は非常に高いものです。筆者は臨床家としてここに矜持を持ってSR&MAに取り組んでいます。

まとめ

  • RCTは因果関係の解明において優れた研究デザインであるが、単一研究では統計的検出力や外的妥当性に限界がある。

  • RCTのSR & MAは複数の研究を統合することで、より確かな因果関係の推定と、他の集団にも一般化可能な結論を提供できる。

  • SR & MAは費用・時間的な面でRCTよりも優れており、臨床現場の疑問解決に直結する。

  • ただし、一次研究の質への依存、出版バイアス、競争の激しさといった限界に注意。

臨床家にとって、SR & MAは「自分でも手の届く最強のエビデンスレベルの研究法」と言えるでしょう。日々の臨床における質を高めるためにも、その手法と限界を理解し、活用することが重要です。

次回の記事では、SRとMAの理論や具体的な実施方法について学んでいきましょう。

【本記事を執筆された古川先生のSR&MA入門リバイバル配信のご案内】

​【開催概要】

​開催日:2025年11月30日(日)16:00~19:00
申込締切:2025年11月29日(土)23:59まで
※当日はvimeoライブ配信にて実施いたします。


​見逃し配信:2025年11月30日(日)~12月14日(日)
※2週間の見逃し配信期間があるからいつでも何度でも観られる(当日不参加もOK)!


​価格 一般:5,000円
   学生:2,500円(※社会人学生を除く)

​※請求書・領収書は数クリックで発行できます。


​受講証発行:有(受講証に、各受講者の個人名は掲載されません)
※研究費等でご参加の方を含め、全ての方に受講証を発行いたします。

医学研究を学ぶならオンラインスクールmJOHNSNOW

この記事を読み、「もっと医学研究を学びたい」と思われた方もいらっしゃるでしょう。

そんな方には弊社が運営するオンラインスクールmJOHNSNOWがお勧めです。

mJOHNSNOWはスペシャリストが運営する臨床研究・パブリックヘルスに特化した日本最大規模の入会審査制オンラインスクールです。運営・フェローの専門は疫学、生物統計学、リアルワールドデータ、臨床、企業など多岐に渡り、東大、京大、ハーバード、ジョンスホプキンス、LSHTMなど世界のトップスクールの卒業生も集まっています。

本日解説した因果推論の講義に加えて、みなさんの専門性を伸ばすためのコンテンツが目白押しです!

・スペシャリスト監修の臨床研究・パブリックヘルスの講義が毎月7つ以上開催
・過去の講義が全てオンデマンド動画化されたレポジトリー
・スクール内のスペシャリストに学術・キャリアの相談ができるチャットコンサル
・フェローが自由に設立して学べるピアグループ(ex. RWDピア)
・24時間利用可能なオンライン自習室

「パブリックヘルスを、生き様に」をミッションに、『初心者が、自立して臨床研究・パブリックヘルスの実践者になる』ことを目指して学んでいます。初心者の方も大勢所属しており、次のような手厚いサポートがあるので安心してご参加ください!

・オンデマンド動画があるから納得するまで何回でも、いつでも学び直せる
・チャットコンサルで質問すれば24時間以内にスペシャリストから複数の回答が
・初心者専用の「優しいピアグループ」で助け合い、スペシャリストが”講義の解説”講義を毎月開催

詳細を見る

【YouTubeラジオコンテンツ 耳から学ぶシリーズ】

耳から学ぶシリーズ

YouTubeラジオコンテンツ「耳から学ぶシリーズ」は、仕事や育児で忙しい人が10分のスキマ時間に“ながら聞き”で学べる音声コンテンツです。

すべてのコンテンツを疫学専門家が監修し、完全無料で毎日投稿していきますので、ぜひチャンネル登録してお待ちください。

シリーズ一覧

ゼロから学ぶ医学研究デザインシリーズ

vol.1:システマティックレビュー&メタアナリシス
  - Part1:論文を正しく集め、読み、統合する技法とは?(本記事)
  - Part2:これだけは押さえておきたい SR&MAの基礎知識
  - Part3:教科書が教えてくれない SR&MA実践のための9ステップ

個人・企業からの寄稿を受付中

play_arrow
寄稿ページはこちら