TOP

/

研究

/

【JAMA Psychiatry筆頭著者が徹底解説】システマティックレビュー&メタアナリシス入門 - Part 3:教科書が教えてくれない SR&MA実践のための9ステップ - ゼロから学ぶ医学研究デザイン

研究

【JAMA Psychiatry筆頭著者が徹底解説】システマティックレビュー&メタアナリシス入門 - Part 3:教科書が教えてくれない SR&MA実践のための9ステップ - ゼロから学ぶ医学研究デザイン

2025.10.20

シリーズ紹介

システマティックレビュー & メタアナリシス(Systematic Review and Meta-Analysis, SR & MA)は、複数の一次研究(主にRCT)を体系的に収集し、結果を批判的に吟味し、統計的に統合することで強力なエビデンスを創り出す研究手法であり、従来からエビデンスの頂点と位置付けられてきました。

本連載では、主にランダム比較試験(RCT)を対象としたSR & MAに焦点を当て、SR & MAの基礎から実践手順、そして論文の実例について、全4回にわたって徹底解説していきます。

前回までに、SR & MAがなぜエビデンスピラミッドの最上位に位置づけられているか、またSR & MAの基本について説明してきました。また、「自分でも手の届く最強のエビデンスレベルの研究法」と解説してきましたが、自分で挑戦してみたくなった方も多いのではないでしょうか?

今回の記事では、実際にSR & MAに取り組むための九つのステップについて具体的に解説していきます。

mMEDICI Library | ひらけ、叡智の扉

叡智の扉を、全ての人が開けるように——。

学びは、限られた豊かな人々だけの特権ではありません。

経済的困難に直面する人、地方で学習資源に恵まれない人、家事や育児・仕事に追われる人。

mMEDICI Libraryではそんな人々にこそ、最高の学びを届けるため、研究・キャリア・学習・受験のあらゆるテーマでパブリックヘルスの叡智を集めました。

隙間時間にスマホひとつで、誰もが「一流の知」に触れることを叶えていきます。

「ここを開けば、誰しもが悩みを解決できる」、そんなメディアを目指します。

この記事のまとめ

この記事を読むと分かること

  • SR&MA実施のためのステップ

  • リサーチクエスチョン作成・プロトコル作成時のコツ

  • チーム構成で気をつけること

この記事は誰に向けて書いているか

  • 医学研究を初めて学ぶ医療職・研究職

  • SR & MAの実施フローについて学びたい医療職・研究職

  • SR & MAに取り組みたいと考えている医療職・研究職

ゼロから学ぶ医学研究デザインシリーズ

vol.1:システマティックレビュー&メタアナリシス入門
  - Part 1:論文を正しく集め、読み、統合する技法とは?
  - Part2:これだけは押さえておきたい SR&MAの基礎知識
  - Part3:教科書が教えてくれない SR&MA実践のための9ステップ(本記事)

執筆者の紹介

氏名:古川 由己(Yuki Furukawa)
関連リンク:ブログGoogle scholar, Research MapX (Twitter)
所属:東京大学 大学院医学系研究科 脳神経医学専攻 臨床精神医学教室 / ミュンヘン工科大学医学部精神科・心理療法科
自己紹介:日本専門医機構認定精神科専門医、精神保健指定医。臨床と並行してメタアナリシスを中心とした臨床研究を主導。筆頭著者として、JAMA Psychiatryなどのトップジャーナルに論文を発表。著書に『ねころんで読める(けどねころんじゃいけない)不眠症』。不眠の認知行動療法 (CBT-I) などの心理療法や、精神科疾患の薬物療法について、臨床で抱いた疑問に取り組んでいる。mMEDICI mERASMUSで「【JAMA Psychiatry筆頭著者が教える】 システマティックレビュー&メタアナリシス入門 ~論文を正しく集め、読み、統合する技法~」の講師を務める。

SR&MAの実践ステップ

本稿では、SR & MA を実践するための具体的なステップについて一つずつ学んでいきましょう。

本記事では、下記のように九つのステップに分けて解説していきます。

  1. リサーチクエスチョンづくり

  2. チームビルディング

  3. プロトコルづくり・事前登録

  4. 系統的レビュー(スクリーニング)

  5. データ抽出

  6. リスクオブバイアスの評価

  7. メタアナリシスの実施

  8. GRADE評価

  9. 論文執筆・投稿

1.リサーチクエスチョンづくり

全ての出発点はリサーチクエスチョンを考えることから始まります。

良いリサーチクエスチョンを考える枠組みとして、FINERというフレームワークが提案されています。FINERは以下の五つの語句の頭文字をとったもので、それぞれ視点からよく吟味してリサーチクエスチョンを考えることが大切です。

F: Feasible, 実行可能

I: Interesting, 興味深い

N: Novel, 新しい

E: Ethical, 倫理的

R: Relevance, 重要である

とはいえ、最初から全ての項目を押さえたリサーチクエスチョンを考えるのはとても困難です。

FINERをさらに拡張したFIRMMNESSという枠組みも提唱されていますが、やはり全てを完璧に抑えることは、より一層ハードルが高くなってしまいますね。

SR & MAのリサーチクエスチョンを考えるにあたっては、まずは“R = 臨床的な重要性”“N = 新規性”にフォーカスして考えるのがおすすめです。

この二つの項目(臨床的な重要性と新規性)が満たされていれば、“I = 興味深い”リサーチクエスチョンになるのは間違いありません。

また、文献を二次的に調査するSR & MAにおいては、“R = 倫理性”が大きく問題になる事はまずありません。

論文中で倫理性についての記載が省略されることもありますが、下記のように記載することもあります。

"This study was a systematic review and meta-analysis conducted using data extracted from publicly available data. All data were de-identified. As no new data were collected and no human participants were directly involved, this research did not require approval from an institutional review board or ethics committee."

規模が大きくなり過ぎたり、新しく複雑な統計手法を用いようとすると“F = 実行可能性”が低くなるリスクがあります。

自分でできることを増やし、協力してくれる研究者のネットワークを広げることで実行可能な研究の範囲を広げる努力も重要ですが、特に最初に取り組むプロジェクトとしては、自分でもできるだけシンプルな解析手法( ≒ 一番シンプルなペアワイズ・メタアナリシス)を用いて、組入研究の本数としてはおおよそ5~10本程度が見込まれる課題に取り組むのがおすすめです。

ただし、この実行可能性の面から見ても、臨床的重要性と新規性はとても重要です。これらの要素が高いほど、少し実施が難しくても、結果的にはスムーズに研究を進められる可能性が高まるのです。

例えば、臨床的重要性や新規性が高いリサーチクエスチョンであれば、多くの協力者が貸してくれることでしょうし、また協力者の中での優先度を上げて対応してもらえるはずです。

また、何よりも臨床的重要性と新規性が高ければ、自分でも「何とかプロジェクトを前に進めよう」という意欲が掻き立てられるはずです。

さらに、論文投稿の過程でも、重要なリサーチクエスチョンの論文ほど早く査読に回してもらえる可能性があります(論文の編集者や査読に関わる人たちも、より重要なテーマの論文に時間を費やしたいはずだからです)。


リサーチクエスチョンを考える際に、つい実行可能性を重視してしまうという研究者もいますが、SR & MAにおいては、上述のように“ R = 臨床的重要性"と“ N =新規性”を重視して考えましょう。そうすれば、他の要素は後から付いてくるものです。

2.チームビルディング

SR & MAは一人で行うことはできません。チームで行う必要があります。

オックスフォード大学の教授で、BMJ Mental Healthの編集長でもあるAndrea Cipriani教授は、「SR&MAの論文が単著であれば、それだけでタイトルも中身も見ずにリジェクトする」と述べていました。

システマティックレビューにおいては、少なくとも二人の研究者によって独立で文献のスクリーニングを行い、データの抽出を行うことが推奨されています。

実際にやってみるとよくわかりますが、いくら注意して作業に取り組んでも、エラーはつきものです。膨大な数の研究をレビューするSR & MAを一人で行うということは、そもそも不適切であると言えるのです。

また、二人の研究者との間で何らかの齟齬が見つかった場合は、研究者同士で話し合って最終的な結論を出すのが原則ですが、それでも決めるのが難しい場合は三人目の研究者を交えて検討します。そのため、自分以外に最低二人の協力者が必要ということになります。


SR & MAはチーム戦です。

① 研究テーマに関連した臨床的経験がある人
② SR & MAに関する方法論や統計学的手法に長けている人
③ SR & MAを実際に実行することができる人
が少なくとも必要です。

(ペアワイズ・メタアナリシスであれば既にいわゆる“枯れた技術”になっているので②は必須ではありません。)

また、文献の検索や取り寄せができるように、大学図書館などを使うことができる環境にある人もいた方が良いでしょう。チーム戦である以上、“一緒に働いていてやりやすいかどうか”(例えば連絡の取りやすさなど)も重要ですね。

もっとも、大学の医局や勉強会・研究会、mJOHNSNOWなどの医学研究のコミュニティで、既にSR & MAの経験がある人と一緒にプロジェクトに取り組むのが良いでしょう。「先達はあらまほしき事なり」(吉田兼好『徒然草』)です。

3.プロトコルづくり・事前登録

取り組むリサーチクエスチョンが決まったら、次に行うのはプロトコルづくりです。

プロトコルとは研究計画書のことで、どのようなデータベースを、どのような検索式で検索するか、どのようにスクリーニングを行い、どのようにデータ抽出を行うか、どのように各研究のバイアスリスクを評価し、メタアナリシスを実行し、メタアナリシス全体としての確実性をどのように評価するのか、ということをあらかじめ決めておきます。

プロトコルを詳細に定めた上で、PROSPEROOpen Science Framework(OSF)などで事前にプロトコルを登録します。

PROSPEROの利用方法はやや煩雑です。OSFはRegistryなど細分化されたものもありますが、OSF Homeといわれる包括的なものでプロジェクトを立ち上げ、プロトコルのPDFをアップロードして公開するというのが最もシンプルです。

オックスフォード大学のSR & MA講座を受講した際の、Andrea Cipriani教授の次の言葉が印象に残っています。

Don’t be data-driven, be protocol-driven

「データドリブン」というと、データにもとづいて行動するという肯定的な、先進的なイメージがあるかもしれません。

メタアナリシスは特に“データドリブンなもの”だと思われがちです。つまり、データが先にあって、それをいかに料理するかに着目されがちですが、実際はそのようなやり方は推奨されていません。

あらかじめどのように研究を実施するのか、しっかりと事前にプロトコルとして定めておくことが大事です。データを先に見てどのように解析するかを決めるのは、恣意的な結論に近づけることができてしまい、不適切なのです。

因果推論で有名なジュディア・パールも『因果推論の科学』で次のように強調しています。

「データは何も教えてくれない」「データを収集するのは、因果モデルをつくり、答えたい科学的な問を記述し、エスティマンドを導き出してからだ」

この考えを、ランダム化比較試験(RCT)を対象としたSR & MAの文脈に置き換えると、「システマティックレビューを実施してデータを収集するのは、リサーチクエスチョンを明確にし、プロトコルを策定してからだ」となるでしょう(“因果モデルをつくる”は、そもそもRCTの文献を収集するので省略)。


また、良質なSR & MAでは、きちんとしたプロトコルが公開されています(多くの場合、Supplementに含まれています)。

そのため、自分が目指したい論文のプロトコルを参考にしながら、自分のプロトコルをつくりましょう(PRISMA-Pという報告ガイドラインでは、SR & MAのプロトコルに記述すべき項目がリストアップされており、とても参考になります)。

プロトコルを詳細に記述しておくメリットとして、時間が経って自分が何をするつもりであったか忘れてしまっても思い出せるというものがあります(SR & MAは想定以上に時間がかかることも多いためです)。自分のためにもプロトコルをきちんと定めておきましょう。

4.システマティックレビュー(スクリーニング)

プロトコルを定めたら、ここからはようやくシステマティックレビューを実施していきます。

事前に定めた複数のデータベースを、事前に定めた検索式で検索します。データベース以外の情報源もきちんと探索するようにしましょう。

システマティックレビューの基本はこちら
システマティックレビュー&メタアナリシス入門 - Part 2:これだけは押さえておきたい SR&MAの基礎知識

システマティックレビューで文献を収集した後は、検索結果を一つのファイルにまとめて重複したものを削除します。基本的にはMendeleyPaperpileなどの文献管理ソフトで重複削除するのがおすすめです。Rayyanなどのスクリーニング支援サービスがありますが、その重複削除の性能は必ずしも高くないので注意してください。


文献のスクリーニングは二段階に分けて行います。
タイトル&アブストラクトスクリーニングと、フルテキストスクリーニングです。

1.タイトル&アブストラクトスクリーニング
まずはタイトルとアブストラクトだけを見て該当しそうかを判断します。明らかに該当しないものは除外し、該当するもの、及び判断に困るものは残すようにしましょう。

タイトルとアブストラクトだけのスクリーニングの時点では、二人の判断が分かれるものは残しておくようにしましょう。もちろんこの時点でより詳しく見て残すか除外するかを決めても大丈夫です。

タイトル&アブストラクトだけのスクリーニングではありますが、すぐに確認できるようであればフルテキストを確認してもかまいません。


2.フルテキストスクリーニング
次に、第一段階のタイトル&アブストラクトスクリーニングで残った文献のフルテキストをかき集めます。大学図書館など文献を集めることができる環境にアクセスできる必要があります。

第二段階のフルテキストスクリーニングでは、フルテキスト全体に基づいて「組み入れるか除外するか」を判断することになります。この時には除外理由を説明できるように、除外理由のコメントを残しておきましょう。

システマティックレビューのスクリーニングについては、最終的にはPRISMA flow diagram(下図)にまとめることになります。一見して簡単そうに思えますが、文献をきちんと数え上げるのはかなり大変です。そのためにも、記録をしっかり残すようにしましょう。

PRISMA flow diagramの一例. (Furukawa Y et al., 2024より)

5.データ抽出

スクリーニングを実施した後は、データ抽出用にエクセルシートを準備し、二人で独立して個々の研究から「イベントの発生数」「症例数(n)」といったデータの抽出を行います。二人分のデータ抽出結果を突き合わせて確認し、齟齬があればそれを解決します。また、データ抽出に先立って、データセットの仕様書を作成しておくのがおすすめです。

データセット仕様書についてはこちら

佐藤俊太朗先生による特別講座
統計ギライの人のための実践的生物統計学講座#1
2. 解析は準備が9割!未来の自分を救う「データセット作成の作法」

データシートのまとめ方にはいくつかの流派がありますが、下表のように一行に一群を入力していくlong形式がおすすめです(R等の統計ソフトとの相性が良いため)。

studlab

treat

event

n

Agatsuma1991

Intervention

8

21

Agatsuma1991

Control

4

19

Hashibira2002

Intervention

45

102

Hashibira2002

Control

23

103

Kamado2013

Intervention

32

65

Kamado2013

Control

28

65

ファイル名や変数名の付け方については、自分なりにルールを統一しておくことが大切です。

ここでは、筆者自身で作成し活用しているファイル名や変数名の付け方のルールをご紹介します。

【データシート入力のルール一覧】

  1. できるだけ具体的な表現をする

  2. 原則省略しない

  3. 単位がわかるように接尾辞をつける

  4. 変数名は小文字として、snake_caseを使う


それぞれについて具体的に説明していきます。

1.できるだけ具体的な表現をする
例えば、元のデータ名“ sd ”(標準偏差)があるとしましょう。この値に何らかの処理を加えたデータを“ sd2 ”などと命名するよりも、“sd_imputed” などと、後から見てもどのような処理がされた後のものかがわかるような表現をしましょう。


2.原則省略しない
コードを書いている時には省略したくなりますが、後から読むと何の省略かわからなくなることがあります。

また、ファイル名や変数名を入力したい時にも、どの省略を使ったかを思い出すのに手間がかかってしまいます。原則として単語を省略しないことでその後の苦労を減らせます(なお、n、sdなどの頻用統計用語、df(dataframe)などは例外としています)。


3.単位がわかるように変数名に接尾辞をつける
例えば、durationでは時間単位なのか、日にち単位なのか、週単位なのかわかりません。単位を語尾につけて、duration_hours、duration_days、duration_weeksなどとすることでわかりやすくなります。

体重なども国によって使っている単位が異なります。変数名に接尾辞をつけておくことで、誤って異なる単位の数字をそのまま同じものとして計算するリスクを減らせます。


4.変数名は小文字に。複数の単語は “ _ ”(アンダーバー) でつなぐ
大文字と小文字の違いで、「Rのスクリプト(解析などを実行するためのコード)がうまく動かない」ということがしばしば起こります。こういったエラーを避けるために、最初から「全て小文字にしてしまう」と決めることで、余計な手間を省くことができます。

また、複数の単語をどうつなぐかはいくつかの選択肢がありますが、“snake_case”のようにアンダーバーでつなぐことが昨今のRでのトレンドのようです。

6.リスクオブバイアスの評価(RoB2)

これ後に実施するメタアナリシスに含める、各々の研究の数値におけるバイアスリスクを、RoB2というツールを用いて評価します。

RoB 2: a revised tool for assessing risk of bias in randomised trials.BMJ 2019.

このツールは五つの領域に分かれており、各領域の評価を元に全体的な評価をします。

❶ ランダム割り付けの過程から生じるバイアス
❷ 意図した介入からの逸脱によるバイアス
❸ データの欠落によるバイアス
❹ 結果の測定におけるバイアス
❺ 報告された結果の選択におけるバイアス


それぞれの領域には答えるべき質問があり、その質問に答えることで、それぞれの領域ごとの判断ができるようになっています。

例えば、「❶ ランダム割り付けの過程から生じるバイアス」の領域では、「割り付けの順序はランダムであったか」「割り付けの順序は参加者が組み入れられ介入に割り付けられるまで隠蔽されていたか」「ベースラインでの各群の違いがランダム割り付けの過程の問題を示唆しているか」という質問に答えます。

質問への答えに基づいてフローチャートをたどることで、その領域におけるバイアスリスクを三段階(高リスク、中リスク、低リスク)で評価することになります。


一見すると、質問に答えるだけで客観的な判断を行えるように思えますが、実際にやってみるとかなり判断に困ることが多いです。

そのため、あらかじめ二、三個の研究について全体を通して判断をしてみて、そのシステマティックレビューとメタアナリシスにおいて、それぞれの質問文をどのように解釈するのかということを、もう少し具体化した上で評価を進めていくのがおすすめです。

その上で、「バイアスリスクをどのように判断したか」について、論文のSupplementで報告するようにしましょう。


また、RoB2の評価には時間がかかることも知っておいてください。その他のデータ抽出全体にかかる時間と同程度の時間がかかります。

それでは、RoB2の評価は最終的にはどのように論文に反映されるのでしょうか?

まず、定性的にいくつの研究が「高リスク」「中リスク」「低リスク」であったかを報告します。場合によっては、どの領域においてバイアスリスクが高い傾向であったかを報告しても良いでしょう。各研究の各領域における評価は表にまとめてSupplementで報告します。

次に、感度分析で高リスクの研究を除外(もしくは高リスクと中リスクの両方を除外)して解析し、結果が大きく変わらないか確認します。メタアナリシスとしての確信度の評価(GRADE)の一部としても活用されます。

これらはとても大きな時間と労力を必要としますが、とても重要なプロセスです。

7.メタアナリシスを実施する

メタアナリシスと言うと、有名なforest plotをつくるところが注目されがちですが、ここまでの解説を読んでいただいた皆さんは、それがSR & MAのプロセスの一部に過ぎないことをご理解いただいていることでしょう。

メタアナリシスの基本はこちら
システマティックレビュー&メタアナリシス入門 - Part 2:これだけは押さえておきたい SR&MAの基礎知識

forest plot

妥当なメタアナリシスと言うのは、きちんとしたリサーチクエスチョンづくり、プロトコルづくり、システマティックレビュー、そして一次研究の質の評価があって初めて成立するものです。

あらかじめプロトコルで決めた通りに、メタアナリシスを行いましょう。もし明らかに変更が必要という事情があれば、変更の根拠をきちんと説明した上でメタアナリシスの手法を変更することも可能です。

筆者の経験では、元々のプロトコルからの変更点とその根拠を明示して投稿したところ、査読者から「ベストプラクティスだ」と評価してもらえたこともあります。あとから変更することが絶対に悪いというわけではないのです。

ちなみに、ペアワイズ・メタアナリシスを行ってforest plotをつくること自体は難しいことではありません。

二値変数のアウトカムについてランダム効果メタアナリシスを実施してforest plotやfunnel plotを作成するツールも準備しています。皆さんのデータをコピペして解析を実施することもできます。例えば、本稿の「5.データ抽出」で紹介したLong形式の表をコピペして貼り付けることで解析できますので、ぜひお試しください。

※Shinyappの無料プランを超える利用があった場合は、しばらく利用できません。あらかじめご了承ください。

8.GRADE (Grading of Recommendations Assessment, Development and Evaluation)

これまでの全ての結果を踏まえて、GRADE(Grading of Recommendations Assessment, Development and Evaluation)という枠組みを用いて、メタアナリシスの結果に関する確信度を四段階(高い、中等度、低い、とても低い)で評価します。

多数の解説論文がありますが、2025年時点での最新のものはBMJに掲載されたCore GRADEシリーズです。

Core GRADE 1: overview of the Core GRADE approach.BMJ 2025.

GRADEでは、以下の五つの領域ごとに評価を行い、全体を踏まえて総合評価をします。RoB2と構造は似ています。

❶ 一次研究のバイアスのリスク
❷ 不精確さ(Imprecision)
❸ 非直接性(Indirectness)
❹ 非一貫性(Inconsistency)
❺ 出版バイアス(Publication bias)

一つずつ詳しく解説していきましょう。

❶ 一次研究のバイアスのリスク
本稿の「6.リスクオブバイアスの評価」でも説明したRoB2を用いた評価をここで使います。

メタアナリシスに含まれる全ての一次研究においてバイアスリスクが低いということはまずありません(そのような場合は、まずバイアスリスクの評価がおかしいのではないかと疑います)。

バイアスリスクが低い研究が一定数あり、バイアスリスクが高い研究を除外しても結果が大きく変わらないようであれば、この項目で評価を下げる必要はありません(組み入れられた研究の質が低いためにかなり結果に自信が持てないという場合は、二段階評価を下げます)。

❷ 不精確さ(Imprecision)
不精確の評価とは、少し専門的に表現すると「点推定値に関する評価」のことです。
もう少し易しく言えば、“結果のブレの大きさ”から、「本当に効果があると言えるのか?」を判断する項目です。

(具体的には、介入効果の大きさの評価について大・中・小の閾値を設定し、95%信頼区間が閾値をまたぐようであれば評価を下げます。)

❸ 非直接性(Indirectness)
非直接性の評価では、研究の結果が “自分の知りたいテーマ(PICO)にどれだけ当てはまるか” を考えます。

元々の関心があるPICOとは異なる研究を基に判断する場合、非直接性の項目で評価を下げます。

ただし、SR&MAにおいては、よほど偏った集団のRCTしか見つからなかったという場合を除き、非直接性における評価を下げることは少ないと思います(SR & MA向けの評価項目というよりも、ガイドラインを作成する際に適した評価項目と言えます)。

非直接性の評価においては「元々の関心があるPICOと、実際に集められた研究の対象集団の違い」についての考え方も大切です。GRADEのガイダンスでは、「集団間の相対的な効果(リスク比やオッズ比)は基本的に類似しており、よほど強い根拠がない限り“集団の違い”を根拠に、非直接性でダウングレードすることはない」と記載されています。

つまり、「患者集団が多少異なっても、リスク比やオッズ比といった“相対的な効果”は大きく変わらない」と考えられるため、元々の関心があるPICOと対象集団が異なったとしても、直ちに非直接性の評価を下げることはないと言えるのです。

(ただし、“リスク差”はリスク比やオッズ比に比べて異質性(対象集団の違いによる変動)が高くなる傾向があります。)

❹ 非一貫性(Inconsistency)

非一貫性とは、複数の研究結果のあいだで「効果の方向や大きさがどれくらい違うか(バラつきがあるか)」を評価する項目です。

このバラつきのことを専門的には 異質性(Heterogeneity) と呼びます。

バラつきの原因としては、研究の対象や方法、介入内容などの違いが原因と想定されます。ただし、研究ごとのバラツキが大きくても、例えば「全ての研究において効果あり」というように一貫して効果を示していれば、非一貫性の評価を下げる必要はありません。

従来から用いられている I2(あいすくえあ)という指標が有名ですが、非一貫性の指標としてはあまり適切ではないと言われるようになってきました。 定量的な評価として“予測区間”が重要とされ、定性的な評価として“フォレストプロットを視覚的に評価”することが推奨されています。

❺ 出版バイアス(Publication bias)
出版バイアスによって、メタアナリシスの結果にどの程度影響していそうかを評価します。

出版バイアスの説明はこちら
システマティックレビュー&メタアナリシス - Part 1:論文を正しく集め、読み、統合する技法とは?

出版バイアスが検出されても、そのバイアスを補正しても十分に効果がありそうな場合は、評価を下げないという判断もあり得ます。

ファネルプロットやEgger検定が有名ですが、いずれも感度・特異度が高くありません。規制当局の記録やレジストリ登録のうち、どれだけの研究が実際に出版されているかなどの情報も重要な判断根拠です。

9.論文執筆・投稿

ここまで来れば、あとは論文を執筆し、投稿するという段階にたどり着きます。

執筆に取り掛かる前に、まずは「この論文全体で伝えたいメッセージ」を一つ決め、共著者の中で合意を取りことが大切です。

SR & MAの論文において、書くべきことはある程度決まっています。本稿では、論文の書き方に関する詳細な解説は割愛しますが、自分がモデルとする論文PRISMAという報告ガイドライン、および事前に定めたプロトコルを参照しながら書き進めていきましょう。

特に、結論として何を述べるかが大切です。臨床的なインパクトも大切ですが、あくまでも「この研究の結果から述べることができる範囲」で、GRADEで評価した確信度も反映して結論を述べるようにしましょう。

次回の記事では、実際に筆者が執筆した論文について、どのような着想を得て研究をスタートし、そしてどのような結論を報告したのかをご紹介していますので、論文執筆の参考にしていただけますと幸いです。

まとめ

この記事では、SR & MAを実践するため九つのステップに分けて説明しました。

実際にどのようなことを実施する必要があるのか、具体的に想像できるようになったのではないかと思います。

ランダム化比較試験(RCT)などと比較すると手軽に実施できるため、「ささっと実施して論文化できる」と思われがちですが、質の高いSR & MAを実施するためには本稿で解説したように厳密な手続きを踏まなければならず、少なくとも100時間、臨床活動と並行して行うとなれば半年から一年程度はかかることでしょう。

筆者の師は次のように述べています。“No quick & dirty meta-analysis, please(意訳:ささっと雑にメタアナリシスやるのはやめてくれ)“

本シリーズが、一人でも多くの研究者が正しくSR & MAを実践する足がかりになれば幸いです。

次回の記事では、筆者がこれまで取り組んできたSR & MAの実例を紹介し、日々の臨床の中からどのようにリサーチクエスチョンを見つけ、そしてSR & MAに取り組んできたかについてご紹介しようと思います。皆さんのSR & MA実践の「はじめの一歩」の参考になれば幸いです。

【本記事を執筆された古川先生のSR&MA入門リバイバル配信のご案内】

​【開催概要】

​開催日:2025年11月30日(日)16:00~19:00
申込締切:2025年11月29日(土)23:59まで
※当日はvimeoライブ配信にて実施いたします。


​見逃し配信:2025年11月30日(日)~12月14日(日)
※2週間の見逃し配信期間があるからいつでも何度でも観られる(当日不参加もOK)!


​価格 一般:5,000円
   学生:2,500円(※社会人学生を除く)

​※請求書・領収書は数クリックで発行できます。


​受講証発行:有(受講証に、各受講者の個人名は掲載されません)
※研究費等でご参加の方を含め、全ての方に受講証を発行いたします。

【医学研究を学ぶならオンラインスクールmJOHNSNOW】

この記事を読み、「もっと医学研究を学びたい」と思われた方もいらっしゃるでしょう。

そんな方には弊社が運営するオンラインスクールmJOHNSNOWがお勧めです。

mJOHNSNOWはスペシャリストが運営する臨床研究・パブリックヘルスに特化した日本最大規模の入会審査制オンラインスクールです。運営・フェローの専門は疫学、生物統計学、リアルワールドデータ、臨床、企業など多岐に渡り、東大、京大、ハーバード、ジョンスホプキンス、LSHTMなど世界のトップスクールの卒業生も集まっています。

本日解説した因果推論の講義に加えて、みなさんの専門性を伸ばすためのコンテンツが目白押しです!

・スペシャリスト監修の臨床研究・パブリックヘルスの講義が毎月7つ以上開催
・過去の講義が全てオンデマンド動画化されたレポジトリー
・スクール内のスペシャリストに学術・キャリアの相談ができるチャットコンサル
・フェローが自由に設立して学べるピアグループ(ex. RWDピア)
・24時間利用可能なオンライン自習室

「パブリックヘルスを、生き様に」をミッションに、『初心者が、自立して臨床研究・パブリックヘルスの実践者になる』ことを目指して学んでいます。初心者の方も大勢所属しており、次のような手厚いサポートがあるので安心してご参加ください!

・オンデマンド動画があるから納得するまで何回でも、いつでも学び直せる
・チャットコンサルで質問すれば24時間以内にスペシャリストから複数の回答が
・初心者専用の「優しいピアグループ」で助け合い、スペシャリストが”講義の解説”講義を毎月開催

詳細を見る

【YouTubeラジオコンテンツ 耳から学ぶシリーズ】

耳から学ぶシリーズ

YouTubeラジオコンテンツ「耳から学ぶシリーズ」は、仕事や育児で忙しい人が10分のスキマ時間に“ながら聞き”で学べる音声コンテンツです。

すべてのコンテンツを疫学専門家が監修し、完全無料で毎日投稿していきますので、ぜひチャンネル登録してお待ちください。

シリーズ一覧

ゼロから学ぶ医学研究デザインシリーズ

vol.1:システマティックレビュー&メタアナリシス入門
  - Part 1:論文を正しく集め、読み、統合する技法とは?
  - Part2:これだけは押さえておきたい SR&MAの基礎知識
  - Part3:教科書が教えてくれない SR&MA実践のための9ステップ(本記事)

個人・企業からの寄稿を受付中

play_arrow
寄稿ページはこちら