【初学者にも書ける医学英語論文】東大大学院生を指導してきた医師が語る：論文の量産を可能にする習慣×統計手法 - vol.6 後編

【初学者にも書ける医学英語論文】東大大学院生を指導してきた医師が語る：論文の量産を可能にする習慣×統計手法 - vol.6 後編

2025.07.27

▼前半はこちら！

【初学者にも書ける医学英語論文】東大大学院生を指導してきた医師が語る：論文の量産を可能にする習慣×統計手法 - vol.6 前編

臨床論文を英語で執筆してアクセプトを勝ち取るまでには、たくさんの高い壁が立ちはだかるように感じる人も多いでしょう。

良きメンターにめぐり会うか、よほどの能力の持ち主でないと、これまではその壁を乗り越えることは困難だったかもしれません。

どのようなステップを踏めば最初の論文執筆を成功させることができるか、東大大学院で多くの後輩の英文論文を指導する中で見えてきた、その最適解とも言える指導法のエッセンスを全６回に渡り公開します。

第６回の前編では、論文を大量生産するために有効に時間を使う「執筆ハック」や、原著論文や症例報告以外の投稿カテゴリーをご紹介しました。

後編となる今回は、論文執筆に必要な統計の知識を解説します。

この記事のまとめ
この記事を読むと分かること
この記事は誰に向けて書いているか
英語論文執筆シリーズ
執筆者の紹介
編集者
監修者
非専門家でも知っておきたい統計手法
パラメトリック vs ノンパラメトリック
時間という要素　Time-to-event Analysis
講座紹介｜【ゼロからの】英語で書ける医学論文執筆講座
統計ソフトの落とし穴
様々なバイアスにも注意
対照群の選び方
データベースの作り方とクリーニングの重要性
最後に
研究計画・医療統計から、英語論文執筆・アクセプトまでトータルサポートならmJOHNSNOW！
【YouTubeラジオコンテンツ　耳から学ぶシリーズ】

この記事のまとめ

この記事を読むと分かること

複数の論文を継続して執筆するコツ
原著論文以外の論文カテゴリー
統計専門家でなくても知っておきたい統計知識

この記事は誰に向けて書いているか

英文論文を１・２本書き終えた方
症例報告や記述統計からステップアップしたい方
後輩に論文執筆の指導をする方

英語論文執筆シリーズ

vol.1：東大大学院生を指導してきた医師が語る - 英語論文執筆の心理的ハードルを下げよう
vol.2：東大大学院生を指導してきた医師が語る - たった三つを意識すれば論文構成は完成する
vol.3：東大大学院生を指導してきた医師が語る - 学会発表を論文化する最短ルート
vol.4：東大大学院生を指導してきた医師が語る - 投稿から査読対応までの基本プロセス
vol.5：
（前編）東大大学院生を指導してきた医師が語る - AI時代に求められる論文リテラシーとは？
（後編）東大大学院生を指導してきた医師が語る - AI時代に求められる論文リテラシーとは？
vol.6：
（前編）東大大学院生を指導してきた医師が語る - 論文の量産を可能にする習慣×統計手法
（後編）東大大学院生を指導してきた医師が語る - 論文の量産を可能にする習慣×統計手法（本記事）
vol.7：生成AIで進める英語論文執筆の全体戦略 - プロンプト付きで即実践！
vol.8：研究テーマの見つけ方と投稿先選び - 日常から着想を得て論文に育てるステップ
vol.9：短時間で“使える論文”を探す文献検索の手順 - PubMed×AI活用で効率化
vol.10：型で攻略するIMRADの書き方 - 読者に伝わるIntroductionを書くコツ
vol.11：型で攻略するIMRADの書き方 - 再現性の高いMethodsを書くコツ
vol.12：型で攻略するIMRADの書き方 - 過不足のないResultsを書くコツ
vol.13：型で攻略するIMRADの書き方 - 一貫性のあるDiscussionを書くコツ
vol.14：IMRADを要約する論文の顔 - 印象に残るTitleとAbstractを書くコツ

執筆者の紹介

氏名：畑啓介
所属：東京大学医学部非常勤講師・とよしま内視鏡クリニック
専門性：医師・医学博士（外科学）・英検１級・全国通訳案内士（英語）・ECFMG certificate取得。東京大学医学部医学科・東京大学大学院医学系研究科外科学専攻卒業、米国サンタモニカ John Wayne Cancer Institute留学・東京大学がんプロフェッショナル養成プラン元特任講師を経て現職。医学英文論文執筆・執筆指導多数。著書に『学会発表・医学英語論文執筆のトリセツ』『初めての症例報告！外科医のためのケースレポートのトリセツ』

編集者

氏名：菊池祐介
所属：mMEDICI株式会社
専門性：作業療法学修士。首都大学東京（現東京都立大学）・東京都立大学大学院を卒業後、病院勤務を経て専門学校・私立大学にて作業療法教育、地域共生社会の醸成に向けたリハビリテーション専門職の支援に関する研究に従事。現在は心身の健康とその人らしさの実現に向け、保険内外でのクライアント支援を展開している。作業療法の社会的意義向上を信念に、mMEDICI株式会社に参画。

監修者

氏名：廣瀬直紀
所属：mMEDICI株式会社
専門性：保健学博士・公衆衛生学修士。東京大学・東京大学大学院を卒業後、外資系製薬企業の疫学専門家として薬剤疫学・リアルワールドデータ研究を専門とする。日本・グローバルの双方で活動したのちに、全ての人がアクセス可能な一流の知のプラットフォームを作り、「知に繁栄を、辺野に豊穣を」実現すべく、mMEDICI株式会社を創業。

非専門家でも知っておきたい統計手法

本シリーズ第１回で、論文執筆初学者には症例報告や記述統計をおすすめしました。第３回では『沼にはまりすぎない統計』として、少しだけ統計について触れました。

さらに論文を執筆していくには、もう少し統計手法を学んでいくことが避けられませんので、以下で触れていきたいと思います。

パラメトリック vs ノンパラメトリック

統計手法の選択の際に、パラメトリックかノンパラメトリックか、という大きな分岐があります。

正規分布を仮定したパラメトリックな統計は、正規分布に近い分布でなければ用いてはいけないとされています。

正規分布に近いかどうかを調べる検定（有名なウォッカと同じ名前です）もあることはありますが、実際にはほとんど用いられず、ヒストグラムで大体ベルの形をしていればパラメトリックな手法を使って良いと考える疫学専門家が多いようです。

例えば、基礎実験で３回同じ計測をくり返す方法は英語でtriplicateと呼ばれますが、この際にも２群間の比較はパラメトリックの代表とも言えるt検定が用いられます。

３回の計測ではヒストグラムにならず、ベル型かどうか判断できませんが、一般的に正規分布するはずと判断されるのでパラメトリックな手法が用いられます。

一方で、分布が二峰性になっている場合（例：年齢の分布が10代と60代のツインピーク）など明らかに正規性がない分布にはノンパラメトリック検定を用いる必要があります。

迷った時にはノンパラメトリックを使っておけば良いという考えもありますが、正規性のある分布の場合はパラメトリック検定を用いると、本当の差を検出しやすくなります。

少し発展的ですが、腫瘍マーカーなどのように片側に裾野が伸びたヒストグラムの場合にはlogをとると正規分布になり、パラメトリック検定が使えることもあります。

時間という要素　Time-to-event Analysis

データを集計・解析する際に重要な「時間の要素」について少し触れてみたいと思います。

例えば入院カルテから先程の糖尿病を合併した大腸癌手術症例のデータベースを作成することを想定します。術前に糖尿病の診断がついている症例で術後感染症の発生率を調査したとします。

術後感染症は入院中に判明することが多いので、入院カルテのデータから集計して、重篤な感染症は100例中20例（20%）に発生した、というような情報は有用です。

このように十分な観察期間があり、その間にイベントがほぼ起こる場合には、時間に関する情報を考慮しなくても解析可能です。

では、腸閉塞の場合はどうでしょうか。腸閉塞は入院中にも起こりますが、退院後にも起こりえます。このような場合には時間を含めた解析であるTime-to-event分析が必要になります。

５年後の生存率を知りたい場合はどうでしょうか。術後５年経過した時点でデータを集めて、100人中60人の生存がわかった場合は60%として良いのでしょうか。

実際には転院や引っ越しなどで追跡不能になる人が出てきます。20人が追跡不能の場合に、分母からも除いて、80人中60人の75%が生存率とするのは乱暴です。

このような場合には通常Kaplan-Meierカーブによる推定を行います。Time to event分析の一つですが、生存時間分析と言います。

必要な時間のデータは死亡（これをイベントeventと言います）している場合には手術から死亡したまでの日数（time to event）、そうでない場合（打ち切りcensorと言います）には手術から最後に生存を確認した時（最終外来など）までの日数です。

その他にイベントに関する０か１かの情報とリスク因子などの背景情報があれば、解析が可能です。

（続きはページの後半へ）

講座紹介｜【ゼロからの】英語で書ける医学論文執筆講座

「英語論文を書き、アクセプトを勝ち取りたい」あなたへ

論文のテーマ設定から構成、執筆、そして投稿・査読対応に至るまで、論文アクセプトまでの全プロセスをゼロから丁寧に徹底解説します。

「英語論文を書くための型」を学び、私たちと共に、世界にあなたの研究を届けるための第一歩を踏み出しましょう。

詳細は「医学研究オンラインスクール mJOHNSNOW」へ

統計ソフトの落とし穴

死亡に関連するリスク因子を多変量解析で調べたい場合などに、統計ソフトを使用すれば、比較的簡単にP値が計算されて、「見た目上は」多変量解析の表がすぐに出来上がります。

しかし、前述のように時間の要素を無視して解析してしまうと、間違った結論を導いてしまう可能性があります。

まずは、単純化した以下の表を頭に入れておきましょう。

時間の要素がないアウトカムの場合には単変量ではカイ２乗、多変量解析ではLogistic regressionが用いられます。

サンプル数が少ない場合には状況によってはカイ２乗検定では正確な評価ができないことが知られており、例えばサンプルの総数が20未満の場合にはFisher正確検定を用いることが推奨されています。

もっとも２×２の表であればすべてFisher正確検定で良いと考える専門家もいます。

時間の要素を考慮するアウトカムの場合には二つのカプランマイヤー曲線を比較する時はLog-rank test、多変量解析を行う場合にはCox regressionが頻繁に用いられます。

細かいことを言うと、Cox regressionはカプランマイヤーが時間とともに一定の割合で下がるハザード性が保たれる時に使うとされています。

例えば、

・カプランマイヤー曲線が交わっている場合
・カプランマイヤーの後半で横ばいになる場合

などにはRestricted mean survival time（RMST）という手法が使われます。

（参照：NEJM Considerations in Time-to-Event Analyses）

免疫チェックポイント阻害剤の効果はしばらくしてから効果がでて、曲線の後半がほぼ横ばいになる傾向がみられます。従来の解析方法では十分な検出力がないため、RMSTなどの手法が推奨されています。

ちなみにRMSTはカプランマイヤーを積分したもの、つまり曲線の下の面積を求めたものとなり、平均的にどのぐらいの期間生存したかを示す値となります。カプランマイヤーはX軸が時間、Y軸が生存確率になっているからです。

様々なバイアスにも注意

イモータルタイムバイアスやリードタイムバイアスといったキーワードも知っておく必要があります。

イモータルタイムバイアスは、研究において一方の群（例えば治療群）に、ある期間中に死亡した患者が含まれず、もう一方の群（対照群）には含まれてしまう時に生じるバイアスです。

これは「不死期間（immortal time）」と呼ばれる、観察対象者がイベント（例えば死亡）を経験し得ない期間が偏って存在することで、治療の効果が過大に評価される可能性があります。

実際、COVID-19の治療薬に関する研究でも、入院後しばらく経ってから投与される薬剤において、早期に死亡して治療に至らなかった症例が治療群から除外され、未治療群には含まれてしまうイモータルタイムバイアスが指摘されています。

リードタイムバイアスは、観察開始時点のずれにより生じるバイアスです。

例えば、がん検診によって早期にがんが発見された場合、実際の生存期間は検診を受けなかった場合と同じであっても、診断時点が早まったことにより「見かけ上の生存期間」が延びているように見えてしまいます。これにより、検診の効果が過大に評価される恐れがあります。

RCTであれば両群でスタート時点（起点）を揃えられますが、観察研究ではしばしば起点をそろえるのが難しい場合が出てくるので注意が必要と言えます。

さらには、P値よりも大事なのは臨床的に意味のある差かどうかということも頭に入れておく必要があります。サンプル数を多くすると臨床的に意味のない差でも有意差が出てしまいます。

そのため、RCTでは最初に臨床的な意味を考慮した上で、サンプルサイズを決定するのです。

そのほかにもたくさんのバイアスがありますが、詳細は統計専門家によるｍMEDICIの講座に譲りたいと思います。

対照群の選び方

対照群を用いて症例対照研究（Case control study）を行う場合には、過去の報告でアウトカムに関連しうるファクターを調べて、これらをできるだけ症例群と対照群間でマッチさせる作業が必要になります。

例えば症例群と対照群に性別や年齢分布の違いがあれば、それらが原因で差が出てしまう可能性があるので、それらをできるだけマッチさせて解析するようにします。

もう少し知りたい方は、耳から学ぶ医学研究デザインを聞いてみてください。

もう一つ頭に入れておかなくてはいけないのが、傾向スコアマッチングです。

英語ではpropensity score（PS）といいます。余談ですが、propensityは「傾向」ですが、多くの場合悪いことをする（が起こる）傾向の場合に使われます。

後ろ向き観察研究のなかでも介入の効果を示したいような研究では、PSマッチングを行っていなければ、多くの場合、レビュワーからPSマッチングを行うように指摘されるようになっています。

PSマッチングは交絡因子を調整する方法ですが、それに関連したIPTW（Inverse Probability of Treatment Weighting：逆確率重み付け）やキャリパーといったキーワードも知っておく必要があります。

詳細は成書に譲りますが、IPTWは各患者がその背景因子からどの程度介入を受ける確率があるかという傾向スコアを算出して、その逆数をかけることで重みづけをして交絡を調整する方法です。

キャリパーはマッチングの際にどの程度の違いを許容するかを指定する数値です。小さくすると厳格なマッチングになりますが、サンプル数が減ります。

αエラーに0.05、βエラーに0.1や0.2が使われますが、キャリパーは0.2という数値が比較的よく用いられています。

mMEDICI Channel【新谷先生のゼロから極める医療統計シリーズ】の第１回ダイジェスト動画も参考になりますのでぜひご覧ください。

データベースの作り方とクリーニングの重要性

統計手法と同じぐらい、もしくはもっと大切なのはデータのクリーニングです。カルテからデータをエクセルなどに集計したデータベースには、入力ミスを含めて多くの間違いが含まれています。

どんなに複雑なまたは正確な統計手法を用いても元データが間違っていると正しい答えには到達しません。

算数の問題でも、最初の数字を書き間違えれば（２回間違った計算をして偶然正しい結果が得られることは稀にありますが）その後の計算が正しく行えても正解には至らないのと同じです。

入力の仕方はゼロから極める医療統計シリーズ：第2回ダイジェストが参考になります。

欠損値はデータベースにはつきものです。欠損値がある場合は補完imputationを行う場合があります。

基本的に欠測がランダムに起こっていれば良いのですが、死亡している人に多く欠損データがあるなどのバイアスにより、補完することで事実と異なる結果を導いてしまうこともあるので、統計の先生と相談すると無難です。

NEJMの統計報告ガイドラインに補完や多重性 multiplicityに関する説明が掲載されていますので、目を通すと良いでしょう。

最後に

第１回から第６回までを担当させていただきましたが、いかがでしたでしょうか。

少しでも皆様の論文執筆のハードルが下がったのであれば嬉しく思います。

今後もこのシリーズはIMRADやAIに関して、さらに掘り下げた記事が予定されていますので、私自身も楽しみに第１走者から第２走者にバトンをつなぎたいと思います。

ここまで読んでくださり、誠にありがとうございました。

研究計画・医療統計から、英語論文執筆・アクセプトまでトータルサポートならmJOHNSNOW！

この記事を読み、「RWD研究をしてみたい」「これまでの研究を英語論文にしてみたい」と思われた方もいらっしゃるでしょう。

そんな方には弊社が運営するオンラインスクールmJOHNSNOWがお勧めです。

mJOHNSNOWはスペシャリストが運営する臨床研究・パブリックヘルスに特化した日本最大規模の入会審査制オンラインスクールです。運営・フェローの専門は疫学、生物統計学、リアルワールドデータ、臨床、企業など多岐に渡り、東大、京大、ハーバード、ジョンスホプキンス、LSHTMなど世界のトップスクールの卒業生も集まっています。

本日解説した医学論文執筆のエッセンスに加えて、みなさんの専門性を伸ばすためのコンテンツが目白押しです！

・スペシャリスト監修の臨床研究・パブリックヘルスの講義が毎月7つ以上開催
・過去の講義が全てオンデマンド動画化されたレポジトリー
・スクール内のスペシャリストに学術・キャリアの相談ができるチャットコンサル
・フェローが自由に設立して学べるピアグループ（ex. RWDピア）
・24時間利用可能なオンライン自習室

「パブリックヘルスを、生き様に」をミッションに、『初心者が、自立して臨床研究・パブリックヘルスの実践者になる』ことを目指して学んでいます。初心者の方も大勢所属しており、次のような手厚いサポートがあるので安心してご参加ください！

・オンデマンド動画があるから納得するまで何回でも、いつでも学び直せる
・チャットコンサルで質問すれば24時間以内にスペシャリストから複数の回答が
・初心者専用の「優しいピアグループ」で助け合い、スペシャリストが”講義の解説”講義を毎月開催

詳細を見る｜ 無料体験に申し込む

【YouTubeラジオコンテンツ　耳から学ぶシリーズ】

YouTubeラジオコンテンツ「耳から学ぶシリーズ」は、仕事や育児で忙しい人が10分のスキマ時間に“ながら聞き”で学べる音声コンテンツです。

すべてのコンテンツを疫学専門家が監修し、完全無料で毎日投稿していきますので、ぜひチャンネル登録してお待ちください。

シリーズ一覧

英語論文執筆シリーズ

vol.1：東大大学院生を指導してきた医師が語る - 英語論文執筆の心理的ハードルを下げよう
vol.2：東大大学院生を指導してきた医師が語る - たった三つを意識すれば論文構成は完成する
vol.3：東大大学院生を指導してきた医師が語る - 学会発表を論文化する最短ルート
vol.4：東大大学院生を指導してきた医師が語る - 投稿から査読対応までの基本プロセス
vol.5：
（前編）東大大学院生を指導してきた医師が語る - AI時代に求められる論文リテラシーとは？
（後編）東大大学院生を指導してきた医師が語る - AI時代に求められる論文リテラシーとは？
vol.6：
（前編）東大大学院生を指導してきた医師が語る - 論文の量産を可能にする習慣×統計手法
（後編）東大大学院生を指導してきた医師が語る - 論文の量産を可能にする習慣×統計手法（本記事）
vol.7：生成AIで進める英語論文執筆の全体戦略 - プロンプト付きで即実践！
vol.8：研究テーマの見つけ方と投稿先選び - 日常から着想を得て論文に育てるステップ
vol.9：短時間で“使える論文”を探す文献検索の手順 - PubMed×AI活用で効率化
vol.10：型で攻略するIMRADの書き方 - 読者に伝わるIntroductionを書くコツ
vol.11：型で攻略するIMRADの書き方 - 再現性の高いMethodsを書くコツ
vol.12：型で攻略するIMRADの書き方 - 過不足のないResultsを書くコツ
vol.13：型で攻略するIMRADの書き方 - 一貫性のあるDiscussionを書くコツ
vol.14：IMRADを要約する論文の顔 - 印象に残るTitleとAbstractを書くコツ