TOP

/

【書籍紹介】Pythonデータ分析おすすめ本9選 - 専門家が解説 - vol.8

【書籍紹介】Pythonデータ分析おすすめ本9選 - 専門家が解説 - vol.8

2026.03.19

医学統計やデータ分析は、SPSSやSASなどのGUIソフトで十分――。

そう思っている方は少なくないはずです。私もかつて研究部門に所属していた時代はそう思っていました。

確かにクリックだけで解析できるツールは便利です。しかし、複雑なデータ前処理、解析の再現性を確保しようとすると、GUIだけでは限界が見えてきます。

ここでプログラミング言語の一種である「Python」という選択肢が挙がります。

Pythonを使いこなすことができれば、データ前処理の自動化も、高度なモデルの実装も、美しい可視化も手が届くようになります。

本記事では、実際にPythonを用いた研究で国際誌への論文発表を行っている筆者が、Pythonへの心理的ハードルを下げる入門書から、医療データを扱うための実践書、因果推論といった発展的な内容まで、学習状況に合わせた9冊を厳選しました。

あなたのデータを、患者さんのための価値に変えるための道しるべとなる書籍を紹介します。

mMEDICI Library | ひらけ、叡智の扉

叡智の扉を、全ての人が開けるように——。

学びは、限られた豊かな人々だけの特権ではありません。

経済的困難に直面する人、地方で学習資源に恵まれない人、家事や育児・仕事に追われる人。

mMEDICI Libraryではそんな人々にこそ、最高の学びを届けるため、研究・キャリア・学習・受験のあらゆるテーマでパブリックヘルスの叡智を集めました。

隙間時間にスマホひとつで、誰もが「一流の知」に触れることを叶えていきます。

「ここを開けば、誰しもが悩みを解決できる」、そんなメディアを目指します。

この記事のまとめ

この記事を読むと分かること

  • プログラミング未経験の医療職や研究職が、無理なくPython学習を始めるためのステップ

  • 文法学習で終わらせず、実際の統計解析やデータ処理まで到達するための書籍選び

  • 医療データ特有の前処理や因果推論を学ぶための専門書籍

この記事は誰に向けて書いているか

  • SPSSやExcelでの解析に限界を感じ、Pythonへの移行や併用を考えている医療従事者・研究者

  • 独学でPythonを始めたが、文法を覚えただけで挫折した経験がある方

  • レセプトデータや臨床データの前処理を効率化したい方

書籍紹介シリーズ

vol.1:3年で副業売上1,500万円の研究者が勧める 副業まずこの1冊【ジャンル別】
vol.2:医療データサイエンティストを目指す人へのお勧め書籍8選
vol.3:医学研究デザインの道標 9選
vol.4:臨床研究最初の一歩おすすめ書籍9選
vol.5:因果推論おすすめ書籍8選
vol.6:英語論文執筆からアクセプトまでのおすすめ書籍5選 - 大学教授が解説
vol.7:統計解析ソフトRおすすめ本8選
vol.8:Pythonデータ分析おすすめ本9選(本記事)

執筆者の紹介

氏名:小林 由幸
所属:星薬科大学 医療データサイエンス研究室
経歴:博士(薬科学)・博士(経営学)。専門はデータサイエンス、環境科学、リスク評価、レギュラトリーサイエンス、分析化学。薬学研究科を修了後、内資系製薬企業で医薬品原薬・製剤の研究開発や品質管理業務に従事。その後、内資・外資化学企業にて農薬の国内外の登録申請業務を計7年以上経験し、日本・欧米・中国の規制当局との折衝や試験マネジメントを統括した。コンサルティングファームにおいて、主にライフサイエンス企業の研究開発支援や新規事業開発支援に携わり、2025年4月より現職。複数の大学の研究員を兼任し、日本学術振興会 R051 メタロミクス委員会やライフインテリジェンスコンソーシアムWG05に参画し産学連携の研究に貢献。機械学習による環境リスク評価モデルの構築や、ベイズ推定を用いた食品安全リスク評価モデルの構築、自然言語処理・大規模言語モデルを用いた研究動向分析等を軸に、薬学領域におけるデータサイエンスの応用研究と教育に従事している。筆頭著者として複数のQ1ジャーナルを含む査読付き国際誌に16報を発表。

編集者

氏名:菊池祐介
所属:mMEDICI株式会社
専門性:作業療法学修士。首都大学東京(現東京都立大学)・東京都立大学大学院を卒業後、病院勤務を経て専門学校・私立大学にて作業療法教育、地域共生社会の醸成に向けたリハビリテーション専門職の支援に関する研究に従事。現在は心身の健康とその人らしさの実現に向け、保険内外でのクライアント支援を展開している。作業療法の社会的意義向上を信念に、mMEDICI株式会社に参画。

監修者

氏名:廣瀬直紀
所属:mMEDICI株式会社
専門性:保健学博士・公衆衛生学修士。東京大学・東京大学大学院を卒業後、外資系製薬企業の疫学専門家として薬剤疫学・リアルワールドデータ研究を専門とする。日本・グローバルの双方で活動したのちに、全ての人がアクセス可能な一流の知のプラットフォームを作り、「知に繁栄を、辺野に豊穣を」実現すべく、mMEDICI株式会社を創業。

新谷先生無料講義

はじめに

臨床研究や疫学研究の現場で、解析の再現性と透明性がかつてないほど問われるようになっています。

GUIのソフトは手軽ですが、前処理の過程がブラックボックスになりやすいのが難点です。また、大規模データを扱おうとすると、処理が追いつかない場面も珍しくありません。

私自身、かつては企業の研究所で実験を行う研究者でした。しかし、数万件規模の化学物質データを扱う必要に迫られた際、既存ソフトでの作業に限界を感じました。このままでは解析ができないという焦燥感の中で出会ったのが「Python」です。

それまで数日かかっていた作業が数秒で終わる。その感動は今でも忘れられません。

Pythonは、世界中の研究者が知恵を持ち寄って育ててきた、統計解析や機械学習のためのツールボックスです。複雑なデータクリーニングを自動化し、高度な統計モデルを組み、結果を可視化できます。

一方、書店には様々なPythonの本が存在し、初学者にとっては何から手をつけるかが切実な問題です。

本記事では、プログラミングやコードへのアレルギーを克服するところから始め、最終的に医療データを患者さんのために形にする力を身につけるまでの9冊を、学習のロードマップに沿って紹介します。

1.プログラミングへの恐怖心を消す最初の一歩

Python1年生 第2版 体験してわかる!会話でまなべる!プログラミングのしくみ

Python1年生 第2版 体験してわかる!会話でまなべる!プログラミングのしくみ

Pythonを始めたいけれど難しそうで手が出ない、過去に挫折した——。」そういう方が最初に手に取る一冊です。

まずは、コードを書けばPCが動くという体験を通じて、心理的な壁を取り払うことを目的にしてください。

私自身、データ解析の必要性に迫られて最初にPythonを学ぼうとした時、気合を入れて分厚い専門書を買ってしまいました。しかし、画面に無機質に並ぶ謎の英文字や、少しタイピングを間違えただけで出力されるエラーメッセージに直面し、自分には向いていないと、すぐにPCを閉じかけた苦い経験があります。

当時の私にとって最大の障壁は、単純なプログラミングへの恐怖心でした。

もしあなたが当時の私と同じ状態なら、本書はその特効薬になります。

本書の最大の特徴は、初学者を決して挫折させない設計にあります。先生と生徒の対話形式で進み、専門用語を極限までかみ砕いて解説しています。

文章が平易で重たくない読書体験ができ、プログラミング特有の怖さを楽しさに変えてくれる構成です。簡単な人工知能アプリの作成まで体験できるため、学習のゴールが見えやすい点も助かります。

この本は、読んで終わりではなく、実際に手を動かすための本です。

ただし、完璧に理解しようとする必要はありません。まず一通り読み通して、Pythonでこんなことができるのかという全体像をつかんでください。「2年生」「3年生」と続くシリーズ構成なので、完了したら達成感を持って次のステップへ進めます。

2.「動く」から「書ける」へ。文法を体系的に固める

独習Python 第2版

独習Python 第2版

「1年生」でPythonの楽しさを知ったら、次は思い通りの処理を自分で書くための文法と型を学ぶ番です。本書は、そのための標準教科書兼辞書という位置づけになります。

初歩的な本を終えて、いざ自分の研究データを解析しようとした時のことです。ネット上に転がっているコードの切り貼りで何とかしようとしました。その結果、ちょっとしたエラーが出ても原因がわからず、数日後には自分が書いたコードの意味すら理解できないという状態に陥ってしまったことがありました。

「研究の生命線である再現性を確保するためには、やはり基礎的な文法や型の体系的な理解から逃げることはできない」と、思い知らされた瞬間でした。

600ページを超えるボリュームは圧巻ですが、それだけ基礎から標準ライブラリ、オブジェクト指向までを網羅しています。

第2版では、型ヒントや非同期処理といった現代的な仕様も取り込まれており、実務で通用する堅実なコードを書く習慣が身につきます。解説、例題、理解度チェックの3ステップで構成されていて、独学でも着実に知識を定着させられる設計です。

最初からすべてを完璧に理解しようとしないでください。分量が多いため、章ごとに完璧主義で進むと高確率で挫折してしまいます。

まずは必要な章を読んで、章末の練習問題で手を動かす。実際の解析で書き方を忘れた時に辞書として立ち返る。この使い方がいちばん持続できます。

3.前処理の現実を学ぶ。データ分析の第一歩

Pythonではじめるオープンデータ分析 経済統計の取得から、データハンドリング・可視化・分析まで

Pythonではじめるオープンデータ分析 経済統計の取得から、データハンドリング・可視化・分析まで

Pythonの基本的な文法を覚えると、すぐに高度な機械学習や統計モデルを動かしてみたくなるものです。しかし本書は、そのはやる気持ちを一旦落ち着かせ、データ分析において避けては通れない前処理の現実を教えてくれます。

本書の最大の強みは、e-Stat(政府統計)や世界銀行といった実際のオープンデータを題材にしている点です。データがどこにあるのかを探し、分析できる形に整え、グラフにして可視化し、意味を分析するという、現場のリアルなワークフローを一貫して体験できます。

サポートサイトが充実しており、公開コードを動かしながら学習できる構成になっています。Jupyterの操作などPythonの基礎操作に不安がある場合は、前述の「独習Python」などを参照しながら進めるとスムーズです。

私がこれまでに取り組んできたレギュラトリーサイエンスの領域でも、国内外の規制当局が公開しているデータを利用する機会が多くあります。しかし、実際に公的機関からダウンロードしたファイルを開くと、構造化データになっていなかったり、年代によって書式が変わったりするなど、そのままでは到底プログラムで処理できない汚いデータであることも多いです

実際、実務の9割はこのデータクリーニングに費やされると言っても過言ではありません。

だからこそ、「本書を通じて世の中の生データを自分の手で扱いやすい形に手なずける感覚を養うこと」は、非常に価値があります。

きれいに整えられた練習用データでは学べない、泥臭くも強力な実践力が身につくはずです。

4.データ加工と可視化の土台を盤石にする

Pythonによるあたらしいデータ分析の教科書 第3版

Pythonによるあたらしいデータ分析の教科書 第3版

他分野の研究者と産学連携プロジェクトを進めたり、ジャーナルに掲載されたPythonのコードを読み解いたりする際、必ずと言っていいほど共通言語として登場するのが、「NumPy、pandas、Matplotlib、scikit-learn」といった定番ライブラリです。

私自身、外部の研究グループとのデータサイエンスの応用研究に参画する中で、これらのライブラリの標準的な作法を身につけていないと、議論にすらついていけない場面を何度も目にしてきました。

自己流のコードから脱却し、誰が見ても分かりやすい分析基盤を構築するためには、どこかで一度、体系的な学習の時間を取る必要があります。

本書は、その基礎体力をつけるための最適な教科書です。

青と黒の二色刷りで淡々と解説が進むため、体験型の本に比べると少し硬派な印象を受けるかもしれません。しかし、データ分析に必要な数学知識の基礎から丁寧な解説があり、資格試験対策にも使われるほど網羅性が高い一冊です。

手元に置いておけば、長きにわたってあなたの分析を支える盤石な土台となってくれるでしょう。

5.医療データ特有のリアルと向き合う

Pythonによる医療データ分析入門―pandas+擬似レセプト編

Pythonによる医療データ分析入門―pandas+擬似レセプト編

本記事の読者にとって、最も実務に直結し、かつ挑戦しがいのある一冊がこちらです。

一般的なデータ分析本では扱われないレセプトデータ(診療報酬明細書)特有の複雑な構造や処理方法を、擬似データを用いて実践的に学びます。

医療データは個人情報の観点から実データでの学習が困難ですが、本書は公開データから擬似レセプトを生成し、それを分析するというユニークなアプローチをとっています。

特に、Cox比例ハザードモデルなどの生存時間解析について、パッケージに頼りきりになるのではなく、数式をもとにゼロからコードを実装していく解説は、理論の深い理解を助けてくれます。

以前、私がレセプトデータに関する研究に初めて関わった時のことです。傷病名と診療行為が複雑にひもづくレセプトデータ独特の構造を前に、一般的なデータ分析スキルだけでは歯が立たず、悔しい思いをしたことがありました。

本書は、まさにそうした医療データあるあるな泥臭いデータラングリング(変形・加工)に正面から向き合うための数少ない専門書です。

少しハードルは高いですが、基礎を固めた後にぜひ挑んでいただきたい一冊です。

6.統計学の理論をコードに翻訳する

Pythonで学ぶあたらしい統計学の教科書 第2版

Pythonで学ぶあたらしい統計学の教科書 第2版

「p値とは何か、t検定の仕組みは」といった統計学の理論を、数式だけでなくPythonコードで動かしながら腹落ちさせたい方に最適です。

統計学の基礎から線形モデルなどの機械学習の入り口までを、Pythonの実装とともに丁寧に解説しています。

かつて私は、統計の理論書を読んで数式は理解できたつもりになっても、いざ自分のデータにどう適用するかで手が止まってしまうことが多々ありました。GUIソフトでは、なんとなくボタンを押せばp値が出てしまいますが、それがプログラムとしてどのように計算されているのかの理解ができていなかったからです。

本書の素晴らしい点は、理論の解説の直後に、それをPythonでどう書くかがセットで提示されていることです。

統計手法がコードとして可視化されることで、「ああ、この数式は裏でこういう計算をしていたのか」と、統計学への解像度が劇的に上がる体験ができました。

分厚い本ですが、手を動かしながら読み進めることで着実に理解が進みます。エラーが出たらWeb検索や生成AIを活用して解決する、エンジニア的な解決力も同時に養うつもりで取り組んでみてください。

7.ベイズ推論という新しい武器を手に入れる

Pythonでスラスラわかる ベイズ推論「超」入門

Pythonでスラスラわかる ベイズ推論「超」入門

頻度論である従来の統計学に加え、近年医療分野でも応用が進むベイズ推論を学びたい方のためのエントリーブックです。「スラスラわかる」のタイトルに嘘はなく、高校数学レベルの知識があれば読み進められる内容が魅力です。

本書の良さを特にお伝えしたいのは、不確実性を伴う限られたデータを扱うことがある研究者の方々です。

私は以前、とあるリスク評価に関するテーマで国際誌に論文を発表しました。その研究では、データが限られている中で不確実性を考慮した評価を行うため、ベイズ推定の導入が不可欠でした。

しかし、ベイズ推論を学び始めた頃は理論書をいくら読んでも、「で、これをどうやって実装するの?」という壁にぶつかり、かなり苦労しました。そんな時、PythonのPyMCライブラリを使い、ABテストの効果検証など実務的な応用事例から入る本書の「まずは動かして理解する。」というアプローチに救われました。

数式だけで理解しようとすると難解なベイズの世界へ、コードという具体例を通して案内してくれます。まずは実装からベイズ推論を導入したいという方に、私の実体験から強くおすすめできる一冊です。

8.意思決定のための分析として因果関係を実装する

因果推論 基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ

因果推論 基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ

「この薬を使ったから治ったのか(因果関係)、それとも治りやすい人が薬を使っていただけなのか(相関関係)。」この問いに答えるための因果推論をPythonで実装するための実践書です。

私が専門とする環境科学の分野でも、化学物質への曝露が、本当にその健康被害を引き起こしたのかという因果関係の特定は、避けて通れない重要課題です。単なる相関ではなく因果を示すことは、政策決定やガイドライン策定といった社会実装に直結するからです。

本書は、因果推論の基礎から、機械学習や時系列解析を用いた応用まで幅広いトピックを扱っています。

論文引用も多く著者の知見の広さがうかがえますが、説明がコンパクトにまとまっているため、理論の深掘りは後回しにして、まずは手っ取り早くコードやライブラリを試して実装の練習をしたいという実務的なニーズにしっかり応えてくれます。

内容は濃く、初心者には少しハードルが高いかもしれません。ある程度Pythonに慣れてきた段階で、ライブラリを試しながら実装の引き出しを増やす目的で活用するのがおすすめです。

なお、Pythonでの実装に入る前に、そもそも因果推論とは何か、DAG(有向非巡回グラフ)をどう描くかといった理論や研究デザインを基礎から固めたい方は、本シリーズの別記事「【書籍紹介】因果推論おすすめ書籍8選 - 専門家が解説 - vol.5」をぜひ併せてご覧ください。理論(vol.5)と実装を両輪で回すことで、解析の説得力は飛躍的に高まります。

9.医療×AIをPythonで難しすぎない範囲で体験したい

Pythonで体感! 医療とAIはじめの一歩〜糖尿病・乳がん・残存歯のデータ、肺のX線画像を使って機械学習・深層学習を学ぶ体験型入門書

Pythonで体感! 医療とAIはじめの一歩〜糖尿病・乳がん・残存歯のデータ、肺のX線画像を使って機械学習・深層学習を学ぶ体験型入門書

これまでに紹介した書籍で基礎を固めた上で、統計解析だけでなく機械学習・深層学習といった話題の医療AIにも少し触ってみたいという知的好奇心を満たすための一冊です。難解な数学や理論から入るのではなく、まずは動くものに触れてみたいというニーズに応えます。

本書の最大の魅力は、ブラウザで動作し、環境構築不要のGoogle Colaboratoryを利用する点です。

かつての私がそうだったように、多くの初学者にとって最大の鬼門は環境構築です。せっかくやる気を出したのに、黒い画面での設定につまずいて数日無駄にしてしまう…。そんな無駄なフラストレーションなしに、ブラウザさえあればすぐにスクリプトを動かせる手軽さは特筆に値します。

糖尿病データ、乳がん検診データ、肺のX線画像といった医療現場らしいリアルな題材を扱いながら、機械学習やディープラーニングを体験できます。

本格的なアルゴリズムの理解は後回しにして、まずは理屈を抜きにしてコードを動かし、結果が出る楽しさを味わうための副読本としてご活用ください。

10.まとめ

本記事では、初学者の医療職・研究者がPythonの世界への一歩を踏み出すための9冊をご紹介しました。

GUIソフトのボタンを押すだけの解析はたしかに手軽ですが、それはソフトにできることの範囲内でしか研究ができないことを意味します。私自身、既存のツールの制約に苦しんだWet研究者時代を経て、Pythonを習得したことでその制限から解放されました。

自分が本当に明らかにしたい問いに対して、自由なアプローチで解析を設計し、そのプロセスを透明性高く世界に提示できる力を手に入れることができたのです。

環境構築が怖い、エラーが不安という壁は、今回紹介した「Python1年生」や「独習Python」、そして「Pythonで体感!医療とAIはじめの一歩」のような体験型書籍が必ず乗り越えさせてくれます!

最初から完璧を目指す必要はありません。分厚い本は辞書として割り切り、まずはコードを動かして結果が出る楽しさを味わうことから始めてみてください。

ところで、データ解析においてPythonと双璧をなすプログラミング言語に「R」があります。もしあなたがPythonとR、どちらから学ぶべきか迷っている、あるいは所属する医局や研究室が主にRを使っているという場合は、ぜひ本シリーズの前記事「【書籍紹介】統計解析ソフトRおすすめ本8選 - 専門家が解説 - vol.7」も併せてご覧ください。生成AI時代におけるRとの向き合い方や、医療統計に特化した良書が詳しく解説されています。

私も用途に応じてRとPythonを使い分けていますが、複雑な前処理や機械学習はPythonで回し、美しい統計図表の作成や特定の検定はRで行うなど、目的に応じて使い分けられるようになれば、あなたの解析の引き出しはさらに強固なものになるはずです。

その小さな成功体験の先には、レセプトデータや画像データといった宝の山を、自身の力で意味ある知見へと変え、論文という形で社会に実装していく刺激的な研究生活が待っています。

まずは今日、紹介した中からこれなら読めそう、と感じた一冊を手に取ってみてください。

その一冊が、あなたの臨床・研究キャリアを大きく広げるはじめの一歩になることを心より願っております。

11.一覧表「この悩みには、この1冊」

悩み/目的

まず開く1冊

Pythonに初めて触れる(超入門)

Python1年生 第2版 体験してわかる!会話でまなべる!プログラミングのしくみ

Pythonの文法・標準ライブラリまで体系的に固めたい

独習Python 第2版

オープンデータで前処理→可視化→分析まで通しでやりたい

Pythonではじめるオープンデータ分析

Pythonで整形・欠測・集計・可視化の土台を作りたい

Pythonによるあたらしいデータ分析の教科書 第3版

医療データの題材で、前処理から可視化を現場の肌感で練習したい

Pythonによる医療データ分析入門――pandas+擬似レセプト編

推測統計を手を動かして腹落ちさせたい

Pythonで学ぶあたらしい統計学の教科書 第2版

ベイズ推定を実装込みで始めたい

Pythonでスラスラわかる ベイズ推論「超」入門

Python通じて因果推論の応用を学びたい

因果推論: 基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ

医療×AIを、難しすぎない範囲で体験したい

Pythonで体感! 医療とAIはじめの一歩〜糖尿病・乳がん・残存歯のデータ、肺のX線画像を使って機械学習・深層学習を学ぶ体験型入門書

【オンラインスクール mJOHNSNOW入会受付中:7日間無料お試し】

オンラインスクール mJOHNSNOW入会受付中

mJOHNSNOWはスペシャリストが提供する医学研究講座にスマホで、スキマ時間にアクセスできる日本最大規模のオンラインスクールです。

継続率98.0%の高いクオリティで、累計1,631名を超える仲間が入会し、初学者向けの因果推論、疫学、統計学、データ解析、RWDなどをスペシャリストから学んでいます。

講義はすべてオンデマンド化されるので自分のペースで学びを進められ、研究・キャリアの悩みは24時間いつでもチャットで相談可能。安心の定額制で、満足いくまで学び放題です。

【参加者の声】
・地方在住で学ぶ場がなく困っていましたが、大学院に行かないと学べないようなことを仕事の合間に学ぶことができ大満足です(40代女性 医師)
・フォローアップが手厚く、オンデマンドで分かるまで学べるのが初学者にとってとても助かっています(30代男性 製薬企業社員)
・低価格なのに見切れないほど多くの講座が受講でき、どれも質が高いです(40代女性 大学研究者)

詳細を見る

【YouTubeラジオコンテンツ 耳から学ぶシリーズ】

YouTubeラジオコンテンツ「耳から学ぶシリーズ」は、仕事や育児で忙しい人が10分のスキマ時間に“ながら聞き”で学べる音声コンテンツです。

すべてのコンテンツを疫学専門家が監修し、完全無料で毎日投稿していきますので、ぜひチャンネル登録してお待ちください。

シリーズ一覧

書籍紹介シリーズ

vol.1:3年で副業売上1,500万円の研究者が勧める 副業まずこの1冊【ジャンル別】
vol.2:医療データサイエンティストを目指す人へのお勧め書籍8選 - 専門家が解説
vol.3:医学研究デザインの道標 9選 - 専門家が解説
vol.4:臨床研究最初の一歩おすすめ書籍9選 - 専門家が解説
vol.5:因果推論おすすめ書籍8選
vol.6:英語論文執筆からアクセプトまでのおすすめ書籍5選 - 大学教授が解説
vol.7:統計解析ソフトRおすすめ本8選
vol.8:Pythonデータ分析おすすめ本9選(本記事)

個人・企業からの寄稿を受付中

play_arrow
寄稿ページはこちら