理化学研究所 医科学イノベーションハブ推進プログラム
健康医療データ多層統合プラットフォーム推進グループ
健康医療データAI 予測推論開発ユニット ユニットリーダー
2007年東京大学医学部医学科卒業、医師免許取得。2011年東京大学大学院医学系研究科博士課程(病因病理学専攻)修了。科学技術振興機構 ERATO河岡感染宿主応答ネットワークプロジェクトの博士研究員を経て、2013年に理化学研究所 統合生命医科学研究センター 疾患システムモデリンググループ特別研究員となる。2016年に医科学イノベーションハブ推進プログラム 疾患機序研究グループの上級研究員となり、翌年、同プログラムの健康医療データAI 予測推論開発ユニットのユニットリーダーに就任。2019年より千葉大学大学院医学研究院 人工知能(AI)医学 教授を兼任。現在に至る。
はい。高校生のときは数学オリンピックに出場していたので、毎日10時間以上、整数論やグラフ理論、幾何学などを勉強していました。ですが、上位選手にどうしても追いつくことができず「数学者になっても人の背中を追いかけ続けるのは嫌だ」と諦めて、東京大学の医学部に進学しました。大学入学当初から脳の仕組みや人工知能に興味があり、「診断や治療ができる人工知能」の研究をしたいと思ったからです。
ただし、理論を構築できても、当時はそれを検証するためのデータがありませんでした。理化学研究所に所属を移し、2016年に「医科学イノベーションハブ推進プログラム」が始まったことで、ようやく臨床データを扱えるようになったのです。
桜田先生もおっしゃっていたことですが、同じ病気の患者であっても、個々の病態には差があります。そのため、単一モデルに基づいた治療を行っても、同じ結果は出ません。
本来、医療は患者一人ひとりの疾患の特徴を見極めた上で、適切な治療を行うべきですが、それを実現する方法がなかったため、医師は「これまでの経験から効果があると期待できる治療法」を選択するしかありませんでした。しかし、臨床現場においても「まずはこの薬を1カ月服用して、様子を見ましょう」などという非効率的な治療を繰り返すことへの問題意識が高まり、層別化医療(バイオマーカーを用いてある疾患に属する患者を複数のグループに分類し、各グループに適した治療を行う医療)の実現が求められるようになってきたのです。
そうです。ここで活躍するのが、機械学習です。
臨床データは、極めて多くの要素を含んでいます。大学病院で扱っているデータの項目数は、数百から数千、疾患の種類や患者の状態によっては数百万にものぼります。その中から疾患に関連する測定項目を抽出し、複合的に判断して、共通する特徴を持った患者のグループを作る必要があります。
たとえば、皮膚ガンとは関係ない画像128万枚を機械に学習させた後、14種類の皮膚ガンの画像13万枚を学習させると、およそ皮膚科医と同じ精度で皮膚ガンを識別するアルゴリズムを作ることができます。
しかしそのアルゴリズムを、他の疾患の画像診断に適用することはできません。疾患ごとに大量の画像データを学習させ、新たなアルゴリズムを構築する必要があります。また、画像データだけから医学的に新しい知見を見出すことは、困難です。
そのため私は、画像ではなく患者の臨床データから疾患を層別化し、患者ごとの状態遷移を予測する機械学習モデルの構築を目指したのです。