最近、たばこのパッケージに表示される注意文言が大きくなりました。そこには、喫煙が肺がんや肺気腫になる危険性を高めると書かれています。
私の研究では、この“肺気腫”という病気をターゲットにしています。パッケージに別々に記されていることからわかるように、肺がんと肺気腫は“違う”病気です。腫瘍などがあるわけではなく、肺の中の構造が壊れていくような症状だとご理解ください。
学生時代の理科を思い出してください。肺の中には肺胞という丸い細胞があり、肺胞が無数に存在することで肺の表面積を広げ、酸素と二酸化炭素の循環効率をよくしています。肺気腫はこの肺胞が壊れます。肺胞が壊れていくと肺の表面積が減り、二酸化炭素を酸素に変換しにくくなるため、呼吸困難などを引き起こすのです。一旦壊れた肺胞は治ることはありません。ですから、肺気腫の治療に対しては、その進展をいかに早い段階で止めるかが課題となっているのです。
現在、肺気腫は慢性気管支炎とまとめて、慢性閉塞性肺疾患(Chronic Obstructive Pulumonary Disease:COPD)と呼ばれています。このCOPDにより、日本では毎年15000人もの方が亡くなっています。さらに世界に目を向けると、第3位の死因にランクインしており、年間で約300万人が亡くなるとまで言われています。
COPDを発症する患者の多くは喫煙者です。そのため昔は“たばこ病”とも揶揄されていました。しかし研究が進むにつれて、「喫煙量が多ければCOPDの進展速度が速い」というわけではないことがわかってきました。あまり喫煙しない人でもCOPDの進展が早く、逆に多く喫煙する人の中には進展が遅い人もいるのです。
「この差を生んでいる原因があるはず。それが何かを明らかにしよう!」と考えたことが、今回の研究のキッカケです。
当初、喫煙量の他の因子として、遺伝的要因があると仮定しました。もちろん、これまでCOPDの発症に関与する遺伝子は医学界で多く研究されてきましたが、進展に関与する一塩基多型(SNP:single nucleotide polymorphism)はあまり研究されていなかったので、私はここに着目しました。SNPとは、DNAの塩基配列のうち1個の塩基が他の塩基に置き換わっているものを指します。
実は我々の研究グループ(仁木登名誉教授・河田佳樹教授のグループ)では、東京都予防医学協会の協力を得て喫煙者・過去喫煙者・非喫煙者のCT検診画像・臨床情報を長期間にわたって蓄積し、世界に類を見ない長期経年3次元CT画像・臨床情報データベースを、すでに構築済みでした。また、このデータベースを解析し、同じ喫煙量で進展速度が異なる群が存在することもわかっていました。
そこで、COPD患者のCT画像とDNAを照らし合わせて解析することで、COPDの進展が早い患者に存在するSNPを同定しようと考えました。私が挑戦的研究助成に申請したのは、このタイミングです。
なお、病巣の増え方を定量的に評価するための“画像情報”と“遺伝情報”を統合する研究分野はRadiogenomicsと呼ばれており、本研究はこの分野のひとつと言えます。
ご存じのように、DNAはATCGの4種類の塩基による二重螺旋構造によって成り立っています。SNPはそのうちの2組を所持しており、SNPごとにその2組が何であるかを決定する作業をタイピングと言います。当初から研究グループで構築したデータベースに、そのSNPの情報を追加するべく、COPD関連SNPのタイピングを行いました。
そして3次元CT画像・臨床情報データベースに対し、AIによる深層学習を用いて多様な画像特徴を解析しました。例えば、肺は5つの肺葉からなりますが、この肺葉の高精度かつ高速な分類を実現することに成功したのも、この研究の成果の1つです。
次にCT画像・臨床・SNP情報による肺気腫の高進展リスク群の層別化を行いました。肺気腫の進展を目的変数とし、解析することで、肺気腫進展に関与するSNP群を同定することが狙いです。
さらに画像・喫煙・SNP情報からなる要素(生涯喫煙量、喫煙年数、1日あたりの喫煙量、肺気腫のサイズ、肺気腫の密度、各種遺伝子型など)9次元の説明変数を用意し、それを非線形次元削減法の1つであるt-SNE(t-Distributed Stochastic Neighbor Embedding)法によって2次元に圧縮、これをGMM(Gaussian Mixture Model)によって3クラスに分類しました。
これにより、喫煙量が多いクラス1と3、少ないクラス2に分類できました。喫煙量の多いクラス1に進展が早い人達が偏っていることがわかりましたので、そのクラスを調べたところ、rs13180の遺伝子型がCOPDの進展に関与していることが明らかになりました。
実は、高進展リスク群層別化のための解析方法に苦労していた時期があります。その困っていた時期に、タイミングよくメンタリングが行われ、桜田一洋先生に教えていただいたのがt-SNE法でした。指導教官以外から、このような具体的アドバイスを受ける機会はありませんでした。本当に感謝しています。