情報工学系 News
持続可能な創薬を目指した合理的分子設計に向けて
東京工業大学 情報理工学院 情報工学系の大上雅史准教授とKengkanna Apakorn(ケンカーンナー・アーパーコーン)大学院生は、創薬における低分子化合物の物性や活性を予測する、新たなAI予測手法を開発した。
医薬品開発の加速を目指して、既知の実験データを活用して未知の物質の性質を予測する、人工知能(AI)を利用した計算技術が数多く研究されてきた。特に、近年の深層学習技術 [用語1]の発展により、こうしたAIによる予測の精度は格段に上がっている。しかしその予測に至った理由を考えるための情報は乏しく、予測結果の妥当性の判断は熟練した専門家の知識と経験に委ねられる傾向にあった。
大上准教授らは、化合物の構造式をグラフ [用語2] で表現して処理するグラフニューラルネットワーク [用語3] に着目した。そのうえで、原子と結合の関係を表現する一般的なグラフと、化合物の複数の原子や結合(部分構造)を1つのノードに縮約するグラフ表現を組み合わせて、グラフニューラルネットワークの一種であるグラフアテンションネットワーク構造 [用語4] によって学習するMMGX(Multiple Molecular Graph eXplainable discovery)という予測手法を提案した。この手法により、化合物の物性や活性を高精度に予測すると同時に、アテンション機構 [用語5] を用いて部分構造表現から算出される値によって、「どの部分に着目してその予測結果としたのか」という情報を得ることができるようになった。MMGXによる化合物の予測と解釈は、AIによって医薬品開発を加速させるAI創薬の進展に大きく貢献する。この研究成果は2024年4月5日(現地時間)に英科学誌「Communications Chemistry」でオンライン公開される。
用語説明
[用語1] 深層学習技術 : ニューラルネットワークに基づいた機械学習アルゴリズムの一種。ネットワークを多層化させることで高い予測性能を得ることが可能である。
[用語2] グラフ : 鉄道の路線図のような、点や丸で表された「ノード」と、それらの間に張られる「エッジ」によって表現される数学的な構造。化合物のグラフ表現においては、原子を「ノード」、原子間の結合を「エッジ」とした原子グラフが通常よく用いられる。
[用語3] グラフニューラルネットワーク : グラフ情報を扱うニューラルネットワークを指す。
[用語4] グラフアテンションネットワーク構造 : グラフニューラルネットワークの一種。アテンション機構と呼ばれる仕組みを採用している。
[用語5] アテンション機構 : ニューラルネットワークに入力されるデータの重要な部分を認識させるためのネットワーク構造。
詳しくは、下記東工大ニュースをご覧ください。