物理学系 News&Information

最適輸送が組み込まれた「生成拡散モデル」の学習則の解明

計算資源の限られた環境における高性能な生成モデルの活用にも期待

  • RSS

2025.10.02

東京科学大学(Science Tokyo) 理学院 物理学系の蒲健太郎大学院生と大関真之教授、東北大学 情報科学研究科の清水怜央大学院生(当時)と杉山友規特任准教授の研究チームは、最適輸送[用語1]の理論を取り入れた生成拡散モデル[用語2]の学習則を単純化し、学習の効率化に成功しました。

生成拡散モデルは、生成AI[用語3]の一種であり、多くの画像生成AIサービスの基盤となる技術です。近年、その性能向上のために、最適輸送の手法である「シュレーディンガー橋[用語4]」を組み込んだモデルが注目されていますが、複雑な数理構造ゆえに学習則の直感的な理解が困難でした。

本研究では、生成拡散モデルを変分オートエンコーダ[用語5]という他の生成AIの拡張として定式化することで、モデル内の2つのニューラルネットワークが果たす役割を明確化しました。さらに、この理論的枠組みに基づき、一方のニューラルネットワークの学習を早期終了することで、精度を犠牲にせずに計算コストが削減可能であることを数値計算で実証しました。これらの成果は、計算資源の限られた環境における高性能な生成モデルの活用を推し進めることが期待されます。

本成果は、9月3日付(現地時間)の「Physical Review Research」誌に掲載されました。

  • RSS

ページのトップへ

CLOSE

※ 東工大の教育に関連するWebサイトの構成です。

CLOSE