強化学習(reinforcement learning)は、与えられた環境における価値を最大化するようにエージェントを学習させる機械学習のいち手法で、AI同士を戦わせることで強いAIを生み出すという。

強化学習に必要な大規模演算には、産業技術総合研究所(産総研)のスパコン「ABCI」を活用。AIの研究開発で知られる東京大学・松尾研究室も技術面で支援する。