证明数学定理是一项具有挑战性的工作,因此国际数学奥林匹克竞赛通常被认为是识别相关人才的方法,同时也是AI在数学和推理领域的试验场。公报说,AI系统往往难以解决几何和数学中的复杂问题,而该研究团队开发的一种方法可生成大量的合成训练资料(1亿个独特的示例),能让Alpha Geometry在没有任何人工演示的情况下进行自我训练。此外,研究团队还添加了一个基于形式逻辑的符号推演引擎,能让系统做出更“深思熟虑”的决策。
测试结果显示,在2000年到2022年国际数学奥林匹克竞赛汇编的30个几何问题中,Alpha Geometry在比赛时间内解决了25个问题,而通常的人类金牌得主能解决25.9个。相比之下,此前最先进的AI系统只解决了其中的10个。
公报说,通过Alpha Geometry,研究团队展示了AI日益增长的逻辑推理能力,以及发现和验证新知识的能力。解决国际数学奥林匹克竞赛级别的几何问题,是在通往更先进和通用的AI系统的道路上发展深度数学推理的一个重要里程碑。研究团队正在开源Alpha Geometry代码和模型,并希望它与合成资料生成和训练中的其他工具和方法一起,推动数学和人工智能等领域的新发展◆