Дві системи AI, розроблені фахівцями компанії Google DeepMind, разом розв’язали чотири з шести завдань, представлених на цьогорічній Міжнародній математичній олімпіаді. Фактично це рівень срібного призера чемпіонату світу з математики для старшокласників.
Здатність розв’язувати низку математичних задач за допомогою покрокових перевірок – це досить “великий виклик” для моделей машинного навчання. Досі вона була недосяжною навіть для найсучасніших AI-систем. “Це надзвичайно складні математичні задачі, – зазначив віцепрезидент з досліджень у сфері AI для науки в DeepMind Пушміт Кохлі. – Жодна AI-система ніколи не досягала високого рівня успішності у вирішенні таких завдань”.
Модель AlphaProof навчається методом проб і помилок без втручання людини та використовує так зване навчання з підкріпленням. Цей підхід став основою для створення програми AlphaGo, яка опанувала гру в ґо і навіть перемогла професійного гравця, AlphaStar, яка опанувала Starcraft, та інших AI-систем від компанії DeepMind.
Як розповів інженер-дослідник DeepMind Томас Г’юберт, команда спочатку допрацювала модель Gemini від Google, щоб перекласти 1 млн математичних задач з англійської мови на мову програмування Lean. AlphaProof отримала задачі різної складності та мала згенерувати потенційні рішення, а потім перевірити їх. Ті, що спрацювали, повертаються назад до моделі, яка потім вдосконалюється, оскільки намагається розв’язати більше завдань.
У компанії зазначили, що AlphaProof розв’язала три задачі цьогорічної математичної олімпіади – дві з алгебри та одну з теорії чисел. На одну пішло буквально кілька хвилин, тоді як на інші – до трьох днів. Щоправда, учням стільки не дають, у них дві 4,5-годинні сесії для подання відповідей. Проте дві задачі з комбінаторики AI подолати не зміг. Інший учасник команди AI, AlphaGeometry 2, за 19 секунд зміг розв’язати задачу з геометрії.
На жаль, для навчання математичних AI-моделей доступно мало даних, тому команда DeepMind використовувала для навчання AlphaGeometry 2 синтетичні дані, згенеровані безпосередньо AI. Наразі система може вирішити 83% завдань з математичних олімпіад за останні 25 років, тоді як її попередник мав показник у 53%. Загалом AI-системи набрали 28 з 42 балів, що дорівнює “сріблу”. Від “золота” їх відділяв лише 1 бал.
Судді, які перевіряли роботу AI, були здивовані тим, як він знаходив розумні ідеї для розв’язання задачі. “Ми знаходимося на тому етапі, коли ці системи можуть розв’язувати якщо не великі дослідницькі проблеми, то принаймні проблеми, які є дуже складними для найкращих молодих математиків у світі”, – заявив віцепрезидент DeepMind з питань навчання з підкріпленням Девід Сілвер.
Читайте також: