У вівторок компанія Meta AI оголосила про розробку CICERO, який, як вона стверджує, є першим штучним інтелектом (ШІ), який досяг рівня людини в стратегічній настільній грі Дипломатія (Diplomacy). Це значне досягнення, оскільки гра вимагає глибоких навичок ведення міжособистісних переговорів, а це означає, що CICERO отримав певне володіння мовленням, необхідне для перемоги в грі.
В Дипломатії велика частина ігрового процесу включає соціальні навички. Гравці повинні виявляти співчуття, використовувати природну мову та будувати стосунки, щоб виграти — важке завдання для комп’ютерного гравця. Розуміючи це, Meta запитала: «Чи можемо ми створити більш ефективних і гнучких агентів, які можуть використовувати мову для переговорів, переконання та роботи з людьми для досягнення стратегічних цілей, подібних до того, як це роблять люди?»
За словами Meta, відповідь – позитивна. CICERO набув навичок, граючи в онлайн-версію Дипломатії на webDiplomacy.net. Згодом він став майстром у грі, як повідомляється, досягнувши «більш ніж удвічі середнього результату» гравців-людей і потрапивши до 10% найкращих людей, які грали більше однієї гри.
Щоб створити CICERO, Meta об’єднала моделі ШІ для стратегічного мислення і обробки природної мови і об’єднала їх в одному агенті. Під час кожної гри CICERO дивиться на стан ігрового поля та історію розмов і передбачає, як діятимуть інші гравці. Він створює план, який виконує за допомогою мовної моделі, яка може генерувати людський діалог, що дозволяє йому координувати дії з іншими гравцями. Меtа називає природні мовні навички CICERO «контрольованою моделлю діалогу», де лежить суть особистості Cicero.
Отримана модель освоїла тонкощі складної гри. «CICERO може зробити висновок, наприклад, що пізніше в грі йому знадобиться підтримка одного конкретного гравця, — каже Меtа, — а потім розробити стратегію, щоб завоювати прихильність цієї людини, і навіть визнати ризики та можливості, які бачить цей гравець з його конкретної точки зору».
Дослідження Меta CICERO опубліковане в журналі Science під назвою «Гра на людському рівні в грі дипломатії шляхом поєднання мовних моделей зі стратегічним міркуванням».
Що стосується ширших застосувань, Meta припускає, що її дослідження CICERO можуть «послабити комунікаційні бар’єри» між людьми та штучним інтелектом, наприклад, підтримувати тривалу розмову, щоб навчати когось нових навичок. Або це може створити відеогру, у якій NPC можуть розмовляти як люди, розуміючи мотивацію гравця та адаптуючись попутно.
Водночас цю технологію можна використовувати для маніпулювання людьми, видаючи себе за інших і обманюючи їх потенційно небезпечними способами, залежно від контексту. Відповідно до цього, Meta сподівається, що інші дослідники зможуть побудувати свій код «відповідальним чином», і каже, що вжила заходів для виявлення та видалення «токсичних повідомлень у цьому новому домені».
Meta надала детальний сайт, щоб пояснити, як працює CICERO, а також має відкритий код CICERO на GitHub. Шанувальникам онлайн-дипломатії — і може навіть усім нам — можливо, варто бути обережними.
Ви можете допомогти Україні боротися з російськими окупантами. Найкращий спосіб зробити це – пожертвувати кошти Збройним Силам України через Savelife або через офіційну сторінку НБУ.
Читайте також:
- Meta пропонує безоплатні купони на рекламу для українців
- Користувачі Twitter закенселили нову систему штучного інтелекту від Meta