Вчені Массачусетського технологічного інституту випустили потужну модель штучного інтелекту з відкритим вихідним кодом під назвою Boltz-1, яка може значно прискорити біомедичні дослідження та розробку ліків.
Щоб дізнатись останні новини, слідкуйте за нашим каналом Google News онлайн або через застосунок.
Розроблена групою дослідників з клініки MIT Jameel Clinic for Machine Learning in Health, Boltz-1 є першою повністю відкритою моделлю, яка досягає найсучаснішої продуктивності на рівні AlphaFold3, моделі від Google DeepMind, що прогнозує тривимірні структури білків та інших біологічних молекул.
Провідними розробниками Boltz-1 були аспіранти Массачусетського технологічного інституту Джеремі Волвенд і Габріеле Корсо, а також співробітник дослідницької клініки MIT Jameel Clinic Саро Пассаро і професори електротехніки та інформатики Массачусетського технологічного інституту Регіна Барзілай і Томмі Яаккола. Вольвенд і Корсо представили модель на заході 5 грудня в Stata Center Массачусетського технологічного інституту, де вони заявили, що їхня кінцева мета – сприяти глобальній співпраці, прискорити відкриття і забезпечити надійну платформу для розвитку біомолекулярного моделювання.
«Ми сподіваємося, що це стане відправною точкою для спільноти» – сказав Корсо. «Існує причина, чому ми називаємо його Boltz-1, а не Boltz. Це ще не кінець. Ми хочемо отримати якомога більший внесок від спільноти».
Білки відіграють важливу роль майже у всіх біологічних процесах. Форма білка тісно пов’язана з його функцією, тому розуміння структури білка має вирішальне значення для розробки нових ліків або конструювання нових білків з певними функціональними можливостями. Але через надзвичайно складний процес, за допомогою якого довгий ланцюг амінокислот білка складається у тривимірну структуру, точне передбачення цієї структури було головною проблемою протягом десятиліть.
AlphaFold2 від DeepMind, яка принесла Демісу Хассабісу та Джону Джамперу Нобелівську премію з хімії 2024 року, використовує машинне навчання для швидкого прогнозування 3D-структур білків, які настільки точні, що їх неможливо відрізнити від експериментально отриманих вченими. Ця модель з відкритим вихідним кодом використовується академічними та комерційними дослідницькими групами по всьому світу, стимулюючи багато досягнень у розробці ліків.
AlphaFold3 покращує свої попередники завдяки включенню генеративної моделі ШІ, відомої як дифузійна модель, яка може краще впоратися з невизначеністю, пов’язаною з прогнозуванням надзвичайно складних білкових структур. Однак, на відміну від AlphaFold2, AlphaFold3 не має повністю відкритого вихідного коду і не доступний для комерційного використання, що викликало критику з боку наукової спільноти та дало старт глобальній гонці за створення комерційно доступної версії моделі.
У своїй роботі над Boltz-1 дослідники з MIT використовували той самий початковий підхід, що і в AlphaFold3, але після вивчення базової моделі дифузії вони дослідили потенційні вдосконалення. Вони включили ті, які найбільше підвищили точність моделі, наприклад, нові алгоритми, що підвищують ефективність прогнозування.=
Разом із самою моделлю вони виклали у відкритий доступ весь свій конвеєр для навчання та доопрацювання, щоб інші науковці могли використовувати Boltz-1 у своїх дослідженнях.
«Я безмежно пишаюся Джеремі, Габріеле, Саро та рештою команди клініки Джаміля за те, що вони зробили цей реліз можливим. Цей проєкт зайняв багато днів і ночей роботи з непохитною рішучістю дійти до цього моменту. У нас є багато цікавих ідей щодо подальших удосконалень, і ми з нетерпінням чекаємо можливості поділитися ними в найближчі місяці», – говорить Барзілай.
На розробку Boltz-1 команді MIT знадобилося чотири місяці роботи та багато експериментів. Однією з найбільших проблем було подолання неоднозначності та гетерогенності, що міститься в Банку даних білків – колекції всіх біомолекулярних структур, які тисячі біологів розгадали за останні 70 років.
«Я провів багато довгих ночей, борючись з цими даними. Багато з них є чистими галузевими знаннями, які треба просто здобути. Тут немає коротких шляхів», – каже Вольвенд.
Зрештою, їхні експерименти показують, що Boltz-1 досягає того ж рівня точності, що й AlphaFold3 у різноманітних прогнозах складних біомолекулярних структур.
«Те, чого досягли Джеремі, Габріеле та Саро, не можна назвати чимось надзвичайним. Їхня наполеглива праця над цим проєктом зробила прогнозування біомолекулярних структур більш доступним для широкої спільноти та зробить революцію в молекулярних науках», – говорить Яаккола.
Дослідники планують продовжувати покращувати продуктивність Boltz-1 і скорочувати час, необхідний для прогнозування. Вони також запрошують дослідників спробувати Boltz-1 у їхньому репозиторії GitHub та поспілкуватися з іншими користувачами Boltz-1 на їхньому каналі Slack.
«Ми вважаємо, що попереду ще багато-багато років роботи над вдосконаленням цих моделей. Ми дуже хочемо співпрацювати з іншими та побачити, що спільнота робить з цим інструментом», – додає Вольвенд.
«Boltz-1 буде надзвичайно корисним для моєї лабораторії та всієї спільноти, – додає Джонатан Вайсман, професор біології Массачусетського технологічного інституту і член Інституту біомедичної інженерії Уайтхеда, який не брав участі в дослідженні. «Ми побачимо цілу хвилю відкриттів, які стануть можливими завдяки демократизації цього потужного інструменту». Вайсман додає, що він очікує, що відкритий код Boltz-1 призведе до широкого спектра нових творчих застосувань.
Якщо вам цікаві статті та новини про авіацію та космічну техніку — запрошуємо вас на наш новий проєкт AERONAUT.media.
Читайте також: