Компанія Meta представила нову модель ШІ під назвою Segment Anything Model (SAM), яка здатна розпізнавати окремі об’єкти на зображеннях і відео, включно з тими, які не зустрічалися їй під час навчання.
Як повідомляється у блозі Meta, SAM – це модель сегментації зображень, яка може реагувати на текстові підказки користувачів, щоб виокремити різни об’єкти на зображенні. Meta вважає цю технологію корисною для розуміння змісту вебсторінок, застосунків доповненої реальності, редагування зображень і сприяння науковим дослідженням шляхом локалізації на відео фрагментів, які, наприклад, потрібно відстежувати.
Зазвичай, за словами представників Meta, створення точної моделі сегментації “вимагає вузькоспеціалізованої роботи експертів, які мають доступ до інфраструктури навчання ШІ та великих обсягів ретельно законспектованих даних”. За допомогою моделі SAM компанія сподівається “демократизувати” цей процес, зменшивши потребу в спеціалізованій підготовці та досвіді.
На додаток до неї Meta зібрала набір даних, який вона називає SA-1B, що містить 11 млн ліцензованих зображень і 1,1 млрд масок сегментації, створених за допомогою її моделі. Meta зробить інструмент і набір даних моделі доступними для дослідницьких цілей за ліцензією Apache 2.0.
Код виклали на GitHub. Крім того, Meta створила безкоштовну інтерактивну демо-версію технології, у якій користувачі можуть після завантаження фотографії використовувати функції Hover & Click (виділення об’єктів за допомогою миші), Box (виділення об’єктів у полі вибору) або Everything (автоматична ідентифікація кожного об’єкта на зображенні).
Хоча технологія розпізнавання не є новою, SAM вирізняється здатністю ідентифікувати об’єкти, які були відсутні в навчальному наборі даних, і частково відкритим характером. Як повідомляє Reuters, Марк Цукерберг підкреслив важливість включення генеративного ШІ в застосунки компанії вже цього року. Хоча техногігант ще не випустив комерційні продукти з використанням цього типу ШІ, раніше він вже користувався схожою технологією. Вона працювала у Facebook і “відмічала” людей на фото, визначала шкідливий і заборонений контент, а також підбирала рекомендовані пости у Facebook та Instagram.
Заява Meta з’явилася на тлі жорсткої конкуренції між великими технологічними компаніями за домінування у сфері штучного інтелекту. Мовна модель ChatGPT від OpenAI, яку підтримує Microsoft, стала популярною восени минулого року і досі залишається у центрі уваги, залучаючи хвилю інвестицій.
Читайте також: