Нова модель ШІ від Meta розпізнає будь-які об'єкти на фото

Компанія Meta представила нову модель ШІ під назвою Segment Anything Model (SAM), яка здатна розпізнавати окремі об’єкти на зображеннях і відео, включно з тими, які не зустрічалися їй під час навчання.

Як повідомляється у блозі Meta, SAM – це модель сегментації зображень, яка може реагувати на текстові підказки користувачів, щоб виокремити різни об’єкти на зображенні. Meta вважає цю технологію корисною для розуміння змісту вебсторінок, застосунків доповненої реальності, редагування зображень і сприяння науковим дослідженням шляхом локалізації на відео фрагментів, які, наприклад, потрібно відстежувати.

Meta SAM

Зазвичай, за словами представників Meta, створення точної моделі сегментації “вимагає вузькоспеціалізованої роботи експертів, які мають доступ до інфраструктури навчання ШІ та великих обсягів ретельно законспектованих даних”. За допомогою моделі SAM компанія сподівається “демократизувати” цей процес, зменшивши потребу в спеціалізованій підготовці та досвіді.

На додаток до неї Meta зібрала набір даних, який вона називає SA-1B, що містить 11 млн ліцензованих зображень і 1,1 млрд масок сегментації, створених за допомогою її моделі. Meta зробить інструмент і набір даних моделі доступними для дослідницьких цілей за ліцензією Apache 2.0.

Meta SAM

Код виклали на GitHub. Крім того, Meta створила безкоштовну інтерактивну демо-версію технології, у якій користувачі можуть після завантаження фотографії використовувати функції Hover & Click (виділення об’єктів за допомогою миші), Box (виділення об’єктів у полі вибору) або Everything (автоматична ідентифікація кожного об’єкта на зображенні).

Хоча технологія розпізнавання не є новою, SAM вирізняється здатністю ідентифікувати об’єкти, які були відсутні в навчальному наборі даних, і частково відкритим характером. Як повідомляє Reuters, Марк Цукерберг підкреслив важливість включення генеративного ШІ в застосунки компанії вже цього року. Хоча техногігант ще не випустив комерційні продукти з використанням цього типу ШІ, раніше він вже користувався схожою технологією. Вона працювала у Facebook і “відмічала” людей на фото, визначала шкідливий і заборонений контент, а також підбирала рекомендовані пости у Facebook та Instagram.

Заява Meta з’явилася на тлі жорсткої конкуренції між великими технологічними компаніями за домінування у сфері штучного інтелекту. Мовна модель ChatGPT від OpenAI, яку підтримує Microsoft, стала популярною восени минулого року і досі залишається у центрі уваги, залучаючи хвилю інвестицій.

Читайте також:

Джерелоarstechnica

Підписатися

0 Comments

Найновіше

Найстаріші Найбільше голосів

Зворотній зв'язок в режимі реального часу

Переглянути всі коментарі

Інші статті

Нова модель ШІ від Meta зможе розпізнавати будь-які об’єкти на фото

Останні коментарі