Huawei MateBook X Pro 2020
Root Nation Новини Новини IT Microsoft заявляє, що її ШІ може описувати зображення «так само, як люди»

Microsoft заявляє, що її ШІ може описувати зображення «так само, як люди»

-

Точний опис зображення, а не просто як у нетямущого робота, довгий час був метою штучного інтелекту (ШІ). У 2016 році Google заявила, що її штучний інтелект може підписувати зображення майже так само, як люди, з точністю 94%. Тепер Microsoft заявляє, що пішла ще далі: її дослідники створили систему штучного інтелекту, яка навіть точніша, ніж люди – настільки, що тепер вона знаходиться на вершині таблиці лідерів в тесті Nocaps Image Captioning. Microsoft стверджує, що вона у два рази краще, ніж попередня модель підписів до зображень.

І хоча це само по собі чудова віха, Microsoft не просто залишає цю технологію собі. Тепер вона пропонує нову модель субтитрів як частину когнітивних служб Azure, тому будь-який розробник може використовувати її в своїх застосунках. Вона також доступна вже сьогодні в Seeing AI, застосунку Microsoft для сліпих і слабозорих користувачів, який може розповідати про навколишній світ. А пізніше в цьому році модель субтитрів також поліпшить ваші презентації в PowerPoint для Інтернету, Windows і Mac. Вона також з’явиться в Word і Outlook на настільних платформах.

«Одна з найскладніших проблем в штучному інтелекті, – сказав Ерік Бойд, CVP Azure AI, в інтерв’ю Engadget. – Це не тільки розуміння об’єктів в сцені, а й те, як вони взаємодіють, і як їх описати». Вдосконалені методи створення субтитрів можуть допомогти кожному користувачеві: це спрощує пошук зображень, які вам потрібні в пошукових системах. А для користувачів з ослабленим зором це може значно поліпшити навігацію мережею і програмним забезпеченням.

Microsoft
Сюєдун Хуанг, технічний директор Azure AI Cognitive Services

Немає нічого незвичайного в тому, що компанії рекламують свої дослідницькі інновації в галузі ШІ, але набагато рідше ці відкриття можуть бути швидко використані у продуктах. Сюєдун Хуанг, технічний директор когнітивних служб Azure AI, наполягав на швидкій інтеграції цієї служби в Azure через потенційні переваги для користувачів. Його команда навчила модель зображень, позначеним певними ключовими словами, що допомогло надати їй візуальну мову, якої немає у більшості фреймворків ШІ. Як правило, моделі такого типу навчаються з використанням зображень і повних підписів, що ускладнює моделювання взаємодії між конкретними об’єктами.

Але попри те, що перевершити еталонний тест важливо, справжнім випробуванням для нової моделі Microsoft буде те, як вона працює в реальному світі. За словами Бойда, розробника Seeing AI Сакиба Шайка, який є сліпою людиною та також наполягає на більшій її доступності, описує це як різке поліпшення в порівнянні з попередньою пропозицією. І тепер, коли Microsoft встановила нову віху, буде цікаво подивитися, як  будуть конкурувати моделі від Google і інших дослідників.

Читайте також:

Sourceengadget

LEAVE A REPLY

enter your comment
your name

 

Чим схожі та чим відрізняються iPhone 12, 12 Pro, 12 Pro Max і 12 mini? Інструкція по вибору нового айфона

IPhone 12, найочікуваніший смартфон Apple за останні роки, був представлений у чотирьох різних версіях....

Огляд GameSir F4 Falcon: мобільний геймпад для PUBG. Додай тактильності сенсору!

Так, під геймпадом я маю на увазі невеликий пластиковий тримач для смартфона, з усього...

Огляд Realme 7: смартфон з найкращим співвідношенням “ціна-якість”?

Потрібен якісний, але недорогий смартфон? Realme 7 пропонує безліч цікавих функцій, таких як РК-дисплей...

Репортаж з презентації FSP. Лідер ринку БЖ – (знову) в Україні!

Вже який матеріал я починаю з фрази "Корововірус - корововірусом, але працювати треба"? Не...

Огляд OPPO Reno4 Pro: стильний дизайн, чудовий дисплей та швидка зарядка

Невже смартфон у середньому ціновому діапазоні може мати і чудовий дизайн, і дисплей с...