Некомерційна організація LAION повідомила про запуск проєкту Open Empathic – відкритої платформи для розробки моделі штучного інтелекту з розпізнаванням людських емоцій. До створення масиву навчальних даних залучили добровольців.
Організація LAION (Large-scale Artificial Intelligence Open Network) розпочала роботу на початку 2021 року. Її заснував німецький шкільний учитель Крістоф Шуман за сприяння однодумців із сервера Discord для ентузіастів у галузі ШІ. LAION існує за рахунок пожертвувань, державних дослідницьких грантів, а також галузевих партнерських проєктів, як-от стартап Hugging Face і компанія Stable Diffusion. Останньою вона створювала масив даних для навчання генеративного ШІ – із зображеннями та їхніми текстовими описами.
Метою проєкту Open Empathic є створення ШІ, який розуміє не тільки слова людини. “Ми прагнемо, щоб він уловлював нюанси виразів і зміни інтонації, що зробить взаємодію людини зі ШІ більш автентичною та емпатичною”, – пояснив пан Шуман.
На початковому етапі проєкту в LAION запустили сайт, на якому добровольцям пропонується складати описи до відеозаписів на YouTube. На цих роликах зазвичай демонструється мовлення однієї людини – частина відео підібрана командою LAION, а деякі пропонують добровольці. За кожним кліпом заповнюється список полів: розшифровка тексту, опис зображення і звуку, вік, стать і мовний акцент героя відео, рівень емоційного збудження, психологічний вектор (“задоволення” або “невдоволення”). Є й технічні поля, в яких пропонується вказати якість звуку та наявність або відсутність сторонніх шумів. Але основна увага приділяється емоційній стороні.
Добровольці обирають відповідні до відео емоції з готового переліку у випадаючому списку. Автори проєкту Open Empathic кажуть, що цей механізм допоможе створити велику базу емоційних анотацій з урахуванням різних мов і культур. Після надсилання звіту доброволець може повторити процес – кількість кліпів для учасника проєкту не обмежується. Найближчим часом LAION передбачає зібрати базу з 10 тис. записів, щоб до наступного року її обсяг становив за оптимістичного сценарію від 100 тис. до 1 млн.
Деякі правозахисні організації раніше закликали до повної заборони на розробку і застосування систем розпізнавання емоцій – відповідна норма є і в європейському “Законі про ШІ”, і вона не допускає впровадження таких технологій правоохоронними органами, прикордонниками, на робочих місцях і в школах. Від подібних проєктів перед обличчям невдоволення громадськості раніше відмовилися деякі компанії, включно з Microsoft. Але в LAION упевнені, що відкритий характер проєкту дає їм моральне право продовжувати роботу над Open Empathic – як приклад наводять підтримувану силами спільноти Вікіпедію.
Читайте також:
- Samsung натякнула на нові функції камери зі ШІ в серії Galaxy S24
- Остання пісня The Beatles, створена за допомогою ШІ, вийде 2 листопада