Письменники подали до суду на компанії OpenAI і Microsoft за використання їхніх книг для навчання інтелектуального чат-бота ChatGPT. У позові стверджується, що Microsoft “глибоко залучена” до процесу навчання ChatGPT, тому вона несе повну відповідальність за будь-які порушення поряд з OpenAI.
ChatGPT і аналогічні ШІ, що використовують у своїй основі великі мовні моделі (Large Language Model, LLM), “тренуються” на величезних масивах даних. При цьому OpenAI завантажує значну частину інформації з інтернету, а деякі дані надходять з таких джерел, як нехудожня література. Тому автори таких книжок тепер вимагають компенсації в новому судовому процесі.
За повідомленнями Reuters, автор Джуліан Санктон заявляє, що OpenAI без дозволу скопіювала десятки тисяч нехудожніх книг для навчання ChatGPT. Автор очолює колектив, який подав минулого вівторка позов до федерального суду Мангеттена. У позові заявники зазначають, що “моделі відповідачів були відкалібровані (навчені) шляхом відтворення величезного масиву матеріалів, захищених авторським правом, включно з десятками або навіть сотнями тисяч нон-фікшн книг”.
Позов подано в дуже “вдалий” для OpenAI момент, коли компанія зіткнулася з низкою інших юридичних і внутрішніх проблем. На компанію вже подано інші позови, що стосуються приватних даних, використання авторського контенту. Крім того, минулими вихідними OpenAI зіткнулася з кризою управління, коли рада директорів звільнила генерального директора компанії Сема Альтмана, але потім компанія відмовилася від цього рішення, пообіцявши під тиском співробітників набрати новий склад ради директорів.
Новий позов відрізняється від попередніх заяв тим, що в ньому поряд з OpenAI вперше фігурує технологічний гігант Microsoft, який до того ж є великим інвестором OpenAI. АІ-чат-бот у Microsoft Bing, пошук на основі штучного інтелекту і нова функція Copilot значною мірою спираються на технології OpenAI. Фігурально висловлюючись, це майже що ChatGPT, але зі смаком Microsoft.
Попри те, що OpenАI і Microsoft не коментують цей останній позов, OpenAI раніше заявляла, що контент, генерований ChatGPT, не є “похідним твором” і, отже, не порушує чиїхось авторських прав.
Протягом поточного року стався буквально вибух у розвитку LLM, і багато питань, що зачіпають тему авторських прав, ще не вирішені в судах. Ймовірно, судові позови так ні до чого і не призведуть або змусять змінити порядок виплат авторам контенту, використовуваного під час тренування LLM. Однак, поки що говорити про це дещо передчасно.
Читайте також: