Якщо у вас були сумніви щодо того, що контент, який ви публікуєте в Інтернеті, рано чи пізно потрапить до моделей штучного інтелекту, то тепер варто ознайомитися з оновленою політикою конфіденційності Google і впевнитися, що так воно і буде. У документі чітко зазначено, що компанія залишає за собою право збирати та аналізувати практично все, чим люди діляться в Інтернеті, щоб навчати свої системи штучного інтелекту.
Оновлення, яке зробила компанія Google, внесло нові формулювання у політику конфіденційності. Раніше в ній зазначалося, що дані людей використовуватимуться для навчання “мовних” моделей, але згадувався лише Google Translate. В оновленій версії це формулювання замінено на “моделі штучного інтелекту”, зокрема, згадуються Bard і Cloud AI поряд із Перекладачем.
Одне з багатьох спірних питань щодо систем генеративного ШІ, таких як ChatGPT і Bard, полягає в тому, як вони збирають і використовують дані. Це, звісно, може бути загальнодоступна інформація, але це не означає відсутність проблеми плагіату і проблеми з конфіденційністю, не кажучи вже про те, що ШІ може неправильно інтерпретувати сказане або пропонувати застарілі відповіді. Навіть компанія Google попередила своїх співробітників бути обережними при використанні чат-ботів, включно з Bard, оскільки вони можуть робити небажані пропозиції щодо коду.
Існує також питання, чи є такий вид збирання даних законним. Автор ChatGPT, компанія OpenAI вже зіткнулася з судовими позовами через звинувачення в тому, що вона незаконно збирала особисту інформацію інтернет-користувачів і використовувала ці дані для створення чи покращення своїх продуктів.
OpenAI також має справу з позовом про порушення авторських прав і конфіденційності, пов’язаним з тим, що компанія без дозволу використовувала книги, захищені авторським правом, для навчання своїх систем ШІ. Компанія нібито незаконно копіювала текст з цих видань, не отримавши згоди від правовласників, не вказавши їхні авторські права або не виплативши їм компенсацію.
Збирання даних, схоже, є особливо дратівливою темою для Ілона Маска. На вихідних Twitter тимчасово обмежив кількість твітів, які акаунти можуть читати в день, щоб нібито розв’язати проблему збирання даних у великих масштабах і “маніпуляцій з системою” на платформі – хоча не всі вірять, що саме це було причиною для обмеження. Reddit також зіткнувся з безліччю неприємностей після того, як вимкнув вільний доступ до своїх API, щоб зупинити збір даних.
Читайте також: