Google використовуватиме весь контент для навчання ШІ

Якщо у вас були сумніви щодо того, що контент, який ви публікуєте в Інтернеті, рано чи пізно потрапить до моделей штучного інтелекту, то тепер варто ознайомитися з оновленою політикою конфіденційності Google і впевнитися, що так воно і буде. У документі чітко зазначено, що компанія залишає за собою право збирати та аналізувати практично все, чим люди діляться в Інтернеті, щоб навчати свої системи штучного інтелекту.

Оновлення, яке зробила компанія Google, внесло нові формулювання у політику конфіденційності. Раніше в ній зазначалося, що дані людей використовуватимуться для навчання “мовних” моделей, але згадувався лише Google Translate. В оновленій версії це формулювання замінено на “моделі штучного інтелекту”, зокрема, згадуються Bard і Cloud AI поряд із Перекладачем.

Одне з багатьох спірних питань щодо систем генеративного ШІ, таких як ChatGPT і Bard, полягає в тому, як вони збирають і використовують дані. Це, звісно, може бути загальнодоступна інформація, але це не означає відсутність проблеми плагіату і проблеми з конфіденційністю, не кажучи вже про те, що ШІ може неправильно інтерпретувати сказане або пропонувати застарілі відповіді. Навіть компанія Google попередила своїх співробітників бути обережними при використанні чат-ботів, включно з Bard, оскільки вони можуть робити небажані пропозиції щодо коду.

Google оновила політику: тепер ваші дописи використовуватимуть для навчання ШІ

Існує також питання, чи є такий вид збирання даних законним. Автор ChatGPT, компанія OpenAI вже зіткнулася з судовими позовами через звинувачення в тому, що вона незаконно збирала особисту інформацію інтернет-користувачів і використовувала ці дані для створення чи покращення своїх продуктів.

OpenAI також має справу з позовом про порушення авторських прав і конфіденційності, пов’язаним з тим, що компанія без дозволу використовувала книги, захищені авторським правом, для навчання своїх систем ШІ. Компанія нібито незаконно копіювала текст з цих видань, не отримавши згоди від правовласників, не вказавши їхні авторські права або не виплативши їм компенсацію.

Збирання даних, схоже, є особливо дратівливою темою для Ілона Маска. На вихідних Twitter тимчасово обмежив кількість твітів, які акаунти можуть читати в день, щоб нібито розв’язати проблему збирання даних у великих масштабах і “маніпуляцій з системою” на платформі – хоча не всі вірять, що саме це було причиною для обмеження. Reddit також зіткнувся з безліччю неприємностей після того, як вимкнув вільний доступ до своїх API, щоб зупинити збір даних.

Читайте також:

Джерелоtechspot

Підписатися

0 Comments

Найновіше

Найстаріші Найбільше голосів

Зворотній зв'язок в режимі реального часу

Переглянути всі коментарі

Інші статті

Google оновила політику: тепер ваші дописи використовуватимуть для навчання ШІ

Останні коментарі