Root NationСтаттіТехнологіїЯк розпізнати несправжні фотографії: Нові виклики цифрової епохи

Як розпізнати несправжні фотографії: Нові виклики цифрової епохи

-

© ROOT-NATION.com - Використання цього контенту на інших сайтах дозволено лише за умови розміщення зворотного посилання на оригінальну сторінку.

Чи легко можна розпізнати фальшиві фотографії? Повірте, не все так просто у сучасних реаліях.  Це доводить нове дослідження від Microsoft.

Американська корпорація провела масштабне дослідження і делікатно натякнула на те, що ми – сліпі кошенята у світі штучного зору. Виявляється, більшість з нас може правильно визначити де справжнє фото, а де витвір штучного інтелекту лише трохи більш ніж у половині випадків. Тобто, якщо реальність – це гра, то ми вже програли на стадії завантаження.

Щоб не залишити нас у солодкому невіданні, компанія запустила онлайн-вікторину “Real or Not?”. Користувачам дали 15 спроб відгадати: вони дивляться на фотографію чи на плід електронної фантазії. Ні, це не просто розвага в стилі «вгадай мем», а спроба показати – діпфейки вже давно не екзотика, а рутина вашої стрічки.

Real or Not

Паралельно з вікториною провели опитування, в якому взяли участь понад 12,5 тисяч людей з усього світу. Загалом – 287 тисяч індивідуальних рішень, кожне з яких показувало одне: людство, схоже, переграє штучний мозок навіть на початковому рівні складності з середнім результатом 62%. Не вражає, зважаючи на те, що це лише на кілька відсотків краще за банальне вгадування навмання.

Це, м’яко кажучи, не просто дзвіночок – це пожежна сирена. Поки ми самовпевнено вважаємо себе технологічно підкованими, нейромережі вже малюють портрети, які обманюють і професіоналів. І з кожним новим апдейтом ці системи стають менш «штучними» і більш переконливими, ніж будь-який інстаграм-фільтр.

Також цікаво: Нова суперсила OpenAI: Що таке ChatGPT Agent

“Real or Not?” – вікторина, яка викриває ілюзії

Нова вікторина від Microsoft присвячена глибокофейковим зображенням, і ми все ще не здатні їх відрізнити. Старт був невинним: милий песик на сторінці Бреда Сміта в LinkedIn. Здавалося б, класичний понеділковий клікбейт, покликаний зібрати пару сотень лайків і трішки окситоцину. Але ні. Це була візуальна пастка з підказкою.

Real or Not

Знімок чотирилапого, виявляється, не мав нічого спільного з реальністю, крім майстерно згенерованого хутра. Сам Сміт не просто розпочав тиждень з мімішної картинки. Таким чином він запустив рекламну кампанію нової ініціативи Microsoft. Онлайн-вікторини, яка перевіряє, чи зможете ви відрізнити справжнє зображення від глянцевої вигадки штучного інтелекту.

Сама ідея – наче з майбутнього, де правду доводиться доводити. Але суть у тому, що навіть перед обличчям очевидного фейку, ми дивимось, кліпаємо і тиснемо лайк. Бо мозок ще не оновив прошивку під нові правила гри, де зображення більше не гарантує правди. І тепер навіть собака на LinkedIn – потенційна галюцинація з глибини нейронної мережі.

Формула гри виглядає геніально простою: дивишся, клацаєш, переходиш до наступного кадру. Усе як у Тіндері – тільки замість потенційного побачення тобі підсовують потенційний фейк. Але щойно емоції влягаються, більшість учасників виявляють болючу істину: їхня славнозвісна інтуїція – це мильна бульбашка. Особливо коли йдеться про щось невинне, як захід сонця над дахами міста – звичний, стерильний кадр, який, здавалося б, нічого не приховує.

Real or Not

Автори вікторини навмисно не гралися з нами в оптичні ілюзії. У наборі – все як у житті: аматорські знімки впереміш з картинками від Midjourney та DALL·E 3. Без сцен штурму середньовічного Лувру марсіанами чи гіпердетального портрета бабусі з очима як у сови. Просто буденність – місто, природа, портрети, їжа, предмети побуту. Усе те, що ви й так бачите щодня в соцмережах навіть не замислюючись: це реальність чи вже витвір фантазії штучного інтелекту?

Кожен учасник отримував до десятка кадрів, обраних так, щоб покрити всі основні категорії. Алгоритм ретельно слідкував, аби всі мали рівні шанси – жодного фаворитизму, тільки ти і твій внутрішній детектор брехні.

Real or Not

Але, попри це, стандартне відхилення було крихітним: більшість застрягла в коридорі 55–70%. Іншими словами, незалежно від того, чи ти умовний експерт із Photoshop, чи просто людина, яка відрізняє кішку від собаки з другої спроби – твій шанс розпізнати діпфейк не сильно кращий за кидання монети. Жодного «таємного класу просвітлених», що бачать крізь пікселі, не виявлено. Навіть ті, хто щодня «покращує яскравість і контрастність», фейляться на рівних із далеким від технологій Павлом з сусіднього під’їзду.

Також цікаво: Галюцинації AI: що це та в чому небезпека

Портрети даються легко, пейзажі майже як справжні

Здавалося б, обличчя – наша спеціалізація. Еволюція недаремно вклала мільйони років у те, щоб ми зчитували емоції ще до того, як людина відкриє рота. Впізнати страх, агресію чи фальшиву посмішку – це те, що рятувало життя задовго до появи смартфонів. Тому й не дивно, що портрети стали найпростішою категорією у вікторині. Хоча й тут 35% помилок – це не тріумф людства, а радше м’яке фіаско.

А от з пейзажами та міськими панорамами все значно цікавіше – тобто, сумніше. Коли ви дивитесь на фото дрона над засніженим фіордом чи нічне місто з неоновими вивісками, мозок вмикає режим “о, красиво!” і вимикає критичне мислення. Бо перевірити, чи правильно відображено географію Гонконгу вночі, є завданням не з розділу “інтуїція”, а з категорії “має бути щось подібне в Google”. Результат катастрофічний. Більшість людей помиляється. І помиляється не тому, що дурні, а тому, що наш візуальний апарат заточений під виживання в джунглях, а не під розпізнавання фейкових хмарочосів, створених Midjourney.

І хоча зображення можуть бути нереальними, ми бачимо в них “щось знайоме”. А знайоме завжди значить справжнє. Так і працює когнітивна пастка: наше бачення налаштоване на швидкий огляд, а не на мікроскопічну перевірку деталей. Усе, що не кричить про помилку, завжди автоматично проходить крізь фільтр. Тому ми не помічаємо, що вивіска на будівлі написана мовою ельфів, а тіні падають під неправильним кутом.

Подивіться, жодна з цих фотографій не є справжньою, це все творіння штучного інтелекту:

Real or Not

А тепер додайте до цього цейтнот. У вікторині люди тицяли відповіді за 2–3 секунди, як у старій флеш-грі. Коли дослідники дозволили роздивитися кадри трохи довше, до 10 секунд, то точність виросла аж на 8 пунктів. Але хто так дивиться фото в реальному житті? У нас на це є менше часу, ніж на перегляд чужої сторіс. Два свайпи і ти вже експерт із пейзажної фотографії.

І саме з цим рівнем уваги ми з тією ж самовпевненістю ставимо вподобайки, репостимо “світлину з Марсу” і сваримося в сімейному чаті про правдивість фотки з нібито зруйнованої лікарні. Бо ми не перевіряємо, а просто довіряємо очам. А очі, як виявилось, давно вже не головне джерело правди, а навпаки – її найслабше місце.

Також цікаво: Все про чип Neuralink Telepathy: що це таке і як працює

Алгоритми проти людей: хто перемагає?

Дослідники паралельно вирішили піти на експеримент. Якщо людина регулярно фейлиться в розпізнаванні зображень, то нехай машина спробує краще. І випустили в бій свій інструмент на основі гібриду статистичних ознак (DCT, SRM) і семантичних вбудовувань CLIP. Результат – понад 95% точності на тій самій вибірці. Тобто, поки Homo sapiens мружиться на фото заходу сонця і міркує, чи це дійсно Лісабон, нейромережа без емоцій ставить галочку навпроти “фейк” і йде далі.

Але справа не лише в точності. Головна проблема – це підрив самої ідеї автентичності. Якщо кожен кадр є потенційним фейком, рано чи пізно вмикається психологічна оборона: нічому не вірю. А це вже зворотний ефект, бо якщо все “підозріле”, то справжні фото теж летять у смітник разом із діпфейками. І тут ми отримуємо ідеальне середовище для дезінформації, де не потрібно навіть створювати фейк. А достатньо поставити сумнів під усе, що бачимо.

Ось який малий відсоток людей догадалися, що це справжні фото:

Real or Not

Щоб хоч якось повернути довіру, Microsoft, Adobe та з десяток інших компаній намагаються просунути стандарт Content Credentials. Його суть дуже проста: ввести криптографічні підписи і “паспорт редагування” прямо в метаданих файлу. Якщо зображення було створене генеративною моделлю, система автоматично вшиває мітку C2PA, яку соцмережі можуть прочитати й попередити користувача: “Увага, це не фото з iPhone, а фантазія штучного інтелекту».

Інша ідея – цифрові водяні знаки, які вбудовуються глибоко в піксельну структуру, як невидимі татуювання. Вони стійкі до обрізання, фільтрів і легкого редагування. Але знову ж, все тільки у теорії. Бо на практиці стандартів цих водяних міток вже як мінімум десяток, і кожна компанія грає на своєму акордеоні. Один сервіс читає тільки мітки від Adobe, інший – лише від Google, а більшість платформ узагалі ігнорує всі, бо “не на часі”.

У підсумку маємо класичну IT-какофонію: технологія ніби є, але без єдиної мови – це просто набір інструментів, що грають у різних тональностях. І поки індустрія не домовиться, ми й далі будемо жити в реальності, де правда має менше шансів, ніж діпфейк з гарним освітленням і глибоким боке.

Також цікаво: Мережецентрична війна (NCW): Як змінюється війна у XXI столітті

А що далі?

Якщо ви досі щиро вірили, що “треноване око” – це все, що потрібно, аби вирахувати комп’ютерну підробку, то ось вам ложка холодної статистики. Оті самі 62% середньої точності. Тобто два промахи на кожні п’ять спроб. І це не під час перегляду в TikTok між перекусами, а в умовах контрольованого експерименту. В реальному житті все може бути ще гірше. Більше емоцій, менше уваги, і жодного “перепрошую, я роздивлюся ще раз”.

Технології давно вже перетнули межу, за якою реальність є лише ще одним стилем рендеру. Середньостатистичний користувач, озброєний самовпевненістю та допотопною інтуїцією, більше не має шансів. Без допомоги чи то у вигляді алгоритмічного детектора, чи через звичку ставити запитання замість лайків, він стає легкою здобиччю генеративного розуму.

Real or Not

І поки глобальні стандарти маркування контенту не перестануть бути темою для панельних дискусій на конференціях, а стануть чимось банальним і вбудованим, як волога серветка у фастфуді, залишається одне: культура конструктивної недовіри. Не параної, не змови проти правди, а звичайної цифрової обережності. Бо сьогодні правда ще існує, але просто вона більше не “очевидна з першого погляду”.

Тому будьте обережні і уважні в Мережі, бо, можливо, саме зараз ви отримали фото пейзажу, згенерованого штучним інтелектом.

Також цікаво:

Yuri Svitlyk
Yuri Svitlyk
Син Карпатських гір, невизнаний геній математики, "адвокат "Microsoft, практичний альтруїст, лівоправосек
Підписатися
Сповістити про
guest

0 Comments
Найновіше
НайстарішіНайбільше голосів
Підписатися на оновлення
Останні коментарі