Anthropic знайшла компроміс для випуску свого скандального AI

Інструмент для хакерства на базі AI від Anthropic, який вважався занадто небезпечним для широкого загалу, все ж з’явиться у доступі, хоч і в дещо зміненому форматі. Claude Fable 5 став найбільш технологічним та потужним інструментом компанії Anthropic серед усіх, що коли-небудь пропонувалися масовому користувачу, проте виявляти вразливості нульового дня у програмному забезпеченні він не буде.

Щоб дізнатись останні новини, слідкуйте за нашим каналом Google News онлайн або через застосунок.

Напевно, до сьогоднішнього дня практично кожен користувач хоча б раз бачив демонстрацію можливостей AI, яка викликала легке відчуття дискомфорту через думку про те, що це не просто виконано якісно, а лякаюче бездоганно. Незалежно від того, чи йдеться про витіснення художників із їхніх робочих місць штучним інтелектом, чи про створення абсолютно нових доказів для складних математичних загадок, людство регулярно відкриває нові сфери, де комп’ютерні системи демонструють настільки разючі результати, що це починає здаватися навіть тривожним через їхню надмірну могутність.

Читайте також: AERONAUT – про все, що літає вище землі: авіація, БПЛА та дрони, ракети та космос

Зокрема, нещодавно розробники з Anthropic відкрито висловлювали свої побоювання щодо випуску найсвіжішої модифікації Claude Mythos, яка виявилася занадто ефективною у сфері виявлення слабких місць у програмному коді. Проте саме сьогодні Anthropic починає робити реальні кроки для втілення цього релізу в життя.

Сам по собі процес автоматизованого пошуку програмних помилок не є чимось кардинально новим, адже фахівці з комп’ютерних наук уже протягом тривалого часу використовують такі інструменти, як фазери. Робота цих інструментів полягає у засипанні програмного забезпечення величезними обсягами випадкових вхідних даних у надії спровокувати системний збій. Проте AI-технології несуть у собі значно серйознішу загрозу, і в міру того, як системи для пошуку вразливостей на кшталт Mythos розвивалися та ставали досконалішими, їхні автори відчували цілком обґрунтовану тривогу щодо надання вільного доступу до своїх найсильніших розробок.

Замість того щоб приректи власні технологічні досягнення на вічне перебування на полицях без діла, Anthropic сьогодні демонструє компромісний варіант, який дозволить розгортати можливості Mythos безпечно та з високою відповідальністю. Суть цього компромісу полягає у розділенні розробки на дві окремі незалежні моделі, які отримали назви Claude Fable 5 та Claude Mythos 5.

Модель Fable 5 орієнтована на широку аудиторію та являє собою повнофункціональний інструмент для виконання різноманітних аналітичних завдань. Її сфера застосування зовсім не обмежується лише пошуком дефектів у захисті програм – Fable 5 здатна надавати суттєву допомогу під час написання коду, володіє високоефективними інструментами для візуального аналізу, а також може самостійно вибудовувати внутрішні довгострокові стратегії. Як зазначає Anthropic, потенціал Fable 5 суттєво перевершує параметри будь-якої іншої моделі, яку компанія коли-небудь випускала у загальний доступ.

Проте Anthropic випускає цей продукт із певними обмеженнями та застереженнями. Конфігурація Fable 5 створена так, щоб успішно протидіяти будь-яким спробам застосувати її для виявлення новітніх експлойтів нульового дня, якими могли б скористатися зловмисники задля створення хаосу в глобальних комп’ютерних мережах. У ситуаціях, коли користувач намагатиметься змусити Fable 5 вийти за межі дозволених рамок, модель автоматично переспрямовуватиме запит і повертатиметься до роботи на базі Claude Opus 4.8.

Читачам також пропонується долучитися до обговорення, висловити власну думку в коментарях під матеріалом та поділитися враженнями від почутого, ставши першими, хто залишить свій відгук.

З іншого боку, існує модель Mythos 5, яка за своєю внутрішньою архітектурою є точним аналогом Fable 5, проте позбавлена більшої частини згаданих захисних бар’єрів. Головна особливість полягає в тому, що Anthropic планує поширювати її за надзвичайно суворим та вибірковим принципом, надаючи доступ лише перевіреним і надійним представникам спільноти дослідників кібербезпеки. Для того щоб випереджати дії зловмисників, критично важливо використовувати подібні інструменти саме для знаходження та подальшого усунення помилок, і запропонована схема покликана мінімізувати ймовірність того, що потенціал Mythos 5 буде спрямовано на зловмисну діяльність.

Спеціально для цього Anthropic створила комплекс так званих класифікаторів, завдання яких полягає в розпізнаванні намірів користувачів під час взаємодії з Fable 5. Ці алгоритми розроблені не лише для того, щоб блокувати хакерські дії. Вони також покликані не допустити використання моделі для проектування методів синтезу небезпечних хімічних речовин або біологічних сполук, а також для вилучення достатньої кількості внутрішніх даних, які дозволили б комусь створити власну версію Fable 5, але вже без інтегрованих систем безпеки.

Залишається сподіватися, що вжитих заходів виявиться достатньо для безпечного функціонування цього публічного релізу, створеного на базі Mythos, оскільки очевидно, що величезна кількість людей докладатиме максимум зусиль, намагаючись обійти обмеження та розкрити повний спектр можливостей системи.

Читайте також:

Джерелоandroidauthority

Підписатися

0 Comments

Найновіше

НайстарішіНайбільше голосів

Інші статті

Занадто небезпечний для публіки: Anthropic знайшла компроміс для випуску свого скандального AI

Останні коментарі