Нова система захисту автоматично перенаправляє ризиковані запити на Opus 4.8.
Компанія Anthropic оголосила про вихід двох нових моделей штучного інтелекту — Claude Fable 5 та Claude Mythos 5. Згідно з інформацією розробників, ці моделі перевершують усі попередні версії Claude за ефективністю у програмуванні, наукових дослідженнях, обробці даних та комп’ютерному зорі.
Claude Fable 5 компанія вважає першою загальнодоступною системою класу Mythos. За словами розробників, нова модель демонструє найкращі результати на майже всіх внутрішніх та зовнішніх тестах можливостей штучного інтелекту, особливо у складних і тривалих завданнях. Водночас, через підвищені ризики зловживань, компанія запровадила нові механізми безпеки, які обмежують використання найпотужніших функцій моделей у чутливих сферах.
Одночасно компанія представила Claude Mythos 5 — версію тієї ж базової моделі з частково знятими обмеженнями безпеки. Наразі вона доступна лише обмеженому колу партнерів у рамках програми Project Glasswing, що реалізується у співпраці з урядом США.
Результати тестувань Claude Fable 5
У Anthropic підкреслюють, що нові моделі мають значно розширені можливості автономної роботи. Зокрема, під час тестування платіжна компанія Stripe повідомила, що Fable 5 виконала масштабну міграцію 50-мільйонної кодової бази Ruby за один день, тоді як команді інженерів на таку роботу знадобилося б понад два місяці.
Модель також показала високі результати в аналітичних завданнях. На фінансовому бенчмарку Hebbia’s вона отримала найкращий результат серед усіх протестованих моделей, продемонструвавши сильні навички роботи з документами, таблицями, діаграмами та складними розрахунками.
Окремо в компанії відзначають прогрес у сфері комп’ютерного зору. Claude Fable 5 здатна аналізувати складні наукові зображення, витягувати з них точні дані та навіть відтворювати вихідний код вебзастосунків лише на основі скриншотів інтерфейсу. Під час одного з тестів модель самостійно пройшла гру Pokémon FireRed, використовуючи лише візуальну інформацію без додаткових інструментів навігації.
Розробники також повідомляють про суттєві покращення пам’яті та роботи з довгим контекстом. Fable 5 може ефективно працювати з мільйонами токенів та використовувати власні нотатки для підвищення результативності під час тривалих завдань. У грі Slay the Spire підключення постійної файлової пам’яті втричі покращило продуктивність моделі в порівнянні з Opus 4.8, а фіналу вона досягала втричі частіше.
Anthropic також зазначає, що Fable 5 ефективніше за попередні моделі Claude використовує токени. В оцінці Cognition FrontierCode, яка перевіряє, чи можуть моделі виконувати складні завдання з кодування, відповідаючи стандартам високоякісних виробничих кодових баз, Claude Fable 5 отримала найвищий бал серед конкурентів, продемонструвавши цей результат навіть за середнього рівня зусиль.
Результати тестувань Claude Mythos 5
Claude Mythos 5 продемонструвала найбільш помітні результати в біологічних дослідженнях. За даними Anthropic, внутрішні фахівці з проєктування білків змогли прискорити окремі етапи розробки ліків приблизно у десять разів. У низці тестів модель самостійно виконувала завдання, які зазвичай виконують дослідники, включаючи вибір місць зв’язування білків, запуск інструментів біоінформатики та виправлення помилок у процесі роботи.
Крім того, компанія стверджує, що Mythos 5 стала першою моделлю Anthropic, яка стабільно генерує нові наукові гіпотези. Під час сліпих порівнянь науковці віддавали перевагу її пропозиціям у галузі молекулярної біології приблизно у 80% випадків.
Високі результати Mythos 5 демонструє і під час геномних досліджень. За тиждень переважно автономної роботи Mythos 5 проаналізував мільйони клітин 138 видів тварин та навчив власну ШІ-модель ідентифікувати клітини зі схожими функціями у різних організмах. Діючи за загальними вказівками людини, модель перевершила нещодавно опублікований у журналі Science аналог.
Нові заходи безпеки Anthropic
У зв’язку з потенційними ризиками компанія запровадила нову систему захисту. Якщо користувач надсилає запит, пов’язаний із кібербезпекою, біологією, хімією або спробами дистиляції моделей, спеціальні класифікатори автоматично перенаправляють його для обробки менш потужній моделі Claude Opus 4.8. За даними Anthropic, такі механізми спрацьовують менш ніж у 5% сеансів.
У компанії пояснюють, що моделі класу Mythos вже досягли рівня, за якого їхні можливості можуть бути використані для проведення складних кібератак або прискорення небезпечних досліджень подвійного призначення. Саме тому захисні механізми налаштували максимально консервативно.
Також Anthropic запроваджує нову політику зберігання даних. Для моделей рівня Fable 5 і Mythos 5 запроваджується обов’язкове 30-денне зберігання трафіку на всіх платформах для захисту від складних кібератак та зменшення помилкових спрацьовувань. Ці дані не використовуватимуться для навчання Claude, а доступ до них реєструватиметься з гарантованим видаленням після закінчення місячного терміну.
Доступність Claude Fable 5
Claude Fable 5 вже доступна через API та для користувачів планів Pro, Max, Team і Enterprise. До 22 червня модель можна використовувати без додаткової плати в межах підписки. Після цього доступ до неї тимчасово переведуть на систему кредитів використання, поки компанія не збільшить обчислювальні потужності.
Вартість обох моделей становить 10 доларів за мільйон вхідних токенів і 50 доларів за мільйон вихідних токенів. За словами Anthropic, це менше ніж половина вартості Claude Mythos Preview.
Нещодавно Anthropic залучила 65 мільярдів доларів у новому раунді фінансування, завдяки чому її ринкова оцінка сягнула 900 мільярдів доларів. Це дозволило стартапу випередити конкурента OpenAI з його показником у 730 мільярдів доларів та стати найдорожчою ШІ-компанією у світі.