Експерти в галузі кібербезпеки висловлюють занепокоєння, що система заважає будь-яким запитам, що містять терміни кібербезпеки.
Нова модель штучного інтелекту Fable, розроблена компанією Anthropic для безпечного функціонування в сфері кібербезпеки, викликала незадоволення серед фахівців цієї галузі. Експерти зазначають, що накладені компанією обмеження спрацьовують занадто часто, блокуючи навіть безневинні запити, повідомляє TechCrunch.
“(Fable) відхиляє всі запити, які так чи інакше пов’язані з кібербезпекою. Навіть такі нешкідливі завдання, як перегляд допису в блозі”, — написала у соцмережі X дослідниця в сфері безпеки, що працює в IBM X-Force, Валентина “Чомпі” Пальміотті.
Якщо система вважає запит потенційно небезпечним, чат автоматично призупиняється. У такій ситуації користувач отримує сповіщення про те, що механізми безпеки виявили теми, пов’язані з кібербезпекою або біологією.
Обмеження були введені для зменшення ризику використання моделі у створенні шкідливого програмного забезпечення або компрометації систем. Деякі біологічні теми блокуються через побоювання щодо можливого використання ШІ для виготовлення біологічної зброї. Водночас один із фахівців у сфері кібербезпеки зазначив у соцмережі X, що обмеження Fable спрацьовують навіть під час запиту на звичайний огляд програмного коду.
Ветеран кібербезпеки Метт Суїче підтвердив, що прохання написати безпечний код також може бути помилково класифіковане як діяльність у сфері кібербезпеки, внаслідок чого користувача автоматично переводять на модель Claude Opus 4.8. За словами Суїче, система, ймовірно, значною мірою спирається на ключові слова, через що обмеження можуть спрацьовувати на будь-які терміни, пов’язані з лексикою кібербезпеки.
“Але це зрозуміло, оскільки ми все ще на початковому етапі, і вони продовжують адаптувати свої захисні механізми. Я впевнений, що з часом вони будуть вдосконалюватися, оскільки Anthropic та інші провідні компанії-розробники моделей будуть тісніше співпрацювати з новим поколінням компаній у сфері кібербезпеки”, — додав експерт, який наразі працює в стартапі з кібербезпеки ШІ Tolmo.
Спеціалізовану модель кібербезпеки Mythos, на основі якої створено Fable, Anthropic представила у квітні в рамках програми Project Glasswing. Спочатку доступ до неї отримала обмежена кількість компаній та організацій для захисту критично важливого програмного забезпечення та інфраструктури. Як повідомляє TechCrunch, минулого тижня компанія розширила програму на сотні організацій у 15 країнах.