OpenAI запустила GPT-5: що вміє нова модель ШІ

Компанія OpenAI запустила GPT-5, свою нову флагманську модель штучного інтелекту, яка стане основою наступного покоління ChatGPT. Реліз відбувся у четвер, 7 серпня, і це перша «уніфікована» ШІ-модель OpenAI, яка поєднує в собі потужні аналітичні здібності попередніх моделей серії «о» зі швидкістю відповідей серії GPT.

Від «розумних відповідей» до виконання завдань

Якщо GPT-4 дозволяв чат-ботам давати розумні відповіді на широкий спектр питань, то GPT-5 дає ChatGPT можливість виконувати безліч завдань від імені користувачів. Серед них — генерування програмних застосунків, навігація в календарі користувача або створення аналітичних звітів.

OpenAI також прагнула зробити ChatGPT простішим у використанні з GPT-5. Замість того, щоб просити користувачів вибирати потрібні налаштування, GPT-5 оснащений маршрутизатором реального часу, який сам вирішує, як надати найкращу відповідь: чи швидко відреагувати на запитання, чи витратити додатковий час на «роздуми» над відповіддю.

Амбіції Сема Альтмана

Під час брифінгу для журналістів генеральний директор OpenAI Сем Альтман заявив, що це значний крок на шляху компанії до розробки ШІ, який зможе перевершити людину у більшості робіт, що приносять економічну користь, тобто до створення штучного загального інтелекту (AGI), повідомляє TechCrunch.

«Мати щось подібне до GPT-5 було б практично неможливо у будь-який попередній період історії», — сказав Альтман.

З четверга GPT-5 доступний усім безкоштовним користувачам ChatGPT як модель за замовчуванням. Віце-президент OpenAI з ChatGPT Нік Терлі зазначив, що це частина зусиль компанії, щоб вперше надати безкоштовним користувачам доступ до моделі ШІ з розширеними можливостями мислення. Раніше такі просунуті моделі були доступні лише за платною підпискою.

Високі очікування

Очікування від GPT-5 дуже високі, адже це один з найочікуваніших продуктів OpenAI з моменту запуску ChatGPT у 2022 році, який зробив компанію відомою. З того часу ChatGPT став одним з найпопулярніших споживчих продуктів у світі, щотижня досягаючи понад 700 мільйонів користувачів — майже 10% населення планети, за даними компанії.

Багато хто розглядає GPT-5 як індикатор прогресу ШІ загалом, і його сприйняття в Кремнієвій долині може мати глибокі наслідки для великих технологічних компаній, Волл-стріт та політиків, що регулюють технології.

Порівняння з конкурентами

OpenAI стверджує, що GPT-5 є передовою моделлю в кількох галузях, трохи випереджаючи провідні моделі ШІ від Anthropic, Google DeepMind та xAI Ілона Маска за ключовими показниками. Однак у деяких інших сферах GPT-5 трохи поступається іншим передовим ШІ-моделям.

Компанія заявляє, що GPT-5 забезпечує передовий рівень продуктивності у програмуванні. Альтман сказав, що модель особливо відзначається в швидкому розгортанні цілих програмних додатків на вимогу, що стало відомим як «вайб-кодинг».

На тесті SWE-bench Verified (випробування реальних завдань програмування з GitHub) GPT-5 набрав 74,9% з першої спроби. Це лише трохи перевершує останню модель Anthropic Claude Opus 4.1 (74,5%) та Google DeepMind Gemini 2.5 Pro (59,6%).

На Humanity's Last Exam (складний тест, що вимірює продуктивність ШІ-моделей у математиці, гуманітарних та природничих науках) версія GPT-5 з розширеними можливостями мислення (GPT-5 Pro) набрала 42% при використанні інструментів. Це трохи менше, ніж вдалося досягти xAI з Grok 4 Heavy, яка набрала 44,4% на цьому тесті.

На GPQA Diamond (тест з наукових питань рівня PhD) GPT-5 Pro набрав 89,4% з першої спроби, випередивши Claude Opus 4.1 (80,9%) та Grok 4 Heavy (88,9%).

OpenAI заявляє, що GPT-5 краще підходить для відповідей на питання, пов'язані зі здоров'ям. На тесті, що вимірює точність відповідей ШІ-моделей на медичні теми (HealthBench Hard Hallucinations), OpenAI стверджує, що GPT-5 (з функцією «мислення») «галюцинує» лише у 1,6% випадків. Це значно нижче, ніж у попередніх моделей компанії GPT-4o (12,9%) та o3 (15,8%).

Хоча чат-боти ШІ не є медичними працівниками, мільйони людей використовують їх для отримання порад щодо здоров'я. У відповідь на це явище компанія заявляє, що GPT-5 більш проактивно позначає потенційні проблеми зі здоров'ям та допомагає користувачам розбиратися в медичних результатах.

Крім того, OpenAI стверджує, що GPT-5 перевершує інші ШІ-моделі в складніших для вимірювання, суб'єктивних сферах, таких як креативний дизайн та письмо. Терлі зазначив, що GPT-5 відповідає більш природно та демонструє «кращий смак» порівняно з іншими моделями ШІ у творчих завданнях.

«Відчуття від цієї моделі дійсно дуже хороші», — сказав Терлі.

Зменшення «галюцинацій» та покращення безпеки

GPT-5 також точніший за попередні моделі OpenAI, і компанія заявляє, що він значно менше страждає від «галюцинацій» — схильності ШІ-моделей вигадувати інформацію — порівняно з моделями серії «о».

Раніше «галюцинації» здавалося погіршувалися в останніх моделях ШІ-мислення OpenAI, таких як o3, і OpenAI раніше заявляла, що не зовсім розуміє, чому це відбувається.

У відповідях на запити ChatGPT, OpenAI виявила, що GPT-5 (з функцією «мислення») «галюцинує» та відповідає невірною інформацією у 4,8% випадків. Це значне зниження порівняно з o3 (22%) та GPT-4o (20,6%) на тому ж тесті.

На тесті Tau-bench, що вимірює здатність ШІ-моделі як агента виконувати симульовані онлайн-завдання, GPT-5 демонструє неоднозначну продуктивність.

У частині тесту, що вимірює здатність ШІ орієнтуватися на веб-сайті авіакомпанії, GPT-5 набрав 63,5%, трохи поступившись o3 (64,8%). В іншій частині тесту, що перевіряє здатність ШІ орієнтуватися на сайтах роздрібної торгівлі, GPT-5 набрав 81,1%, поступившись Claude Opus 4.1, який отримав 82,4%.

OpenAI також заявляє, що GPT-5 безпечніший за попередні моделі. Хоча моделі ШІ-мислення іноді виявляють схильність до змови проти людей або брехні для досягнення власних цілей, OpenAI виявила, що GPT-5 був обманливим на нижчому рівні, ніж інші моделі.

Алекс Бойтел, керівник відділу досліджень безпеки OpenAI, заявив, що GPT-5 краще розрізняє запити, які намагаються зловживати ChatGPT, та користувачів, які роблять нешкідливі запити.

Це призводить до того, що GPT-5 може відмовляти у більшій кількості небезпечних запитань, пропонуючи менше відмов користувачам, які шукають нешкідливу інформацію.

Оновлення для користувачів та розробників

ChatGPT отримує кілька оновлень користувацького досвіду в рамках запуску GPT-5. Тепер користувачі можуть вибирати з чотирьох нових «особистостей» у налаштуваннях ChatGPT: «Цинік», «Робот», «Слухач» та «Ботан».

За словами компанії, ці режими змінюватимуть стиль відповідей ChatGPT без потреби окремо просити модель відповідати певним чином.

Передплатники плану ChatGPT Plus ($20 на місяць) отримають вищі ліміти використання GPT-5, ніж безкоштовні користувачі. Водночас передплатники плану Pro ($200 на місяць) матимуть необмежений доступ до GPT-5, а також до «прокачаної» версії під назвою GPT-5 Pro, яка використовує додаткові обчислювальні ресурси для надання кращих відповідей.

Організації з планами OpenAI Team, Edu та Enterprise отримають доступ до GPT-5 як своєї моделі за замовчуванням наступного тижня.

Для розробників GPT-5 буде доступний в API OpenAI у трьох варіантах — gpt-5, gpt-5-mini та gpt-5-nano — які витрачатимуть більше або менше часу на «мислення» над завданнями. Розробники також тепер можуть контролювати «багатослівність» в API OpenAI, вирішуючи, наскільки довгими або короткими мають бути відповіді моделі ШІ.

Базова модель GPT-5 коштуватиме розробникам $1,25 за мільйон вхідних токенів (приблизно 750 000 слів, довше, ніж вся серія «Володар кілець») та $10 за мільйон вихідних токенів.

Джерело

Google