Grok 4.20 анонсував Ілон Маск — модель може очолити SimpleBench вже цього місяця — новини технологій

Grok 4.20 анонсував Ілон Маск — модель може очолити SimpleBench вже цього місяця — новини технологій 1 За словами Маска, нова модель має всі шанси стати лідером серед ШІ вже цього місяця.

Американський підприємець Ілон Маск оголосив про вихід версії Grok 4.20, яка, за його прогнозами, посяде перше місце в бенчмарку SimpleBench до кінця серпня. Маск зробив цю заяву у коментарі на платформі X, реагуючи на повідомлення користувача, що помітив високі позиції Grok 4.

Згідно з цим повідомленням, у SimpleBench модель Grok 4 вже обходить нову GPT-5 і поступається лише Gemini 2.5 Pro. Користувач XFreeze також підкреслив, що компанія xAI досягає цих результатів, маючи менше ніж 30% персоналу порівняно з OpenAI та .

Крім SimpleBench, Grok 4 демонструє кращі результати за GPT-5 у бенчмарках ARC-AGI – 68% проти 65%, та ARC-AGI-2 – 16% проти 9,9%. Також Grok 4 Heavy трохи випереджає GPT-5 Pro у Humanity’s Last Exam – 44,4% проти 42%. Маск зазначив, що xAI постійно оновлює Grok 4 Heavy, покращуючи його продуктивність.

Поки незрозуміло, що саме має на увазі Маск під версією Grok 4.20. Згідно з планами xAI на 2025 рік, крім Grok 4.20 очікується випуск Grok 4 Coder, оптимізованого для програмування, Grok 4 V2 з покращеними мультимодальними можливостями та Baby Grok – ШІ для дітей. Також заплановано вихід нових покращених версій для генерації зображень і відео. А вихід Grok 5 заплановано вже до кінця 2025 року. У коментарях на X користувачі та експерти вражені швидкістю оновлень і розвитком Grok.

Хоча Grok 4 обходить GPT-5 в деяких бенчмарках, відомо, що штучний інтелект від OpenAI – модель o3, здобув перемогу над Grok 4 у фіналі шахового турніру. Попри те, що Grok 4 вважався переможцем під час попередніх етапів, він припустився серії грубих помилок, що дозволило моделі-конкуренту здобути впевнену перемогу.

Цей веб-сайт використовує файли cookie, щоб покращити ваш досвід. Ми припустимо, що ви з цим згодні, але ви можете відмовитися, якщо хочете. Прийняти Детальніше

Політика конфіденційності