OpenAI презентувала інтелектуальний прорив: нові моделі досягли 88% людського рівня

У рамках акції Shipmas, яка тривала 12 днів, OpenAI оголосила про створення нового покоління мовних моделей – o3 та o3-mini. Ці системи виділяються здатністю «мислити», розбиваючи складні запити на невеликі завдання для досягнення точних результатів. Наразі їх навчання ще не завершено, однак компанія вже відкрила можливість для тестування моделей у дослідницькому середовищі.

Моделі o3 та o3-mini: революція у світі ШІ

Нова модель o3 встановила рекорди у багатьох напрямках. У тесті ARC-AGI, який вимірює рівень інтелекту ШІ у порівнянні з людиною, модель досягла 88%, що більш ніж утричі перевищує результат попередньої версії o1.

У написанні програмного коду o3 продемонструвала підвищення ефективності на 22,8%, згідно з тестом SWE-Bench Verified. Також вона успішно впоралася із завданнями математичного тесту AIME 2024, припустившись лише однієї помилки. У складному бенчмарку GPQA Diamond модель отримала 87,7%, перевершивши результати експертів-людей.

У найскладніших математичних та логічних тестах, які зазвичай є викликом навіть для найкращих ШІ, o3 успішно виконала 25,2% завдань, тоді як попередні моделі досягали лише 2%.

Виклики та ціна інновацій

Однією з ключових особливостей o3 є здатність перевіряти свої відповіді на точність, що мінімізує кількість помилок. Проте цей процес потребує додаткового часу – від кількох секунд до кількох хвилин, залежно від складності запиту. Модель також аналізує запити на відповідність політиці безпеки OpenAI, забезпечуючи високий рівень етичності.

Попри свої переваги, моделі, які здатні «мислити», потребують значно більше обчислювальних ресурсів, що робить їх дорожчими у використанні порівняно зі стандартними системами.

Раніше: МОН і Netpeak Group запускають безплатний курс зі штучного інтелекту.

Вам також може сподобатися

Більше від автора

+ Немає коментарів

Додайте свій