Чат-бот Grok, створений компанією xAI Ілона Маска, очолив грудневий рейтинг надійності штучного інтелекту за 2025 рік. Згідно з дослідженням аналітичної компанії Relum, ця модель продемонструвала найнижчий рівень «галюцинацій», тоді як популярні сервіси від Google та OpenAI показали значно гірші результати, передає «Главком».

Експерти оцінювали десять провідних нейромереж за рівнем ризику для бізнес-завдань. Дослідження виявило, що Grok видає недостовірну інформацію лише у 8% випадків. Натомість ChatGPT від OpenAI демонструє помилковість на рівні 35%, а показник Google Gemini перевищив 40%. Високий рівень хибних відповідей також зафіксували у Microsoft Copilot – 27%.

Серед інших надійних інструментів аналітики виділили китайську нейромережу DeepSeek (14% помилок), пошуковик Perplexity (13%) та Claude (17%). Фахівці Relum наголошують, що точність відповідей є критичним фактором для корпоративного сектору, адже понад 65% компаній у США вже інтегрували штучний інтелект у свої робочі процеси. Очікується, що через зростаючу залежність від технологій бізнес у майбутньому обиратиме моделі, спираючись саме на показники їхньої фактичної точності.

Як повідомлялося, згідно з новим аналізом від фірми Apptopia, що займається аналізом мобільних додатків, зростання мобільного застосунку ChatGPT, ймовірно, досягло свого піка. Аналіз глобальних тенденцій завантажень та щоденної активності користувачів (DAU) свідчить про сповільнення темпів зростання нових користувачів після квітня 2025 року.

До слова, молоді, яка мріє про високооплачувану кар'єру у сфері технологій, варто зосередитись на освоєнні інструментів штучного інтелекту, особливо тих, які допомагають створювати та оптимізувати програмний код. Таку думку висловив мільярдер, співзасновник Scale AI Олександр Ван.

Нагадаємо, в новій версії ChatGPT з'явиться контент для дорослих. Про це повідомив в соцмережі Х генеральний директор OpenAI Сем Альтман.

«Ми зробили ChatGPT досить обмеженим, щоб бути впевненими, що обережно ставимося до питань психічного здоров'я. Ми розуміємо, що це зробило його менш корисним/приємним для багатьох користувачів, які не мали проблем із психічним здоров'ям, але, зважаючи на серйозність питання, ми хотіли зробити все правильно. Тепер, коли нам вдалося пом'якшити серйозні проблеми із психічним здоров'ям і ми маємо нові інструменти, ми зможемо безпечно послабити обмеження в більшості випадків», – йдеться у дописі.