Штучний інтелект незабаром замінить фрілансерів? Дослідження показало приголомшливий результат

Штучний інтелект незабаром замінить фрілансерів? Дослідження показало приголомшливий результат
фото з відкритих джерел

Попри прогнози про швидку заміну людей, найкращі системи штучного інтелекту змогли успішно виконати лише 2,5% реальних робочих завдань

Три роки минуло з моменту виходу ChatGPT, але чи готовий він замінити дизайнера, програміста чи аналітика? Дослідження, проведене Scale AI та Центром безпеки ШІ, кидає виклик оптимістичним заявам технологічних гігантів. Науковці протестували ChatGPT, Gemini та Claude на сотнях реальних проєктів із фріланс-платформ, і результати виявилися протверезними. Про це повідомляє «Главком» з посиланням на Washington Post.

Дослідники Remote Labor Index відмовилися від штучних прикладів. Вони взяли проєкти, за які реальні люди отримували гроші: 3D-анімацію продуктів, транскрибування музики, створення веб-ігор та форматування наукових праць.

Результат вразив: найкраща система ШІ впоралася лише з 2,5% проєктів. Для порівняння, майже половина завдань була виконана з низькою якістю, а третина – взагалі залишилася незавершеною. ШІ часто створював пошкоджені файли або просто ігнорував ключові вимоги замовника. Навіть коли результат виглядав привабливо на перший погляд, детальний аналіз виявляв критичні недоліки.

У проєкті з дизайну інтер'єру ШІ створив правдоподібний план поверху, але він був повністю технічно неправильним та не містив необхідної деталізації. З аналітикою даних ШІ впорався також не без проблем. При створенні панелі візуалізації даних про щастя ШІ накладав текст на графіки, плутав кольори та «губив» цілі країни.

Розробка ігор також не піддалася штучному інтелекту. Створена гра була придатною до використання, але ШІ повністю проігнорував задану тему (пивоваріння), створивши абстрактний продукт.

Джейсон Хаузенлой, один із авторів дослідження, виділяє два головні обмеження сучасних систем, зокрема відсутність довгострокової пам'яті та проблеми з візуальним розумінням. ШІ не вміє вчитися на помилках у межах одного проєкту, що триває тижні, і не запам'ятовує фідбек замовника. Чат-боти намагаються створити 3D-моделі через написання коду, а не через роботу з візуальними інтерфейсами, як це робить людина. Як результат – навушники в рекламному ролику змінюють вигляд у кожному кадрі.

Попри низькі показники, позитивна динаміка все ж існує. Нова модель Gemini 3 Pro, протестована у листопаді 2025 року, виконала 1,3% завдань, тоді як її попередня версія ледь дотягувала до 0,8%.

Тенденція до автономії ШІ зберігається. Компанії вже зараз відчувають, що один працівник із доступом до чат-бота може зробити більше, ніж раніше. Проте повна заміна фахівця поки залишається науковою фантастикою. Для економії це вигідно: створення гри людиною коштувало дослідникам $1485, тоді як запуск Claude Sonnet обійшовся менше ніж у $30. Але різниця в якості поки що залишається аргументом на користь людської праці.

Нагадаємо, поява штучного інтелекту, здатного перехитрити світових лідерів та самостійно приймати рішення, переноситься на десятиліття вперед. Даніель Кокотайло, колишній співробітник компанії OpenAI, який раніше лякав світ апокаліптичними прогнозами, офіційно переглянув свої очікування. У квітні Кокотайло опублікував резонансний матеріал «ШІ 2027», у якому стверджував, що неконтрольований розвиток технологій призведе до появи суперінтелекту вже за три роки. За цим сценарієм, ШІ мав би захопити контроль над ресурсами для будівництва дата-центрів і «знищити людство» до середини 2030-х.

Читайте також:

Коментарі — 0

Авторизуйтесь , щоб додавати коментарі
Іде завантаження...
Показати більше коментарів