Фей-Фей Лі вважає, що прорив буде не в мові, а у просторовому мисленні машин

Фей-Фей Лі, знаменита дослідниця та «хрещена мати ШІ», засновниця стартапу World Labs, вважає, що наступний фундаментальний прорив у розвитку штучного інтелекту відбудеться не у сфері обробки мови, а у просторовому мисленні. Про це пише «Главком».

Фей-Фей Лі стверджує, що тільки навчившись розуміти рух, відстань та фізичні взаємозв'язки, машини зможуть перейти від аналізу інформації до справжнього партнерства з людиною.

У своїй новій роботі Лі підкреслює, що сучасні мовні моделі (навіть мультимодальні), хоча й блискуче працюють з інформацією, залишаються «сліпими до фізики світу». Вони можуть аналізувати зображення та тексти, але не здатні визначити відстань до об'єкта, зрозуміти його орієнтацію у просторі, передбачити, що станеться, якщо його перемістити чи повернути.

На думку Лі, це пов'язано з еволюцією: інтелект людини виник зі здатності відчувати та рухатися (перцептивно-моторне кільце), і лише потім розвинулося мовлення та мислення. Тому справжньому ШІ потрібні внутрішні моделі світу, де діють закони фізики.

Для наступного етапу еволюції Лі пропонує створювати не мовні, а світові моделі – системи, які не просто описують, а створюють та змінюють тривимірні сцени, дотримуючись причинно-фізичної логіки.

Такі моделі мають бути:

Генеративними: здатними створювати цілісні та стійкі світи.

Мультимодальними: розуміти текст, зображення, відео та жести.

Інтерактивними: передбачати наслідки власних дій.

Команда Лі у World Labs вже працює над прототипом такої системи під назвою Marble, яка здатна створювати стійкі тривимірні сцени за мультимодальним запитом.

У майбутньому Лі бачить потенціал просторово усвідомленого ШІ в робототехніці, плануванні складних дій та наукових дослідженнях. Здатність ШІ розуміти простір, як колись зір для живих істот, може стати ключем до нової стадії розвитку машинного розуму.

До слова, у Національному музеї Кардіффа (Великобританія) сталася незвична подія: художник під псевдонімом Еліас Мерроу непомітно розмістив на стіні картину, створену штучним інтелектом, яка кілька годин залишалася непоміченою персоналом.