Компанія xAI Ілона Маска інтегрувала функцію розуміння зображень у свою модель Grok. Тепер користувачі з платною підпискою на соціальній платформі X можуть завантажувати зображення та ставити ШІ питання про їх вміст. Представник xAI підтвердив нові можливості у своєму дописі на X.
Нова функція дозволяє Grok пояснювати жарти на зображеннях, коли таке комусь потрібно. Хоча зараз цей функціонал перебуває на етапі бети, розробники обіцяють подальше його покращення.

Перші користувачі нової функції активно вже повідомляють, що ШІ не завжди може «зрозуміти» базові меми. Інші повідомляють про труднощі із завантаженням зображень — іноді їх доводиться завантажувати кілька разів. Також Grok поки не вміє створювати зображення у відповідь на аналіз інших зображень.
Це оновлення відповідає стратегії компанії по створенню мультимодальних можливостей своїх моделей. У серпні цього року було випущено Grok-2 з підтримкою генерації зображень завдяки технології FLUX.1.
Власник соціальної мережі X, Ілон Маск натякнув, що наступні оновлення дозволять Grok обробляти документи у форматах, як-от PDF. За словами Маска, команда досягає тих цілей, на які іншим знадобились би роки, всього за кілька місяців.