В мае OpenAI
презентовала новую GPT-4o. Это мультимодальная языковая модель, она может работать с любыми видами контента. GPT-4o понимает более 50 языков, работает в режиме живой речи, распознает эмоции, может шутить. Ей можно не только задавать вопросы, но и показывать видео или изображения – и она ответит на ваши вопросы, с ними связанные, объяснит и т. п. Новая модель более продвинутая.
Эта нейронная сеть более надежная и креативная, может обрабатывать изображения и видео, в отличие от предшественников, ограниченных текстом. Она предоставляет информацию об изображении. Ей можно дать изображение, например фото продуктов, и попросить рецепты блюд, которые из них можно приготовить.
Нейронная сеть владеет бóльшим количеством языков и имеет больше знаний. Однако она все еще придумывает некоторые факты, нужен фактчекинг. Знания все так же ограничены 2021 годом. Лучше понимает глубокий контекст. Например, с ее помощью можно отправить аналитическую диаграмму, графики и она сможет по запросу расшифровать их и сделать детальное описание. И может даже написать сайт на основе наброска на бумаге. Еще искусственный интеллект может сделать игру за 20 минут.
Нейронная сеть имеет разные «личности», изменяемые по требованию, благодаря улучшенной управляемости. Для массового пользователя модель станет доступна осенью 2024 года.