Корейская компания LG выходит на рынок сервисов с искусственным интеллектом. На мероприятии Computer Vision and Pattern Recognition 2023 представлен новый сервис Captioning AI на базе генеративного ИИ. Если Midjourney и прочие известные ИИ генерируют изображение по описанию, то Captioning AI от LG создает описание по изображению. Этот ИИ распознает элементы изображения и детально описывает их. В теории это простая идея, но Captioning AI способен на глубокий анализ и выводы. К примеру, ИИ способен точно описать положение человека на пейзаже.
ИИ основан на технологии Zero-shot Image Captioning от группы разработчиков LG AI Research. При создании сервиса исследователи сотрудничали с платформой для хранения визуального контента Shutterstock.
ИИ может генерировать текстовые описания и ключевые слова для 10 000 изображений менее чем за два дня, что может повысить эффективность работы и производительность компаний, которые работают с большими объемами изображений.
Источник:
The Korea Times