Meta демонстрирует свой инструмент для создания изображений на основе искусственного интеллекта

Meta демонстрирует свой инструмент для создания изображений на основе искусственного интеллекта

Meta продемонстрировала инструмент для создания изображений под названием Make-A-Scene, который требует от пользователей предоставить текстовую подсказку, а также первоначальный набросок того, что они хотят создать.

«Предыдущие современные системы искусственного интеллекта, которые генерировали впечатляющие изображения, в основном использовали текстовое описание в качестве входных данных», — говорит Мета. «Но текстовые подсказки, такие как „рисунок зебры, едущей на велосипеде“, генерируют изображения с композицией, которую трудно предсказать».

Компания говорит, что это может помешать кому-то почувствовать «сильное чувство гордости и владения контентом», который они попросили создать ИИ. Предполагается, что Make-A-Scene решит эту проблему, предоставив людям больше контроля над тем, какое искусство будет создано.

Помните мем о том, как рисование совы можно разбить на два этапа: нарисовать несколько кругов, а затем нарисовать остальную часть совы? Make-A-Scene эффективно позволяет людям сказать «сова», нарисовать несколько кругов, а затем посмотреть, как инструмент на основе ИИ рисует остальную часть совы.

Meta говорит, что это исследование является частью его «стремления изучить способы, с помощью которых ИИ может расширить возможности творчества — будь то воплощение ваших 2D-набросков в жизнь, использование естественного языка среди других модальностей для создания 3D-объектов, создание целых виртуальных пространств или любой другой творческий проект».

Компания, конечно, связывает эти усилия с метавселенной, но нетрудно представить, что социальные платформы, такие как Facebook и Instagram, также извлекут выгоду из этого исследования. Людям нравится делиться своим искусством; такой инструмент, как Make-A-Scene, может дать им больше возможностей для этого.

Meta заявляет, что планирует представить Make-A-Scene на ECCV 2022 конференции в Тель-Авиве в октябре. Более подробная информация об исследованиях, лежащих в основе этого прототипа, доступна в опубликованной статье в марте. Однако нет ни слова о том, когда публика сможет поиграть с этим инструментом.