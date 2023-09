Em mais um avanço na inteligência artificial generativa, a OpenAI desenvolveu uma versão aprimorada do DALL-E, sua ferramenta de geração de texto para imagem. A versão mais recente, DALL-E 3, utiliza o ChatGPT para contornar o complexo processo de redação de prompts.

Isso simplifica de forma significativa o processo de fornecer um prompt detalhado para gerar imagens precisas, tornando ainda mais simples a interação entre a IA e os seres humanos.

O campo emergente da engenharia de prompts tem ganhado popularidade, uma vez que os usuários frequentemente carecem da visão criativa necessária para descrever as imagens desejadas por meio de prompts.

Mesmo o DALL-E depende desses prompts, que são descrições textuais das imagens. A OpenAI lançou esta versão atualizada, considerando os desafios que os usuários enfrentam ao criar prompts precisos.

Agora, assinantes com acesso ao ChatGPT Plus e ao ChatGPT Enterprise, os planos premium da ferramenta de IA generativa, podem solicitar que ele aprimore seus prompts por meio de conversas comuns. Os resultados estarão disponíveis diretamente no chatbot.

Curiosamente, o ChatGPT é capaz de aprimorar prompts e modificá-los para apenas algumas palavras. Isso forneceria ao modelo DALL-E 3 orientações adicionais.

OpenAI realiza novas melhorias no DALL-E 3

Além de integrar o DALL-E 3 com o ChatGPT, a OpenAI também fez melhorias significativas em sua ferramenta de geração de imagens em termos de precisão de prompts e qualidade de imagem.

Especificamente, o DALL-E que agora é mais competente em compreender prompts mais longos. Ele também pode lidar com conteúdos que modelos geradores de imagens têm considerado desafiadores ao longo destes meses.

O DALL-E 3 também foi incorporado com novos mecanismos para reduzir vieses causados por seus algoritmos, visando melhorar a segurança. Por exemplo, a versão atualizada rejeita solicitações para gerar imagens replicando o estilo de figuras públicas ou artistas vivos. Além disso, os artistas têm a opção de não permitir que suas obras de arte sejam usadas para treinar futuros modelos.

A OpenAI não especificou se lançaria ou não uma ferramenta web gratuita semelhante à sua abordagem com o DALL-E 2 e o modelo original do DALL-E.

Essa mudança ocorre em um momento em que a OpenAI e alguns outros desenvolvedores de IA generativa enfrentam acusações de uso de materiais protegidos por direitos autorais para treinar seus modelos.

O anúncio do DALL-E 3 também coincide com o aumento da concorrência no mundo da IA generativa, especialmente na área da síntese de imagens.

Concorrentes da OpenAI, como Stability AI e Midjourney, estão constantemente aperfeiçoando seus modelos de geração de imagens. Isso coloca ainda mais pressão sobre a OpenAI para tentar se destacar na vanguarda dessa tecnologia inovadora.

Conforme a OpenAI lança o DALL-E 3, as funcionalidades avançadas estarão disponíveis para os usuários premium do ChatGPT a partir de outubro. Em seguida, a empresa disponibilizará essas funcionalidades para laboratórios de pesquisa e clientes da API.

A criação do DALL-E 3 é mais um marco na corrida contínua da IA. Empresas que lideram a tecnologia de IA generativa estão se esforçando para reduzir a lacuna entre a criação de conteúdo visual e textual.