Google Gemini permitirá que você crie pessoas geradas por IA novamente

Postado em: 31/08/2024 | Por: Emerson Alves

O Google está reintroduzindo a capacidade de gerar imagens de pessoas por meio do seu chatbot Gemini, após ter suspendido o recurso devido a problemas com imprecisões históricas.

O Google havia interrompido a função de gerar pessoas no Gemini no início deste ano, após relatos de que o chatbot estava produzindo imagens historicamente imprecisas, como representações inadequadas de figuras nazistas de diversas raças. Agora, a empresa anunciou que está retomando esse recurso, permitindo que os usuários do Gemini Advanced, Business e Enterprise em inglês tenham acesso a essa funcionalidade nos próximos dias.

Nova versão impulsionada por Imagen 3

A versão atualizada do recurso será alimentada pelo Imagen 3, o mais recente gerador de texto para imagem da IA do Google. Lançado inicialmente na Cozinha de Teste de IA no início deste mês, o Imagen 3 agora está integrado ao Gemini e estará disponível em todos os idiomas suportados. Este novo modelo é capaz de criar uma ampla gama de imagens, desde paisagens fotorrealistas até pinturas a óleo texturizadas, com apenas uma breve descrição.

O Google pausou a criação de imagens de pessoas em fevereiro após a descoberta de que o Gemini estava gerando imagens historicamente incorretas. Com o Imagen 3, o Google implementou salvaguardas que garantem maior precisão e confiabilidade, superando outros modelos de geração de imagens disponíveis no mercado, segundo Dave Citron, diretor sênior de gerenciamento de produtos do Google para o Gemini.

Restrições e controle de qualidade

Embora o recurso esteja sendo relançado, o Google estabeleceu algumas restrições importantes para garantir a segurança e a qualidade das imagens geradas. O chatbot não permitirá a criação de imagens fotorrealistas de figuras públicas, conteúdos envolvendo menores, ou cenas de violência, sangue ou teor sexual. “Embora nem todas as imagens geradas pelo Gemini sejam perfeitas, continuaremos a coletar feedback dos usuários do Gemini Advanced de acesso antecipado enquanto aprimoramos a tecnologia”, afirma Citron.

Além disso, o Google tem planos de expandir gradualmente a capacidade de criação de pessoas geradas por IA para mais usuários e idiomas, à medida que a empresa continua a ajustar e melhorar a funcionalidade.

Comparação com outras ferramentas

Vale ressaltar que este recurso não deve ser confundido com o novo “Remagine” do Google, que permite adicionar elementos de IA a fotos tiradas com a nova linha de telefones Pixel 9. Enquanto o Remagine se concentra na edição de fotos já existentes, o Gemini, com o suporte do Imagen 3, oferece uma criação de imagens totalmente nova, baseada em descrições textuais fornecidas pelos usuários.

Conclusão

A reintrodução do recurso de geração de imagens de pessoas no Gemini marca um avanço significativo na IA generativa do Google. Com melhorias substanciais na precisão e segurança, o Google busca oferecer uma ferramenta mais confiável e poderosa para seus usuários. A empresa continua comprometida em ouvir feedback e refinar suas tecnologias, visando um uso mais seguro e eficaz da inteligência artificial.

Google Gemini permitirá que você crie pessoas geradas por IA novamente

Nova versão impulsionada por Imagen 3

Restrições e controle de qualidade

Comparação com outras ferramentas

Notícias relacionadas