Meus Apps


Google Gemini agora permite imagens geradas por IA de pessoas — mas com restrições

Postado em: 31/08/2024 | Por: Emerson Alves

O Google Gemini, concorrente do ChatGPT, agora permite a criação de imagens de pessoas por meio de IA, mas com regras estritas para evitar abusos.

O Google anunciou que seu ferramenta de IA Gemini, que rivaliza com o ChatGPT, agora suporta a criação de imagens de pessoas geradas por inteligência artificial. A funcionalidade, que anteriormente estava disponível, foi desativada em fevereiro após usuários descobrirem como criar imagens perturbadoras com a ferramenta. Para evitar usos indevidos, o Google implementou uma série de restrições rigorosas.

Leia também: Ações da Nvidia caem apesar de resultados financeiros acima das expectativas.

Como funciona a nova funcionalidade do Google Gemini?

Com a atualização, os usuários do Gemini poderão criar imagens de pessoas, mas apenas dentro de limites bem definidos. Até recentemente, ao tentar gerar imagens de pessoas, os usuários recebiam uma mensagem informando que a funcionalidade estaria disponível em breve. Agora, essa espera terminou. Usuários com contas Gemini Advanced, Business ou Enterprise terão acesso antecipado à nova funcionalidade.

Contudo, o Google foi claro ao afirmar que essa não será uma ferramenta livre para qualquer uso. Segundo a empresa, foram feitos “melhorias técnicas” no Gemini antes do lançamento, incluindo “conjuntos de avaliação aprimorados, exercícios de red-teaming e princípios claros de produto”. Essas medidas visam garantir que o uso da ferramenta seja responsável e seguro.

David Citron, Diretor Sênior de Gestão de Produtos do Google Gemini, destacou que a empresa não permite a geração de imagens fotorrealistas de indivíduos identificáveis, retratos de menores de idade ou cenas excessivamente violentas, gore ou de natureza sexual. Citron também reconheceu que o Gemini ainda é uma ferramenta imperfeita e que a equipe continuará monitorando o feedback dos usuários para melhorar a ferramenta ao longo do tempo.

Google Gemini e a tecnologia por trás das imagens geradas por IA

O Google Gemini é executado no modelo generativo de IA Imagen 3, que recebeu uma atualização recente para melhorar a qualidade das imagens geradas. Assim como seu antecessor, o Imagen 2, o Imagen 3 utiliza o SynthID, uma ferramenta do Google para marca d’água em conteúdos gerados por IA, ajudando a identificar e autenticar essas imagens.

Atualmente, a funcionalidade de geração de imagens de pessoas no Google Gemini está disponível apenas para comandos em inglês, mas o Google planeja expandir o suporte para mais idiomas em breve.

Gems personalizados: uma nova funcionalidade do Google Gemini

Além da atualização para imagens geradas por IA, o Google também lançou os Gems personalizados, uma nova funcionalidade anunciada no Google I/O. Os Gems são variantes personalizadas do Gemini que podem ser configuradas para atender a necessidades específicas dos usuários.

De acordo com o Google, é possível criar qualquer Gem que o usuário imaginar, seja um parceiro de academia, um chef assistente, um parceiro de codificação ou um guia de escrita criativa. A configuração dos Gems é simples: basta dizer ao Gemini o que você deseja que ele faça e como deve responder. Por exemplo, um comando como “Você é meu coach de nutrição. Dê-me um plano alimentar diário. Seja otimista, energético e inspirador” fará com que o Google Gemini crie um Gem personalizado que atenda a essas demandas.

Para aqueles que não têm uma ideia clara de como personalizar seus Gems, o Google disponibilizou algumas opções pré-configuradas, como o Learning Coach, que ajuda a esclarecer tópicos complexos, e o Career Guide, que oferece conselhos e planos para alcançar metas profissionais.

Esses Gems personalizados estão sendo gradualmente liberados para os usuários das versões Gemini Advanced, Business e Enterprise.