O novo criador de imagens de IA do Google tirou minha camisa
Experimentei o novo Nano Banana Pro do Google e ele imediatamente tirou minha roupa. Não pedi, mas o modelo de IA evidentemente decidiu que meu cartão de felicitações ficaria melhor com mais skin.
Nano Banana Pro é, como o nome sugere, voltado para profissionais. Desenvolvido pelo Gemini 3, é efetivamente uma atualização da popular ferramenta de geração e edição de imagens da empresa que se tornou viral em uma tendência de mídia social que transformou selfies em figuras 3D hiper-realistas. O Google afirma que permite criar imagens de alta qualidade que podem ser impressas, renderizar texto legível em imagens e combinar várias imagens em uma única composição. Também se destina a “pessoas que querem se sentir profissionais”, disse Naina Raisinghani, gerente de produto do Google DeepMind. A beira. Isso parece bom, porque não sou de forma alguma um profissional. Para mim, os resultados foram brilhantes, mas bobos. Parecia bom, mas parecia amador.
Usar o Nano Banana Pro é bem simples: você entra no aplicativo Gemini, seleciona “criar imagens” e ativa o modo ‘pensamento’. Basta inserir seu prompt (e imagem, se você estiver usando um) e pronto. Também é gratuito, embora haja limites, com cotas expandidas para assinantes do Google AI Plus, Pro e Ultra.
O Google faz algumas afirmações ousadas, prometendo “designs com qualidade de estúdio”, “renderização de texto impecável” e uma série de edições elegantes e criativas. Para testar isso, carreguei uma foto minha perto A beira escritório em Nova York com a Ponte do Brooklyn ao fundo. Pedi ao Gemini para mudar a iluminação do dia para a noite e funcionou muito bem. O resultado parece crível. Ele até lidou com detalhes que muitas vezes atrapalham os geradores de imagem, como carros indo na direção certa. Ajustar o ângulo da câmera foi igualmente fácil. Pedi ao Gemini para recriar a foto como se ela tivesse sido tirada de um ângulo mais alto à direita e assim foi.
Imagem: The Verge e Imagem: The Verge / Google, Nano Banana Pro
O Google também afirma que o Nano Banana Pro pode criar infográficos e diagramas para ajudar a visualizar informações em tempo real, como clima ou esportes. Sendo britânico, perguntei sobre o tempo para os próximos quatro dias em Washington, DC e na cidade de Nova York, onde estou atualmente. Visualmente, o infográfico se encaixaria em um site básico de previsão. O texto e os números pareciam normais – muito longe do absurdo distorcido que você costuma ver em imagens geradas por IA – e Gemini me deu uma lista de citações no final que me ajudou a confirmar que eram precisos.
O modelo tropeçou um pouco em tarefas mais complexas. Pedi-lhe que resumisse um recente Beira história sobre como a Europa está reduzindo suas leis de IA e privacidade em formato de história em quadrinhos. As imagens e o texto foram de fato renderizados perfeitamente em uma fonte de desenho animado, mas a história em quadrinhos não resumiu a história, dando, em vez disso, uma vaga visão geral da Lei de IA do bloco. O problema pode ter ocorrido porque dei ao Gêmeos um link para a história, em vez de colar o texto.

Imagem: The Verge/Google, Nano Banana Pro
Isso me deu um resumo aceitável em estilo cômico quando o fiz. Ele comunicou a essência da história real, embora eu não ache que teria sido capaz de entendê-la facilmente se não tivesse escrito o material original. Também inventou frases que não apareceram em nenhum lugar do meu artigo.

Imagem: The Verge/Google
Para realmente me sentir um designer profissional, tentei fazer cartões de felicitações. Afinal, o Natal está chegando. Considerando que carreguei apenas três selfies, Gemini fez um trabalho francamente incrível criando três versões de corpo inteiro de mim mesmo, cada uma com roupas diferentes e exibindo uma expressão facial diferente. Ele também criou um cenário realista e nevado com árvores de Natal, como eu pedi, e estampado “Feliz Natal!” no topo como eu pedi.
Gêmeos tomou liberdades quando pedi para mudar o cenário nevado do cartão para uma praia de verão para férias no estilo australiano. Essas liberdades eram minhas roupas falsificadas: dois dos meus clones estavam de topless. Foi estranho. Havia também alguns pés proeminentes gerados por IA e um homem de areia sorridente para substituir o boneco de neve da cena de inverno (sendo construído pelo meu sósia de topless). Porém, havia problemas – faltava uma sombra no sandman, ao contrário de outros objetos renderizados na imagem, e as luzes de Natal nas palmeiras brilhavam magicamente sob o sol forte. Testei suas habilidades de edição de precisão, pedindo-lhe para adicionar alguns músculos a apenas um clone, o que ele fez em segundos (se fosse tão fácil no mundo real). No geral, a qualidade era excelente e a imagem teria sido um tanto verossímil (abdômen à parte) se você não soubesse que faltava uma grande tatuagem no meu peito.

Mas nem tudo foi ótimo. O modelo não conseguiu preservar o texto exato do meu cartão que eu havia solicitado. Em vez de “Feliz Natal!” optou por “Aussie Summer Christmas!” Ele também parece ter dificuldades com os animais: o gato da minha irmã está sentado exatamente na mesma pose afetada da imagem de referência que forneci em todas as versões do cartão (no entanto, ele recebeu um chapéu de Papai Noel extravagante).
No geral, fiquei impressionado. Nano Banana Pro é uma atualização clara do modelo básico. Consegui solicitar edições mais precisas e isso realmente produziu texto inteligível, removendo um enorme obstáculo que impedia que ferramentas generativas de IA como essa pudessem ser usadas no mundo real. Mas, infelizmente, essas características não foram suficientes para me tornar um bom designer.
The Verge é site parceiro do Blog do Esmael

É uma publicação focada em tecnologia e seu impacto cultural.
Publicação de: Blog do Esmael
