Uma semana após lançar o Midjourney v5, que usa IA para gerar imagens difíceis de distinguir de fotos reais, a empresa lançou um novo recurso, o Describe. Como o nome diz, ele descreve uma imagem em quatro prompts de texto, fazendo o caminho oposto do Midjourney normal.
Essa imagem pode ser qualquer ilustração ou foto, até mesmo uma que você tenha tirado com o seu smartphone. Sim, já era possível gerar imagens a partir de outras imagens no Midjourney, mas não criar descrições em texto elaboradas a partir delas.

Nós já testamos o Describe, e nesse post, compartilhamos alguns dos resultados obtidos com ele, assim como o passo a passo para usar a nova ferramenta do Midjourney.
Como usar o novo recurso Describe do Midjourney
Para quem já tem uma conta e está acostumado a usar o Midjourney no Discord, é bem fácil criar prompts e imagens com o Describe. Em primeiro lugar, você precisa salvar uma foto para fazer o upload, que pode ser basicamente qualquer imagem, inclusive uma da biblioteca do seu celular.
Ao invés de digitar o tradicional comando “/imagine”, é só usar o novo comando “/describe”, que vai abrir uma caixa para você enviar a sua foto ou ilustração. O Midjourney vai usar a IA para fazer uma espécie de engenharia reversa, e decifrar qual seria o prompt mais adequado, com quatro variações para você escolher.

A partir daí, o sistema gera os quatro prompts que podem ser transformados em novas imagens. Como exemplo, subimos uma foto de um robô da Boston Dynamics para usar como base. Depois que ele gerou as quatro descrições (ver imagem acima), é só clicar nos botões 1, 2, 3 e 4 para criar as imagens a partir de cada uma delas.

Acima as quatro variações geradas geradas com o primeiro prompt da imagem original. Não estão exatamente iguais, mas seguem a mesma cor e estilo dos cães robóticos, pelo menos nas primeiras três versões.

O segundo prompt gerou variações bem diferentes, mas mantendo a mesma iluminação, apesar de incluir uma nova cor em destaque, o vermelho, como você pode ver acima.

O terceiro prompt interpretou o robô-cão da Boston Dynamics como uma scooter, por algum motivo, mas também gostei do resultado, que também mantém o mesmo estilo visual da imagem original.

Já o quarto prompt gerou bem imagens que me agradaram muito, e que achei mais próximas da foto usada como base, mas com um design para os cães-robôs que poderia muito bem ser usado pela Boston Dynamics em produtos reais.
Teste do Midjourney Describe com fotos de banco de imagens e da NASA

Também resolvi fazer um teste com uma imagem de banco de imagem gratuito Pixabay, e escolhi essa foto de Paris, tirada por Pete Linforth, a primeira da montagem acima. Usando os prompts gerados pelo Describe, o Midjourney v5 conseguiu imagens que poderiam ser reais, pelo menos na minha opinião.

Acima, usei a recém-divulgada foto da NASA com os quatro astronautas da missão Artemis II, para gerar novos prompts do Midjourney com o Describe. Ele mudou o rosto dos astronautas e criou novas pessoas, mas fora este detalhe, até que ficou interessante.
Testes com fotos próprias

Também fiz alguns testes com fotos minhas, como a foto acima, tirada em Taipei, Taiwan, mostrando o edifício Taipei 101 ao fundo. Na lateral, estão os dois melhores resultados. Gostei particularmente da imagem em estilo desenhado.

Também subi uma foto que tirei de um pequeno sagui, e que gerou variações bem curiosas com os prompts do Describe. Os resultados ficaram bem realistas, como se espera do Midjourney v5.

Finalmente subi uma foto que tirei em um hotel no Havaí, e o primeiro resultado ficou tão próximo que nesse exemplo, resolvi nem incluir a original.
Ainda pretendo fazer novos testes com o novo recurso Describe, mas já deu para ver que, com ele, o Midjourney fica ainda mais versátil.
Assine nossa Newsletter para receber os melhores conteúdos do Itshow em sua caixa de entrada.