22.8 C
São Paulo
sábado, fevereiro 24, 2024
InícioTransformação digitalInteligência artificialTestamos o Describe, recurso do Midjourney que cria prompts a partir de...

Testamos o Describe, recurso do Midjourney que cria prompts a partir de qualquer imagem

Uma semana após lançar o Midjourney v5, que usa IA para gerar imagens difíceis de distinguir de fotos reais, a empresa lançou um novo recurso, o Describe. Como o nome diz, ele descreve uma imagem em quatro prompts de texto, fazendo o caminho oposto do Midjourney normal.

Essa imagem pode ser qualquer ilustração ou foto, até mesmo uma que você tenha tirado com o seu smartphone. Sim, já era possível gerar imagens a partir de outras imagens no Midjourney, mas não criar descrições em texto elaboradas a partir delas.

Testamos o Describe, recurso do Midjourney que revela prompts de qualquer imagem

Nós já testamos o Describe, e nesse post, compartilhamos alguns dos resultados obtidos com ele, assim como o passo a passo para usar a nova ferramenta do Midjourney.

Como usar o novo recurso Describe do Midjourney

Para quem já tem uma conta e está acostumado a usar o Midjourney no Discord, é bem fácil criar prompts e imagens com o Describe. Em primeiro lugar, você precisa salvar uma foto para fazer o upload, que pode ser basicamente qualquer imagem, inclusive uma da biblioteca do seu celular.

Ao invés de digitar o tradicional comando “/imagine”, é só usar o novo comando “/describe”, que vai abrir uma caixa para você enviar a sua foto ou ilustração. O Midjourney vai usar a IA para fazer uma espécie de engenharia reversa, e decifrar qual seria o prompt mais adequado, com quatro variações para você escolher.

Captura de tela mostra prompts gerados com o recurso Describe do Midjourney

A partir daí, o sistema gera os quatro prompts que podem ser transformados em novas imagens. Como exemplo, subimos uma foto de um robô da Boston Dynamics para usar como base. Depois que ele gerou as quatro descrições (ver imagem acima), é só clicar nos botões 1, 2, 3 e 4 para criar as imagens a partir de cada uma delas.

Imagem: Boston Dynamics com variações feitas pelo Midjourney com o Describe

Acima as quatro variações geradas geradas com o primeiro prompt da imagem original. Não estão exatamente iguais, mas seguem a mesma cor e estilo dos cães robóticos, pelo menos nas primeiras três versões.

Imagem: Boston Dynamics com variações feitas pelo Midjourney com o Describe

O segundo prompt gerou variações bem diferentes, mas mantendo a mesma iluminação, apesar de incluir uma nova cor em destaque, o vermelho, como você pode ver acima.

Variações feitas pelo Midjourney com o Describe a partir de foto da Boston Dynamics (Scooter)

O terceiro prompt interpretou o robô-cão da Boston Dynamics como uma scooter, por algum motivo, mas também gostei do resultado, que também mantém o mesmo estilo visual da imagem original.

Variações feitas pelo Midjourney com o Describe a partir de foto da Boston Dynamics

Já o quarto prompt gerou bem imagens que me agradaram muito, e que achei mais próximas da foto usada como base, mas com um design para os cães-robôs que poderia muito bem ser usado pela Boston Dynamics em produtos reais.

Teste do Midjourney Describe com fotos de banco de imagens e da NASA

Foto de Paris com variações do Midjourney Describe

Também resolvi fazer um teste com uma imagem de banco de imagem gratuito Pixabay, e escolhi essa foto de Paris, tirada por Pete Linforth, a primeira da montagem acima. Usando os prompts gerados pelo Describe, o Midjourney v5 conseguiu imagens que poderiam ser reais, pelo menos na minha opinião.

Foto da NASA interpretada pelo Describe

Acima, usei a recém-divulgada foto da NASA com os quatro astronautas da missão Artemis II, para gerar novos prompts do Midjourney com o Describe. Ele mudou o rosto dos astronautas e criou novas pessoas, mas fora este detalhe, até que ficou interessante.

Testes com fotos próprias

Foto de Taipei com variações do Midjourney Describe

Também fiz alguns testes com fotos minhas, como a foto acima, tirada em Taipei, Taiwan, mostrando o edifício Taipei 101 ao fundo. Na lateral, estão os dois melhores resultados. Gostei particularmente da imagem em estilo desenhado.

Foto de sagui com variações do Midjourney Describe

Também subi uma foto que tirei de um pequeno sagui, e que gerou variações bem curiosas com os prompts do Describe. Os resultados ficaram bem realistas, como se espera do Midjourney v5.

Foto de Taipei com variações do Midjourney Describe

Finalmente subi uma foto que tirei em um hotel no Havaí, e o primeiro resultado ficou tão próximo que nesse exemplo, resolvi nem incluir a original. 

Ainda pretendo fazer novos testes com o novo recurso Describe, mas já deu para ver que, com ele, o Midjourney fica ainda mais versátil.

Assine nossa Newsletter para receber os melhores conteúdos do Itshow em sua caixa de entrada.

Nick Ellis
Nick Ellis
Jornalista de tecnologia, designer de formação e um dos pioneiros da blogosfera brasileira, Nick foi o fundador e primeiro editor-chefe do TechTudo. É o criador dos sites Digital Drops e Blog de Brinquedo, além de ter sido o CEO do Meio Bit por mais de 12 anos. Tem mais de 15 anos de experiência gerenciando redações de tecnologia, além de ser redator de artigos, colunas e reviews de smartphones, TVs, tablets e notebooks, entre muitos outros produtos e serviços. Nick tem mais de uma década de experiência na cobertura das principais feiras e eventos de tecnologia do mundo como a CES, a Computex e a IFA, entre outras. Nos últimos 3 anos, foi editor de produtos, reviews e veículos no site Olhar Digital.
Postagens recomendadas
Outras postagens