A inteligência artificial vem avançando cada vez mais e agora é capaz de gerar imagens, a partir de comandos, com resolução cada vez melhor. Esse é o caso do DALL-E 2, um gerador de imagens com base em texto criado pelo grupo de pesquisadores OpenAI.
Após uma atualização recente do sistema do bot, ele passou a ser capaz de criar cenários com resolução ainda melhores (1,024 x 1,024 pixels) e menor latência do que original, além de incluir recursos, como o de editar uma imagem existente.
O DALL-E original, cujo nome deriva da junção dos nomes do artista Salvador Dalí e do robô da Disney WALL-E, foi apresentado em janeiro de 2021. Ele surgiu como primeiro em um teste limitado, mas logo chamou atenção por sua capacidade de representar conceitos visuais.
Segundo o The Verge, o robô se baseia no CLIP, um sistema computacional que analisa imagens e resume seu conteúdo da mesma maneira que um humano faria. A partir dele, o OpenAI criou o “unCLIP”, uma versão invertida que começa com uma descrição em texto e cria uma imagem(uma engenharia reversa).
Assim, é possível criar representações dos mais diversos temas, desde ursinhos de pelúcia realizando experimentos científicos até um cão da raça shiba inu usando uma boina e uma blusa gola-alta.
O novo recurso do DALL-E 2, chamado “inpainting” (“pintar dentro da imagem”, em tradução livre), permite ainda modificar partes específicas de uma imagem já existente. Você pode substituir, acrescentar e remover objetos de uma área em questão, sem prejudicar o restante da cena.
Outro recurso, chamado “variations” (“variações”), oferece uma ferramenta de busca para fotos que não existem. Os usuários podem fazer upload de uma imagem inicial e criar variações dela. Eles também podem misturar duas cenas, gerando fotografias que possuem elementos de ambas.
O DALL-E 2 gera uma imagem usando um processo chamado difusão, que é descrito como um “saco de pontos” preenchido com uma série de detalhes. Apesar dos avanços, o sistema apresenta alguns pontos de fraqueza, como o fato de que pessoas podem enganar a máquina e identificar um objeto (como uma maçã) com outra palavra (como “iPod”).
Manipulação de imagens
O OpenAI ainda examina os perigos potenciais da tecnologia, como a manipulação de imagens ou produção de desinformação. O grupo está tentando resolver esses problemas usando proteções técnicas e aperfeiçoando sua nova política de conteúdo.
Uma das estratégias é a adoção de uma marca d’água que sinaliza que a imagem foi criada por uma IA. Também não é possível gerar o rosto de uma pessoa específica com base em seu nome.
O programa não está disponível ao público, mas pode ser acessado por outros estudiosos por meio de uma inscrição online. A expectativa do grupo é que o sistema seja disponibilizado posteriormente para uso em aplicativos de terceiros.
Como posso utilizar?
Como foi descrito acima, por motivos óbvios de desordem e má uso da ferramenta se fosse liberada ao público comum seriam criadas muitas fakes e causaria certo colapso em sistemas de design geral no mundo atual, que não está pronto ainda para conseguir distinguir o que pode ser descrito como real. Por isso atualmente só é disponibilizada para pesquisadores e públicos específicos.
Porém você pode ver detalhes da utilização da ferramenta junto ao público em lives que alguns que tiveram liberação para o uso como esse exemplo :
Então se você quiser testar uma ferramenta semelhante, porém bem menos elaborada que está liberada ao público, criada por um pesquisador que mantém atualizando para se assemelhar ao poder DALL-E, clique aqui.
Luz P’ra Nós!
Luz p’ra nós!
Luz P’ra Nós 🍎
Poxa que daora! Amo arte. Gratidão pela matéria 😊
Luz P’ra Nós 🍎
Luz pra nós !
Luz P’ra Nós 🍎
#LuzPraNos
Luz P’ra Nós 🍎
Bem interessante
Luz p´ra nós!!
Luz P’ra Nós 🍎
Top.
Luz p’ra nós!
Luz P’ra Nós 🍎
Luz p’ra nós
Luz P’ra Nós 🍎
Daora.
Luz pra nós!
Luz P’ra Nós 🍎
Luz p’ra nós!
Luz P’ra Nós 🍎
Luz para nós!
Luz P’ra Nós 🍎
Luz p’ra nós!
Luz p´ra nós!
Luz p´ra nós!
Gratidão pela matéria!
Luz p’ra nós!