Root NationNotíciasnotícias de TIMeta mostrou IA para criar vídeos com base na descrição

Meta mostrou IA para criar vídeos com base na descrição

-

Os geradores de texto para imagem de inteligência artificial (IA) têm ganhado as manchetes nos últimos meses, mas os pesquisadores já avançaram para a próxima fronteira: geradores de texto para vídeo com inteligência artificial. Os meta pesquisadores apresentaram publicamente esse novo gerador, relata o The Verge.

A equipe de engenharia de aprendizado de máquina da Meta apresentado um novo sistema chamado Make-A-Video. Esse modelo de IA permite que os usuários insiram uma descrição aproximada da cena e gera um vídeo curto que corresponde ao texto. Os vídeos são claramente artificiais, com objetos borrados e animações distorcidas, mas ainda são uma conquista significativa no campo da geração de conteúdo de inteligência artificial.

Faça um vídeo: IA

Em sua postagem sobre Facebook O CEO da Meta, Mark Zuckerberg, descreveu o trabalho como um "avanço incrível", acrescentando: "O vídeo é muito mais difícil de criar do que as fotos, porque além de gerar corretamente cada pixel, o sistema também precisa prever como eles vão mudar com o tempo."

Faça um vídeo: IA

Os clipes não duram mais de cinco segundos e não contêm som, mas cobrem uma enorme variedade de pistas. Embora esteja claro que o vídeo é gerado por computador, a qualidade desses modelos de IA melhorará rapidamente em um futuro próximo. Em apenas alguns anos, os geradores de imagens de IA passaram da criação de imagens quase incompreensíveis para conteúdo fotorrealista. E embora o progresso em vídeo possa ser mais lento devido à complexidade quase ilimitada da área de assunto, o prêmio pela geração de vídeo contínua motivará muitas organizações e empresas a investir recursos significativos no projeto.

A empresa diz que planeja lançar uma versão demo do sistema, mas não disse quando ou como será implementado. Em um artigo que descreve o modelo, os pesquisadores do Meta observam que o Make-A-Video é treinado em pares de legendas de imagem, bem como em imagens de vídeo não rotuladas.

O conteúdo do treinamento foi derivado de dois conjuntos de dados, WebVid-10M e HD-VILA-100M, que juntos contêm milhões de vídeos e abrangem centenas de milhares de horas de imagens de vídeo. A propósito, isso inclui imagens de banco de imagens.

Os pesquisadores observam que o modelo tem muitas limitações técnicas, além de quadros borrados e animações dispersas. O Make-A-Video produz 16 quadros de vídeo com uma resolução de 64×64 pixels, que são redimensionados usando um modelo AI separado para 768×768 pixels.

Você pode ajudar a Ucrânia a lutar contra os invasores russos. A melhor maneira de fazer isso é doar fundos para as Forças Armadas da Ucrânia através Salva vida ou através da página oficial NBU.

Também interessante:

Inscrever-se
Notificar sobre
convidado

0 Comentários
Avaliações incorporadas
Ver todos os comentários