Meta는 인공 지능을 기반으로 한 새로운 생성기를 만들었습니다.

인공 지능(AI) 텍스트-이미지 생성기는 최근 몇 달 동안 헤드라인을 장식했지만 연구원들은 이미 다음 영역인 AI 기반 텍스트-비디오 생성기로 이동했습니다. 메타 연구자들은 이러한 새로운 생성기를 공개적으로 발표했다고 Verge는 보고합니다.

메타의 머신러닝 엔지니어링 팀 제시 Make-A-Video라는 새로운 시스템. 이 AI 모델을 통해 사용자는 장면에 대한 대략적인 설명을 입력할 수 있으며 텍스트와 일치하는 짧은 비디오가 생성됩니다. 비디오는 흐릿한 물체와 왜곡된 애니메이션으로 분명히 인공적이지만 인공 지능 콘텐츠 생성 분야에서 여전히 중요한 성과입니다.

에 대한 그의 게시물에서 Facebook Meta CEO Mark Zuckerberg는 이 작업을 "놀라운 발전"이라고 설명하면서 "비디오는 사진보다 생성하기가 훨씬 더 어렵습니다. 왜냐하면 시스템은 각 픽셀을 올바르게 생성하는 것 외에도 시간이 지남에 따라 픽셀이 어떻게 변할지 예측해야 하기 때문입니다."라고 덧붙였습니다.

동영상 만들기: AI

클립은 초 이상 지속되지 않고 소리는 포함되지 않지만 방대한 범위의 단서를 포함합니다. 비디오가 컴퓨터로 생성된 것이 분명하지만 그러한 AI 모델의 품질은 가까운 장래에 빠르게 향상될 것입니다. 불과 몇 년 만에 AI 이미지 생성기는 거의 이해할 수 없는 사진을 만드는 것에서 사실적인 콘텐츠로 바뀌었습니다. 그리고 주제 영역의 거의 무한한 복잡성을 고려할 때 비디오 진행이 더 느릴 수 있지만 원활한 비디오 생성에 대한 상은 많은 조직과 회사가 프로젝트에 상당한 리소스를 투자하도록 동기를 부여할 것입니다.

회사는 시스템의 데모 버전을 출시할 계획이라고 밝혔지만 언제 어떻게 구현될지는 밝히지 않았습니다. 모델을 설명하는 논문에서 Meta 연구원들은 Make-A-Video가 레이블이 지정되지 않은 비디오 푸티지뿐만 아니라 이미지-캡션 쌍에 대해 훈련되었음을 언급합니다.

교육 콘텐츠는 WebVid-10M 및 HD-VILA-100M이라는 두 가지 데이터 세트에서 파생되었으며, 이 데이터 세트에는 수백만 개의 비디오가 포함되어 있고 수십만 시간의 비디오 푸티지가 포함되어 있습니다. 그건 그렇고, 여기에는 스톡 영상이 포함됩니다.

연구원들은 모델이 흐릿한 프레임과 흩어진 애니메이션 외에도 많은 기술적 한계를 가지고 있다고 지적합니다. Make-A-Video는 16×64 픽셀의 해상도로 64개의 비디오 프레임을 출력한 다음 별도의 AI 모델을 사용하여 768×768 픽셀로 크기를 조정합니다.

당신은 우크라이나가 러시아 침략자에 맞서 싸울 수 있도록 도울 수 있습니다. 이를 수행하는 가장 좋은 방법은 다음을 통해 우크라이나 군대에 기금을 기부하는 것입니다. 세이브라이프 또는 공식 페이지를 통해 NBU.

또한 흥미로운:

근원Theverge

가입하기

0 코멘트

임베디드 리뷰

모든 댓글 보기

기타 기사

Meta는 설명을 기반으로 비디오를 만드는 AI를 보여주었습니다.

최근 댓글