검수요청.png검수요청.png

비오2

위키원
이동: 둘러보기, 검색

비오2(Veo 2)는 구글 딥마인드가 2024년 12월 16일에 발표한 동영상 생성 AI이다.

아사달 스마트 호스팅 가로 배너 (since 1998).jpg
이 그림에 대한 정보
[아사달] 스마트 호스팅

개요

비오2는 텍스트이미지 입력을 통해 고해상도의 동영상을 생성하는 생성형 AI이다. 이 모델은 최대 4K(4096 x 2160) 해상도로 2분 이상의 영상을 제작할 수 있다. 이는 경쟁 모델인 오픈AI소라(Sora)와 비교했을 때 해상도는 4배, 지속 시간은 6배 이상 높은 수준이다. 소라는 1080p 해상도와 20초 분량의 동영상 제작이 최대치다. 비오 2는 현재 구글의 실험적 비디오 제작 도구인 ‘비디오FX(VideoFX)’를 통해 일부 사용자들에게 테스트 형태로 제공되고 있다. 정식 출시 일정은 공개되지 않았으나, 2025년에는 개발자 플랫폼인 '버텍스 AI(Vertex AI)'와 통합될 예정이다. 이 플랫폼은 다양한 분야의 크리에이터와 영상 전문가를 위한 새로운 영상 제작 도구로 활용될 가능성이 높다. 비오 2는 “시네마토그래피의 언어를 이해한다”는 점에서도 주목받고 있다. ‘35mm 필름’, ‘저속 촬영’, ‘얕은 심도(Shallow Depth of Field)’와 같은 명령어를 통해 영화 같은 영상을 생성할 수 있으며, 최대 4K 해상도와 더 긴 영상 제작이 가능하다. 이러한 기능들은 유튜브, 광고, 영화 제작 등 다양한 산업에서 활용될 전망이다.[1]

특징

비오 2는 이전 버전과 마찬가지로 텍스트 프롬프트이미지를 기반으로 동영상을 생성한다. 특히 물리적 움직임과 카메라 제어에 대한 이해가 크게 향상됐으며, 더 선명하고 정교한 영상을 생성하는 것이 특징이다. 가상 카메라의 세밀한 조작이 가능해 객체와 사람을 다양한 각도에서 인식하고, 움직임, 유체 동역학, 빛의 특성 등을 사실적으로 재현한다. 또한, 렌즈 효과와 영화적 기법, 미세한 인간 표정까지 구현할 수 있다. 구글은 비오 2가 “현실 세계의 물리적 법칙과 인간 움직임의 섬세한 차이를 소라보다 더 잘 이해한다”고 강조하며, 복잡한 굴절이나 유체 표현 등 까다로운 시각적 효과 생성에서의 강점을 내세웠다.[2]

평가

구글의 내부 테스트 결과, 비오 2는 관객들이 더 선호하는 영상을 평가하는 ‘전체 선호도’와 프롬프트에 대한 응답 일치도를 평가하는 ‘프롬프트 준수’에서 소라와 다른 경쟁 AI 모델들보다 높은 점수를 받았다. 다만, 손가락 수를 정확하게 표현하지 못하거나 복잡한 장면에서의 일관성을 유지하는 데에는 한계가 있다.[3]

한계

비오 2는 데이터 출처와 저작권 문제에 대한 논란이 있다. 딥마인드는 학습 데이터의 출처를 명확히 밝히지 않았으나, 다수의 외신은 유튜브가 주요 데이터 출처일 가능성을 제기했다. 구글은 과거 공개 데이터를 학습하는 것이 공정 이용(fair use)에 해당한다고 주장했으나, 창작자들은 이에 동의하지 않는 입장을 보이고 있다. 비오 2는 생성된 동영상에 딥페이크 방지를 위한 워터마킹 기술인 ‘신스(Synth)ID’를 적용했다. 이 기술은 생성된 동영상 프레임에 보이지 않는 마커를 삽입해 AI가 만든 콘텐츠를 추적할 수 있게 한다. 하지만 완벽한 보호를 보장하지는 못한다는 지적도 있다. 구글 딥마인드는 블로그를 통해 “비오 2는 놀라운 진전을 보여줬지만, 복잡한 장면이나 역동적인 동작을 포함한 영상에서 완벽한 일관성을 유지하는 것은 여전히 어려운 과제다”라고 밝혔으며, 해당 문제를 지속적으로 개선해 나갈 것이라고 덧붙였다.[2]

각주

참고자료

같이 보기


  검수요청.png검수요청.png 이 비오2 문서는 인공지능 서비스에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.