피포 디퓨전

피포 디퓨전(FIFO-Diffusion)은 서울대학교 컴퓨터비전 연구팀(CVLAB)이 개발한 끝없이 영상을 생성하는 AI 비디오 생성 기술이다.

[아사달] 스마트 호스팅

개요[편집]

서울대학교 공과대학 전기정보공학부 한보형 교수가 이끄는 컴퓨터비전 연구팀(CVLAB)이 개발한 혁신적인 텍스트 투 비디오(Text-to-Video) 생성 기술이다. 이 기술은 텍스트를 입력하면 별도의 학습 없이 무한한 길이의 비디오를 생성할 수 있는 AI 모델로, 기존의 영상 생성 기술 한계를 극복하며 주목받고 있다. 피포 디퓨전은 딥러닝에서 중요한 기술로 자리 잡고 있는 디퓨전 모델(diffusion model)을 활용한 비디오 생성 기술이다. 기존의 비디오 생성 모델은 영상 길이가 길어질수록 메모리 소모와 프레임 간 일관성 유지에 어려움을 겪었다. 그러나 피포 디퓨전은 이러한 문제를 해결하며 혁신적 특징을 보여준다. 피포 디퓨전 기술을 제안한 논문 'FIFO-Diffusion: Generating Infinite Videos from Text without Training'은 2024년 10월, 인공지능 및 기계학습 분야에서 세계 최고 권위를 자랑하는 학술대회 NeurIPS(Neural Information Processing Systems)에 채택되었다. NeurIPS는 AI 및 딥러닝 분야의 최첨단 연구 결과를 발표하는 자리로, 엄격한 심사를 통과한 논문만 발표된다. 피포 디퓨전은 텍스트 투 비디오 기술의 새로운 가능성을 제시하며 학계와 산업계의 주목을 받았다. 연구팀을 이끄는 한보형 교수는 피포 디퓨전이 영상 콘텐츠 제작에 있어 새로운 기준을 제시했다고 평가하며, 이를 기반으로 후속 연구를 통해 기술을 더욱 발전시킬 계획임을 밝혔다.^[1]

특징[편집]

무한한 길이의 비디오 생성 가능

기존 모델은 짧은 클립 생성에 그쳤지만, 피포 디퓨전은 텍스트 입력만으로 무한히 긴 비디오를 생성할 수 있다. 이는 비디오 제작에서 길이에 대한 제약을 완전히 제거한 획기적인 기술이다.

별도의 추가 학습 없이 텍스트 조건에 따라 생성

기존 기술은 모델 학습에 방대한 데이터와 하드웨어 자원이 필요했으나, 피포 디퓨전은 사전에 짧은 클립을 학습한 모델을 기반으로 추가 학습 없이도 자연스럽고 일관성 있는 비디오를 생성한다.

메모리 효율성 및 고화질 유지

메모리 사용량을 일정하게 유지하며, 고품질 비디오를 생성하는 데 초점을 맞췄다. 이를 통해 장시간 비디오 제작도 실현 가능하다.^[2]

기술적 기법[편집]

피포 디퓨전은 비디오 품질과 생성 효율성을 극대화하기 위해 세 가지 주요 기법을 도입했다.

대각선 디노이징(Diagonal Denoising) : 노이즈가 있는 비디오 프레임을 큐(queue) 형태로 처리하며 품질 저하 없이 무한히 긴 비디오를 생성하도록 한다. 이는 프레임 간 연결성을 유지하는 데 중요한 역할을 한다.
잠재 파티셔닝(Latent Partitioning) : 비디오 프레임을 여러 블록으로 나눠 병렬로 처리함으로써 프레임 간 노이즈 레벨 차이를 줄인다. 이로 인해 보다 일관된 품질의 비디오가 생성된다.
앞서보기 디노이징(Lookahead Denoising) : 새롭게 생성될 프레임이 이전 프레임의 더 깨끗한 데이터를 참조하도록 설계되어, 비디오가 길어질수록 발생할 수 있는 품질 저하를 방지한다. 후반부 프레임에서도 선명한 영상을 유지할 수 있도록 돕는 핵심 기술이다.^[3]

가능성[편집]

기존의 비디오 생성 모델들은 다음과 같은 한계가 있었다. 대다수의 기존 비디오 생성 모델은 3초 이내의 짧은 클립 생성에만 적합했다. 프레임 간 일관성이 부족해 부자연스러운 영상이 생성되었으며, 메모리 소모와 연산 자원 요구량이 매우 높았다. 피포 디퓨전은 이러한 한계를 뛰어넘어 텍스트를 기반으로 길이 제한 없이 자연스럽고 선명한 비디오를 생성할 수 있다. 특히, 추가 학습이나 대규모 데이터가 필요하지 않아 효율적인 비디오 제작을 가능케 한다. 피포 디퓨전은 영화, 광고, 게임, 교육 등 콘텐츠 제작 분야에서 혁신을 가져올 잠재력을 지니고 있다.

영화 및 광고: 텍스트를 입력하는 것만으로 원하는 장면을 자동 생성해 제작 시간과 비용을 절감할 수 있다.
게임: 게임 세계관과 일치하는 배경 영상이나 스토리 컷신을 자동으로 생성할 수 있다.
교육: 강의나 학습 자료를 위한 맞춤형 영상 콘텐츠를 손쉽게 제작할 수 있다.^[4]

각주[편집]

↑ 김태봉 기자, 〈끝없이 영상 생성하는 AI 비디오 생성 기술 개발〉, 《한국IT산업뉴스》, 2024-11-15
↑ 박현진 기자, 〈"3초, 1분이 아니다!"...우리는 별도의 학습 없이 무한 길이의 비디오 생성한다!〉, 《인공지능신문》, 2024-11-11
↑ 이재성 기자, 〈서울대 공대 컴퓨터비전 연구팀, 끝없이 영상 생성하는 AI 비디오 생성 기술 개발〉, 《한국데이터경제신문》, 2024-11-12
↑ 〈서울대 공대 전기정보공학부 컴퓨터비전 연구팀, 끝없이 영상 생성하는 AI 비디오 생성 기술 개발〉, 《서울대학교 공과대학》, 2024-11-11

참고자료[편집]

박현진 기자, 〈"3초, 1분이 아니다!"...우리는 별도의 학습 없이 무한 길이의 비디오 생성한다!〉, 《인공지능신문》, 2024-11-11
〈서울대 공대 전기정보공학부 컴퓨터비전 연구팀, 끝없이 영상 생성하는 AI 비디오 생성 기술 개발〉, 《서울대학교 공과대학》, 2024-11-11
이재성 기자, 〈서울대 공대 컴퓨터비전 연구팀, 끝없이 영상 생성하는 AI 비디오 생성 기술 개발〉, 《한국데이터경제신문》, 2024-11-12
김태봉 기자, 〈끝없이 영상 생성하는 AI 비디오 생성 기술 개발〉, 《한국IT산업뉴스》, 2024-11-15

같이 보기[편집]

인공지능 영상

이 피포 디퓨전 문서는 인공지능 서비스에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.

인공지능 : 인공지능 서비스^□^■^⊕, 인공지능 로봇, 인공지능 기술, 인공지능 기업, 인공지능 인물

거대언어모델(LLM)	그록 • 네모 • 라마 • 몰모 • 믹스트랄 • 믿음 • 바드 • 사하바트-AI • 솔라 미니 • 솔라 프로 • 아야23 • 엑사원 • 인플렉션 2.5 • 제미나이 • 제미나이 나노 • 챗GPT • 클로드 • 파이-3.5 • 팔미라-X-004 • 하이퍼클로바X

챗봇	라온 • 브리티 코파일럿 • 샵봇 • 시리 • 심심이 • 아숙업(AskUp) • 알로 • 알리GPT • 애플 인텔리전스 • 오토GPT • 이루다 • 채티 • 챗뤼튼 • 챗베이스 • 클로바X • 키미챗 • 테이 • 패브릭스 • 픽스트랄 • 허깅챗

인공지능 검색	구버 • 라이너 • 빙 • 서치GPT • 옴니서치 • 퍼플렉시티

인공지능 문서	감마 • 구글 번역 • 노션AI • 다글로 • 딥엘(DeepL) • 뤼튼 • 비토 • 스위치미팅 • 에버노트 • 캔바 • 클로바노트 • 클로바더빙 • 파파고

인공지능 코딩	깃허브 코파일럿 • 데빈 • 커서AI • 코덱스 • 코디움메이트 • 탭나인

인공지능 이미지	AI 모션 • AI 프로필 • NUI 스튜디오 • 달리(DALL·E) • 드림스튜디오 • 레오나르도 AI • 미드저니 • 비디스커버 • 스테이블 디퓨전 • 에픽 • 카카오브레인 • 칼로 • 캐럿 • 코파일럿 • 파이어플라이 • 플레이그라운드

인공지능 웹툰	딥툰 • 로어머신

인공지능 음악 및 음성	AI 보이스 스튜디오 • 뮤직LM • 복스박스 • 사운드풀 • 수노 • 에이바 • 유디오 • 이봄 • 일레븐랩스 • 타입캐스트

인공지능 동영상	더 프로스트 • 드림머신 • 디-아이디 • 런웨이 젠 • 런웨이 젠3 • 무비 젠 • 브루 • 브이 • 소라 • 스테이블 비디오 디퓨전 • 인비디오 AI • 카이버 AI • 크레아 AI • 클링 AI • 피카아트 • 피포 디퓨전 • 픽스버스 • 픽토리

인공지능 서비스	슈퍼로이어

인공지능 무기	가스펠 • 라벤더

인공지능 스피커(한국)	갤럭시홈미니 • 기가지니 • 기가지니2 • 누구 • 누구네모 • 엑스붐AI씽큐 • 카카오아이 • 카카오미니 • 큐보이스 • 클로바 • 클로바웨이브

인공지능 스피커(글로벌)	구글홈 • 구글홈미니 • 구글홈허브 • 두어 • 빅스비 • 샤오두 • 스마트스피커 • 알렉사 • 어시스턴트 • 에코 • 에코닷 • 에코쇼 • 코타나 • 티몰지니 • 홈팟

인공지능 행사	2024년 제2차 AX 컨퍼런스

위키 : 자동차, 교통, 지역, 지도, 산업, 기업, 단체, 업무, 생활, 쇼핑, 블록체인, 암호화폐, 인공지능, 개발, 인물, 행사, 일반

[1] 김태봉 기자, 〈끝없이 영상 생성하는 AI 비디오 생성 기술 개발〉, 《한국IT산업뉴스》, 2024-11-15

[2] 박현진 기자, 〈"3초, 1분이 아니다!"...우리는 별도의 학습 없이 무한 길이의 비디오 생성한다!〉, 《인공지능신문》, 2024-11-11

[3] 이재성 기자, 〈서울대 공대 컴퓨터비전 연구팀, 끝없이 영상 생성하는 AI 비디오 생성 기술 개발〉, 《한국데이터경제신문》, 2024-11-12

[4] 〈서울대 공대 전기정보공학부 컴퓨터비전 연구팀, 끝없이 영상 생성하는 AI 비디오 생성 기술 개발〉, 《서울대학교 공과대학》, 2024-11-11

[1]

[2]

[3]

[4]

위키원

이름공간

변수

보기

더 보기

검색