코덱
코덱(Codec)은 음성 또는 영상의 신호를 디지털신호로 변환하는 코더(corder)와 그 반대로 아날로그신호로 변환하는 디코더(decorder)의 기능을 함께 갖춘 기술이다.[1]
개요
코덱은 컴퓨터상에서 각종 문서나 오디오, 비디오를 압축하거나 해제하는 규약이다. 어떠한 데이터 스트림(stream)이나 신호(Signal)에 대해, 인코딩(encoding)이나 디코딩(decoding), 혹은 둘 다를 할 수 있는 하드웨어(hardware)나 소프트웨어(software)를 말한다. 또한, 알고리즘(algorithm)을 가리키는 용어로도 쓰이고, 전기 통신분야의 용어로는 디지털 회신, 곧 송수신 장치를 뜻한다. 일반적으로 코덱이라고 하면 영상, 음향 등 미디어 정보를 압축하는 기술을 가리키며, 코덱에는 데이터 압축 기능을 사용하여 자료를 압축하거나 압축을 푸는 소프트웨어나, 소리, 동영상 등의 자료를 다른 형식으로 변환하는 장치 및 소프트웨어가 포함된다.[2]
역사
코덱의 역사는 20세기 중반 펄스 부호 변조(Pulse-code modulation, PCM)를 이용해 아날로그 신호를 디지털 형태로 암호화하는 장치였으며, 이후 압신기(compander) 기능을 포함하여 디지털 신호 형식 간 변환 소프트웨어에도 적용되었다.[3] 코덱은 동영상의 그림과 소리를 숫자로 변형시켜서 파일로 저장한 다음, 동영상을 재생할 때 숫자로 변형했던 것을 다시 그림과 소리로 바꿔 주는 역할로, 코덱이 없다면 영상이나 음악을 컴퓨터가 재생할 수 없다.[1]
특징
코덱의 특징은 아날로그 데이터를 전송하기 위하여 디지털 신호로 변환시키고, 다시 디지털 신호를 아날로그로 복귀 시키는 장비이다. 코덱의 기술로는 펄스 부호 변조와 델타 변조(delta modulation, DM)가 있다. 코덱은 동영상처럼 용량이 큰 파일을 작게 묶어주고 이를 다시 본래대로 재생할 수 있게 해준다. 파일을 작게 해주는 것을 인코딩, 본래대로 재생하는 것을 디코딩이라고 한다.[4]
압축 품질
압축 품질은 두 가지로, 손실 코덱과 무손실 코덱으로 나눌 수 있다. 손실 코덱은 사람이 잘 느끼지 못하는 부분을 우선적으로 손실시켜 압축률을 크게 올리는 기술이다. 영상이나 음향과 같은 정보는 시공간적 연관성에 의하여 지각되기 때문에, 개별 데이터에 대하여 오차가 있더라도 문제가 없는 경우가 많다. 따라서, 대부분의 유명한 비디오, 오디오 코덱들이 손실 코덱을 사용하는데, 사용되는 코덱과 설정에 따라 압축되지 않은 원음과 실제로 차이를 느끼기가 쉽지 않다. 비손실 코덱은 디지털 데이터가 다른 코덱 등을 거치지 않고 저장되고 변환되는 경우로, 압축된 데이터가 원본 스트림에 존재하는 모든 정보를 보유하고 있는 기술이다. 영상 편집처럼 빠른 처리가 필요하거나 편집 도중 화질 열화를 막기 위해 쓰이며, 무손실 압축 포맷(Lossless compression) ZIP 파일 형식 등을 비롯한 데이터 압축 기술에 사용된다.[2]
종류
무수한 종류의 코덱이 있으며, 대부분의 코덱 형식의 파일은 단일 코덱으로만 만들어지는 것이 아니라 여러 종류의 코덱을 종합하여 만들어지고 있다. 각 코덱은 표준화가 이루어지지 않아서 압축 방법이나 화질, 압축률 등이 서로 다르고 호환성이 없기 때문에 필요한 코덱을 개별적으로 설치하여야 한다. 이러한 번거로움을 피하기 위하여 여러 종류의 코덱을 한꺼번에 설치해주는 것을 통합코덱이라 한다.[4]
오디오 코덱
오디오 코덱으로는 가장 잘 알려진 MP3를 비롯하여 AC3, AAC, OGG, WMA, FLAC. DTS 등이 있다. 압축 소프트웨어로는 알집, 반디집, FilZip, 7-Zip, WinRAR, WinZip 등이 있다.
- 일반 : ADPCM, ATRAC, 돌비 디지털, Musepack, TwinVQ, Vorbis, WMA
- 발음/목소리 : iLBC, IMBE, iSAC, QCELP, Speex
- 비손실 : 애플 무손실, 돌비 트루HD, DTS-HD 마스터 오디오, OptimFROG, FLAC, APE, TTA, WavPack, WMA 무손실
- MP3
아마 가장 잘 알려진 것이 MP3 일 것이다. 이제는 MP3 플에이어를 나타내는 일반 명사로 쓰일 만큼 일반화되어 있다. MP3는 오디오 압축 포맷이다. PCM 오디오 데이터에서 실제작으로 사람이 들을 수 없는 부분이나 필요 없는 부분을 버리고 다시 인코딩하는 방식이다. MP3에서 사용하는 기술의 대부분은 음향심리학에서의 오디오 데이터의 어느 부분을 페기할 것인가를 결정하는 데에 있다. MP3 오디오는 각기 다른 비트레이트로 압축된다. 데이터의 크기가 커지면 음질은 좋아지는 반면 데이터의 크기가 작아지면 음질은 떨어진다.
- AC3
AC3는 오디오 코덱 코드(Audio Codec code) 3 이란 약자이다. 돌비 디지타(Dolby Digita)에서 만든 AUDIO 포맷 중 하나로 AC3은 5.1 채널에 기반해 2채널의 MP3보다 훨씬 좋은 음질을 자랑한다. 이 때문에 AC3는 음악용보다는 영화의 사운드 트랙용으로 많이 사용되며 DVD 등 디지털 매체의 표준 오디오 포맷이기도 하다. 하지만 DVD에서 입체감 있는 음향을 위해서는 AC3 기능이 내장된 오디오 기기를 연결해야 한다. 품질 우수하고 압축 효율 높은 동영상 코덱 `H.264`
- TI, 저전력 오디오 코덱으로 휴대용 기기 설계 비용 절감
- AAC
AAC(Advanced Audio Coding, AAC, 표준문서ISO/IEC 13818-7)는 디지털 오디오에서 쓰이는 표준적인 손실 데이터 압축방식이다. AAC는 애플의 아이폰, 아이팟, 아이튠즈에 사용 되는 기본 오디오 포맷으로, 아이튠즈 스토어의 모든 음원에 사용되고 있다. AAC는 소니의 플레이스테이션 3의 표준 오디오 포맷으로도 사용되고 있다. AAC는 기존 MP3의 문제를 대부분 개선했으며 특히 HE-AAC에서는 저 비트레이트에서도 음역 보존율이 아주 좋다. 최대 48채널로 확장이 가능하고 고정 비트레이트에서도 필요에 따라서 비트를 가변적으로 할당한다. 조인트 스테레오가 더욱 유용해져 낮은 비트레이트에서 음이 뭉개지는 현상을 개선했다.
- OGG
Ogg(오그)는 특허권으로 보호되지 않는 오픈 표준 파일 형식으로 멀티미디어 비트스트림을 효율적으로 전송하고 처리할 수 있게 하기 위해 Xiph.Org 재단에서 개발한 것이다. Ogg 형식 파일에는 오디오와 비디오, 문자열 (예: 자막) 용의 몇 가지의 서로 다른 오픈 소스 코덱으로 저장된 정보를 담을 수 있다. 또한 무료로 사용할 수 있는 파일 형식이기 때문에 여러 무료 및 상용 미디어 플레이어는 물론 다양한 포터블 미디어 플레이어에 Ogg의 여러 코덱을 내장해 사용될 수 있다.
- FLAC
FLAC(Free Lossless Audio Codec, 프리 로스리스 오디오 코덱))은 오디오 데이터 압축을 위한 파일 형식이다. 무손실 압축 포맷이다. 다시 말해서 MP3, AAC, Vorbis와는 달리 오디오 스트림에 손실이 발생하지 않는다. 다른 압축 방법들과 마찬가지로 FLAC의 장점은 전송율·대역폭·저장공간 등을 절약할 수 있다는 점인데 FLAC은 오디오 소스를 온전한 모습으로 보전해 준다. FLAC는 태깅(tagging), 앨범 아트, 빠른 건너뛰기(fast seeking)을 지원하기 때문에, 일상적인 음악 재생과 보관에 알맞다. FLAC은 자유 소프트웨어이자 동시에 오픈 소스 소프트웨어, 로열티 없는 소프트웨어이기 때문에 많은 소프트웨어 응용이 FLAC을 지원하고 있다. 휴대용 음악 기기나 MP3 플레이어, 고급 오디오 시스템에서의 FLAC 지원은 아직은 미미하나, 점차 증가하고는 있다.
동영상 코덱
동영상 코덱으로는 가장 많이 사용되는 MPEG(MPEG1, MPEG2, MPEG4)을 비롯하여 인텔의 Indeo, DivX, Xvid, H.264, WMV, RM, Cinepak, MOV, ASF, RA, XDM, RLE 등이 있다.
- MPEG-4 ASP : 3ivx, DivX, FFmpeg MPEG-4, HDX4, Xvid
- H.264/MPEG-4 AVC : CoreAVC, HDX4, QuickTime H.264, x264
- 비손실 : CorePNG, FFV1, Huffyuv, Lagarith, MSU 비손실
- 기타 : 시네팩, Dirac, Indeo, VP3, VP7, Pixlet, 스노우, Tarkin, Theora, WMV
- MPEG
가장 유명한 동영상 코덱 중에 하나다. MPEG(엠펙)는 무빙 픽쳐 익스퍼츠 그룹(Moving Picture Experts Group)의 약자이며 보통 동화상 전문가 그룹으로 부른다. MPEG은 ISO 및 IEC 산하에서 비디오와 오디오 등 멀티미디어의 표준의 개발을 담당하는 소규모의 그룹이다. 1988년 캐나다의 오타와에서 첫 모임을 갖은 이래 현재는 350여명의 다양한 산업계와 학계의 전문가들이 참여하고 있다. 일반적으로 연간 4회의 표준화 총회를 가지며 ITU 산하의 비디오 압축 표준화 단체인 VCEG과 함께 조인트 비디오 팀(Joint Video Team_JVT)를 구성해 H.264/AVC 표준을 공동 제정하고 있다. MPEG은 다음과 같은 압축 포맷과 부가 표준을 만들었다. - MPEG-1: 최초의 비디오와 오디오 표준. 비디오 CD의 표준으로 쓰였으며 MP3 오디오 압축 포맷이 여기에 포함된다. 표준 해상도는 352x240, 30프레임/초이다. - MPEG-2: 텔레비전 방송을 위한 표준. 디지털 위성 방송, 디지털 유선 방송, 고화질 TV 방송, DVD 비디오 등의 컴퓨터 멀티미디어 서비스에 쓰인다. 표준 해상도는 720x480, 1,280x720이며 60프레임/초이다. 음질은 CD와 동일한 퀄리티를 지원한다. - MPEG-3: 원래 HDTV 방송을 위해 고안되었으나 MPEG-2 표준에 내용이 합쳐져 중지된다. - MPEG-4: MPEG-2를 확장하여 영상/음성 ‘객체’, 3D 콘텐츠, 저속 비트율 인코딩, 디지털 재산권 관리 지원 등을 포함한다. 멀티미디어 통신에서의 이용을 위해 만들어 지고 있으며 영상압축기술 인터넷과 이동 통신 환경에서 사용되고 있다. 흔히 이야기하는 MPEG-4 동영상 표준은 MPEG-4 Part 2 비주얼(Visual)에 해당하며 흔히 H.264라 부르는 코덱이 MPEG-4의 Part 10 어드밴스드 비디오 코딩(Advanced Video Coding)으로 정의되어 있다. 또한 3차원 모델을 압축하기 위한 3차원 메쉬 부호화 (3D Mesh Coding) 또한 지원한다. - MPEG-7: 멀티미디어 콘텐츠를 기술하기 위한 형식적 시스템. 이 표준은 검색 사이트에서 키워드로 동영상을 검색하는 등 다양한 종류의 멀티미디어 정보 검색에 사용할 수 있다. - MPEG-21: MPEG 은 이 미래의 표준을 멀티미디어 프레임워크라고 표현한다.
- ASF
ASF는 능동 스트리밍 포맷(Active Streaming Format, ASF), 고급 시스템 포맷(Advanced Systems Format), 고급 스트리밍 포맷(Advanced Streaming Format)이라고 하며 마이크로소프트사가 만든 영상과 소리를 담는 포맷으로 MPEG4 기술을 사용하고 있다. 주로 인터넷에서 스트리밍 방송용으로 많이 쓰이며 인터넷이 연결되어 있지 않은 로컬 컴퓨터에서도 재생할 수 있다. 특히 1개의 파일에 다중 비트레이트의 영상, 소리, 메타데이터, 정지 화면, URL, 자막 등의 다양한 정보를 넣을 수 있다는 장점이 있다. 하지만 실시간 재생 목적을 위해 만들어지다 보니 높은 압축률로 인해 화질이 다른 파일 포맷에 비해 떨어지는 단점이 있으며 전송상태가 고르지 못할 경우에는 화면이 끊기는 현상이 있다.
- DivX
DIVX는 디지털 비디오 익스프레스(DIgital Video eXpress)의 약자로 원래 DVD의 대여 전용 포맷 및 시스템을 의미하는 용어로 시작됐다. 당시 개발 업체였던 ‘DIVX’ 사가 2년 만에 사업 철수를 하며 역사 속으로 사라졌다. 하지만 이후에 한 해커 그룹에 의해 DVD의 암호가 풀리고 MS의 MPEG-4를 변조해 DVD를 압축하는 코덱이 이름을 ‘Divx’로 지으면서 다시 등장하게 됐다. 이때 버전은 Divx3. 이렇듯 엄밀히 말하면 DIVX와 Divx는 다른 개념이다. DivX가 해킹 그룹에 의해 공개되자 높은 압축률에도 불구하고 기존 VCD보다 뛰어난 영상을 보여준다는 점 때문에 선풍적인 인기를 얻었다. 이후 Divx의 사용자가 급증하자 이를 상용화하려는 움직임이 있었고 Divx5.1 버전부터 상용화를 하게 됐다. 하지만 이를 반대하는 일부 사람들이 Dixv를 뒤집은 ‘Xvid’라는 코덱을 따로 발표하게 된다. Divx 코덱은 원칙적으로 MS의 MPEG-4 코덱을 해킹해서 만든 것이니만큼 이를 이용해 만든 동영상을 배표하는 것은 저작권 문제를 차치하고서라도 불법이다.
- XviD
Xvid는 앞에서 설명했지만 Dvix가 5.1 버전부터 상용화되자 그 대항마로 나온 것으로 Dvix 와는 별로 차이가 없지만 화질은 Dvix 코덱보다 약간 떨어진다는 평을 듣고 있다. Xvid는 비트레이트 조정으로 인코딩된 파일 용량을 조정하는 Dvix와는 달리 원하는 용량을 미리 정해 놓고 가변적으로 비트레이트를 조정하는 방식을 사용하고 있다.
- H.264
H.264는 매우 높은 데이터 압축률을 가지는 디지털 비디오 코덱 표준으로 MPEG-4 파트 10 또는 AVC(Advanced Video Coding)라 불린다. 이 표준은 ITU-T의 비디오 코딩 전문가 그룹(Video Coding Experts Group, VCEG)과 ISO/IEC의 동화상 전문가 그룹(Moving Picture Experts Group, MPEG)이 공동으로 조인트 비디오 팀(Joint Video Team, JVT)을 구성하고 표준화를 진행한 결과물로 나온 것이다. 이런 이유로 ITU-T의 H.264와 ISO/IEC의 MPEG-4 파트 10은 기술적으로 동일한 표준안이다. 표준안은 2003년 5월에 발표됐다. H.264는 최근 블루 레이(Blue-ray)나 HD 방송 콘텐츠를 인코딩하는 데 많이 사용되고 있으며 HD 콘텐츠를 PC에서 즐길 수 있도록 하는데 크게 기여하고 있다.
- wmv9
윈도 미디어 비디오(Windows Media Video, WMV)는 마이크로소프트 윈도 미디어 포맷이다. wmv9 코덱의 가장 큰 장점은 호환성이다. 윈도에 함께 포함된 윈도 미디어 플레이어를 통해 플레이가 가능하기 때문이다. 특히 다른 Divx 나 Xvid 코덱과 비교해 동일 화질일 경우 용량이 작다는 것이 장점이다. 하지만 압축률이 좋기 때문에 인코딩 시간이 오래 걸린다는 단점도 있다. 최신 버전은 윈도 미디어 비디오 11 (WMV11)이다.
활용
코덱을 활용한 사례들이 존재한다. ㈜현대자동차그룹(Hyundai Motor Group)은 2008년부터 자동차 분야에 블루투스(Bluetooth) 기술을 적용하기 시작했고, 2020년부터는 스마트폰 두 대를 동시에 연결할 수 있는 블루투스 멀티커넥션 기술까지 상용화되어 블루투스 활용성과 운전자의 사용 편의성을 극대화했다. 블루투스 기술은 근거리 무선 기술로, 블루투스로 음원을 재생하면 코덱을 통해 음원 압축, 인코딩 작업을 한 후, 전송하여 압축 해제, 디코딩 작업의 프로세스(process)를 거쳐 음원이 재생되게 된다. 자동차 분야에 적용된 블루투스 스트리밍(streaming) 기술은 차량에서 음악을 즐기는 가장 손쉽고 편리한 방법이다. 스마트폰 안의 음악을 선으로 연결하지 않고도 차량 내 스피커를 통해 손쉽게 들을 수 있게 되었다. 차량 내 블루투스에 사용되는 대표적인 오디오 음원 압축 코덱은 SBC(Sub-Band Coding)와 고급 오디오 부호화(Advanced Audio Coding, AAC)이고, 서로 연결된 스마트폰과 인포테인먼트(Infotainment) 시스템이 모두 동일한 코덱을 지원해야만 해당 코덱으로 음원을 재생할 수 있다. SBC 코덱은 가장 보편적으로 블루투스 뮤직 스트리밍에서 쓰이는 오디오 코덱으로, 알고리즘이 단순해 전력 소모가 적고 라이선스 비용이 들지 않아 모든 사운드 시스템에서 지원하는 높은 범용성을 자랑한다. 음원 압축 방식은 MP3와 비슷하게 오디오 신호를 주파수 대역별로 나눠서 코딩을 하는데, 압축 효율이 낮아 음원 손실이 발생해 결과적으로 음질에 안 좋은 영향을 미치게 된다. 반면 AAC는 MP3를 대체하는 대표적인 고음질 압축 코덱으로, 주파수의 모든 대역에 걸쳐 압축률이 높고 원음 손실이 적어 음질이 우수하다. 실제 비교 측정 결과에서도 두 코덱 간의 명확한 음질 차이를 확인할 수 있고, 더욱이 고음과 저음은 차량 내에서 체감 음질에 큰 영향을 주기 때문에 음악을 들을 때 그 차이가 더욱 현격하다. 따라서, 현대자동차그룹의 최신 인포테인먼트 시스템인 고급형 6세대, 고급형 5세대, 표준형 5세대 내비게이션에서 고음질 AAC 코덱으로 우선 재생되도록 설정되어 있다. 현대자동차그룹은 운전자의 사용 편의성을 높이기 위해서도 노력을 기울이고 있으며, 차량 내 어디에서 들어도 전 대역에 걸쳐 균형 잡힌, 원음에 가까운 자연스러운 사운드를 구현하는 것을 목표로 개발하고 있다.[5] 음성 및 화상 통화를 통해 온라인으로 다른 사람과 연결할 때도 코덱이 활용된다. 구글(Google)은 2021년 4월 6일 오픈소스 블로그를 통해 기계학습을 사용해 고품질 음성 통화를 생성하는 새로운 오디오 코덱 라이라(Lyra)를 보편적으로 사용할 수 있도록 오픈 소스 베타 버전을 공개하였다. 라이라 코덱은 40ms 단위로 음성의 고유 특징을 추출하여 압축해서 전송하면 수신 측에서 생성 모델을 이용하여 고품질의 오디오를 재생하게 된다. 복잡도가 낮은 반복 생성 모델을 사용하여, 클라우드 서버는 물론 스마트폰에서도 실시간 사용이 가능하다.[6]
각주
- ↑ 1.0 1.1 〈코덱〉, 《네이버 지식백과》
- ↑ 2.0 2.1 〈코덱〉, 《위키백과》
- ↑ 〈코덱〉, 《위키피디아》
- ↑ 4.0 4.1 비비, 〈● 코덱이란 무엇인가?〉, 《네이버 블로그》, 2017-08-07
- ↑ HMG 저널, 〈생생한 블루투스 뮤직 스트리밍 음질의 비밀〉, 《네이버 포스트》, 2020-04-13
- ↑ kipoworld2, 〈인공지능 고음질 음성 코덱 구글 라이라(LYRA)〉, 《네이버 블로그》, 2021-05-25
참고자료
- 〈코덱〉, 《네이버 지식백과》
- 〈코덱〉, 《위키백과》
- 〈코덱〉, 《위키피디아》
- 비비, 〈● 코덱이란 무엇인가?〉, 《네이버 블로그》, 2017-08-07
- HMG 저널, 〈생생한 블루투스 뮤직 스트리밍 음질의 비밀〉, 《네이버 포스트》, 2020-04-13
- kipoworld2, 〈인공지능 고음질 음성 코덱 구글 라이라(LYRA)〉, 《네이버 블로그》, 2021-05-25
같이 보기