검수요청.png검수요청.png

미드저니

위키원
sosodam (토론 | 기여)님의 2024년 8월 29일 (목) 18:14 판
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)
이동: 둘러보기, 검색
미드저니(Midjourney)

미드저니(Midjourney)는 인공지능(AI) 기반의 이미지 생성 도구로, 사용자가 입력한 텍스트 프롬프트에 따라 AI가 이미지를 생성하는 기능을 제공한다. 이 도구는 기계 학습과 인공지능 기술을 활용하여, 사용자가 원하는 이미지를 창출하는 데 도움을 준다.

아사달 스마트 호스팅 가로 배너 (since 1998).jpg
이 그림에 대한 정보
[아사달] 스마트 호스팅

개요

미드저니는 텍스트 투 이미지 방식의 AI 이미지 생성 도구로, 사용자가 입력하는 프롬프트에 따라 다양한 이미지를 생성하는 서비스를 제공한다. 광고, 마케팅, 게임, 건축 인테리어, 데이터 시각화 등 다양한 분야에서 널리 활용되고 있으며, 2023년에만 약 2억~3억 달러에 달하는 매출을 기록하며 AI 이미지 생성 시장에서 강력한 입지를 다지고 있다. 초기에는 미드저니가 디스코드를 통해서만 접근할 수 있는 방식으로 운영되어 많은 사용자들이 불편함을 느꼈다. 이러한 피드백을 반영하여 2023년 말, 미드저니는 전용 웹사이트(midjourney.com)를 개설하여 사용자들의 접근성을 높였다. 그러나 이 웹사이트는 처음에는 최소 1만 개의 이미지를 생성한 사용자만 이용할 수 있었고, 이 점 또한 이용자들 사이에서 불편함을 초래했다. 2024년 8월 21일부터는 이러한 제한이 완화되어 일반 사용자들도 미드저니의 웹사이트에 접근할 수 있게 되었다. 미드저니는 AI 이미지 생성 도구로서 사용자의 창의성을 확장시키는 동시에, 다양한 분야에서 활용 가능성을 넓혀가고 있다. 이를 통해 사용자들은 빠르고 효율적으로 고품질의 이미지를 생성하고, 이를 다양한 목적에 활용할 수 있다.[1][2]

이용방법

웹사이트에 접속하여 구글이나 디스코드 계정으로 회원가입을 하면, 무료로 25개의 AI 생성 이미지를 만들어볼 수 있다. 디스코드를 통해 이미 이미지를 만들어본 이용자들은 해당 계정으로 접속해 과거 생성한 이미지를 확인할 수 있으며, 구글 계정과 병합하여 두 계정 중 하나로 로그인할 수 있다. 웹사이트에 로그인하면 상단에 프롬프트 입력창이 표시되며, 여기에서 원하는 이미지를 생성하기 위해 여러 단어와 문장을 쉼표(,)로 구분하여 입력할 수 있다. 입력된 프롬프트를 기반으로 약 30초 내에 기본 이미지 4개가 생성되며, 사용자는 이 이미지를 보정하거나 확대, 축소, 업스케일링할 수 있다. 프롬프트는 영어로 입력하는 것이 가장 정확한 결과를 도출하지만, 한글로도 입력이 가능하다. 다만, 한글 프롬프트는 의도와 다소 다른 이미지를 생성할 가능성이 있다. 생성된 이미지는 즉시 다운로드할 수 있으며, 사이트에 업로드하여 다른 사용자들과 공유할 수도 있다. 또한, 채팅방을 통해 생성된 이미지에 대해 의견을 나눌 수도 있다. 무료로 제공되는 이미지 25개를 모두 사용한 후에는 유료 요금제를 통해 서비스를 계속 이용할 수 있다. 요금제는 월 10달러의 베이직 플랜을 시작으로, 스탠더드, 프로, 메가 등 다양한 옵션이 제공된다.[2]

요금제

미드저니는 네 가지 구독 플랜을 제공한다. 모든 요금제에서는 미드저니에서 생성한 이미지를 평가하여 추가 GPU 구동 시간을 무료로 얻을 수 있다. 연간 약정 시 20% 할인 혜택도 제공한다.

  • 기본(월 10달러) : 3.3시간의 빠른 GPU 시간, 휴식 시간 없음
  • 스탠다드(월 30달러) : 빠른 GPU 시간 15시간, 휴식 시간 무제한
  • 프로(월 60달러) : 빠른 GPU 30시간, 무제한 휴식 시간, 스텔스 모드(비공개 이미지)
  • 메가(월 120달러) : 빠른 GPU 60시간, 무제한 휴식 시간, 스텔스 모드(비공개 이미지)[3]

니지저니

니지저니(Niji Journey)는 미드저니가 일본 게임사 시지기 스튜디오(Sizigi Studio)와 협력하여 개발한 모바일 애플리케이션으로, 애니메이션 스타일의 이미지 생성에 특화되어 있다. 니지저니는 미드저니의 '니지'라는 애니메이션 스타일을 기반으로 이미지를 생성하며, 이를 통해 일본 내에서 애니메이션 팬들과 일반 사용자들에게 큰 인기를 끌고 있다. 이 앱은 기존 미드저니와 마찬가지로 프롬프트를 입력하여 이미지를 생성할 수 있지만, 애니메이션 스타일에 특히 초점을 맞추고 있다. 만약 사용자가 애니메이션 스타일이 아닌 이미지를 생성하고 싶을 경우, 앱 설정에서 'v5'를 선택해 미드저니의 기존 버전 5를 통해 다양한 예술 스타일에 접근할 수 있다. 니지저니는 안드로이드와 iOS 앱으로 모두 이용 가능하며, 구글 플레이스토어와 애플 앱스토어에서 무료로 다운로드할 수 있다. 또한, 인앱 결제를 통해 추가 기능을 이용할 수 있으며, 기존 미드저니 사용자들은 디스코드 계정으로 로그인하여 추가 비용 없이 니지저니를 사용할 수 있다. 이 앱은 전문가뿐만 아니라 일반 사용자들에게도 접근성을 넓히려는 미드저니의 전략의 일환으로, 앞으로 더욱 많은 사용자들이 애니메이션 스타일의 이미지를 생성하는 데 니지저니를 활용할 것으로 기대된다.[4]

한계

미드저니는 AI 기반의 이미지 생성 도구로, 사용자가 입력하는 프롬프트에 따라 다양한 예술 이미지를 생성할 수 있다. 그러나 이 도구에도 한계가 존재한다. 특히, 단순한 흰색 배경 이미지를 생성하는 데 어려움을 겪는 것이 대표적인 한계로 지적된다. 미국의 데이터 과학자 코디 내쉬(Cody Nash)의 실험 결과에 따르면, 미드저니와 다른 이미지 생성 AI들이 '흰색만 있는 이미지'를 생성하는 프롬프트 요청에 대해 정확한 결과를 도출하지 못하는 경우가 많았다. 예를 들어, '완전히 흰색인 이미지'를 생성해달라는 요청을 받았을 때, 미드저니는 순수한 흰색 배경을 생성하는 대신, 불규칙한 무늬가 섞인 배경을 만들어내는 경우가 많았다. 이러한 한계는 AI 이미지 생성기에 일반적으로 사용되는 '확산 모델(Diffusion Model)'의 특성에서 기인한다. 확산 모델은 이미지 생성 과정에서 처음에는 모호하고 흐릿한 노이즈 상태로 시작해 점차 선명하고 사실적인 이미지로 다듬어지는데, 이 과정에서 모든 픽셀을 완벽하게 흰색으로 만드는 것이 어려워진다. 이로 인해 단순한 색상의 배경을 요청할 때도 복잡한 무늬나 패턴이 추가되는 경향이 있다. 또한, 미드저니는 언어모델을 기반으로 프롬프트에 가장 적합한 다음 단어를 예측하는 방식으로 훈련되었기 때문에, 완전히 추상적이거나 단순한 이미지 생성 요청에 대해 정확한 답을 제공하는 데 한계가 있다.[5]

논란

아티스트 집단 고소

미드저니의 가장 큰 논란 중 하나는 이 AI가 훈련에 사용한 예술 작품 데이터셋에 관한 것이다. 2024년 1월 3일, 외신에 따르면 미드저니의 훈련에 사용된 것으로 보이는 예술 작품의 아티스트 목록이 공개되었으며, 이 목록에는 약 1만 6천 명의 작가가 포함되었다. 파블로 피카소, 반 고흐, 앤디 워홀 등 역사적으로 중요한 예술가들의 작품이 AI 모델의 훈련 과정에서 사용된 것으로 나타났다. 이로 인해 해당 예술가들의 저작권 문제와 창작물의 무단 사용에 대한 논란이 일어났다. 이 데이터셋은 2023년 1월에 처음 제기된 미드저니, 스태빌리티AI(Stability AI), 그리고 디비언트아트(DeviantArt)를 대상으로 한 집단 소송의 일환으로 확인된 것이다. 소송에 참여한 아티스트들은 자신들의 작품이 AI 모델에 무단으로 사용된 것에 대해 법적 대응을 준비하고 있으며, 일부 작가들은 법적 대리인을 구할 것을 권고하기도 했다.[6]

창작성 논쟁

2022년 '콜로라도 주립박람회 미술대회'에서 미드저니로 생성된 이미지가 디지털 아트 부문에서 1위를 차지한 사건이다. 제이슨 앨런(Jason Allen)이 미드저니를 통해 생성한 '스페이스 오페라 극장'이라는 작품이 1등을 차지하며, AI가 만든 작품이 인간이 만든 작품과 같은 평가를 받을 수 있는지에 대한 뜨거운 논쟁을 불러일으켰다. 예술계에서는 AI로 생성된 이미지가 창작물로 인정받아도 되는지, 그리고 그 과정에서 AI의 역할과 인간의 역할을 어떻게 구분할 것인가에 대한 의견이 분분하다. AI가 창작의 영역에 들어서는 것이 예술의 진화를 의미하는지, 아니면 창작의 본질을 훼손하는 것인지에 대해 논의가 계속되고 있다. 일부는 AI를 통한 창작이 기술 혁신의 결과로 예술의 새로운 경계를 확장하는 것이라고 주장하는 반면, 다른 이들은 AI가 예술적 가치를 약화시킬 수 있다는 우려를 표명하고 있다. 이처럼 미드저니는 놀라운 기술적 성과에도 불구하고, AI의 창작 영역 진입과 관련된 윤리적, 법적 논쟁의 중심에 서 있다. 앞으로 이 논란들이 어떻게 해결될지, 그리고 AI와 예술의 관계가 어떻게 발전할지에 대한 관심이 높아지고 있다.[7]

비교

미드저니, 달리(DALL·E), 그리고 스테이블 디퓨전(Stable Diffusion)은 현재 이미지 생성 인공지능 분야에서 주목받고 있는 세 가지 대표적인 플랫폼이다. 이들 각각은 고유의 기능과 강점을 지니고 있으며, 다양한 사용자층에 걸맞은 서비스를 제공한다. 이 세 가지 AI 도구를 비교하고, 각 플랫폼이 제공하는 기능과 차이점은 다음과 같다.

미드저니

미드저니는 예술성에 특화된 이미지 생성 AI로, 주로 창의적인 비주얼을 필요로 하는 아티스트나 디자이너들에게 인기를 끌고 있다. 텍스트 프롬프트를 입력하면 해당 내용에 맞는 이미지를 생성해주며, 특히 추상적이고 감각적인 이미지 생성에 강점을 보인다. 미드저니는 복잡한 예술적 스타일을 구현하는 데 탁월하며, 다양한 텍스처, 색상, 형태를 조합해 고유한 시각적 경험을 제공한다. 미드저니는 특히 정교하고 독창적인 비주얼 표현에 강하다. 예술적 감각이 필요한 분야, 예를 들어 광고, 마케팅, 게임, 건축 인테리어 디자인에서 널리 사용된다. 사용자들이 특정 분위기나 스타일을 원할 때 매우 효과적이다. 창의적인 이미지 생성에 강하며, 특히 사용자 맞춤형 비주얼을 필요로 하는 경우 강력한 도구가 될 수 있다. 복잡하고 예술적인 디자인을 생성하는 데 탁월하다. 단순한 이미지 생성, 특히 흰색 배경이나 단순한 색상 패턴 같은 간단한 이미지 생성에는 약점을 보인다. 또한, 그 특유의 예술적 스타일이 모든 상황에 맞지 않을 수 있으며, 일부 사용자는 너무 추상적이라는 평가를 하기도 한다.

달리

달리는 오픈AI(OpenAI)가 개발한 이미지 생성 AI로, 특히 현실적이고 구체적인 이미지를 생성하는 데 강점을 지닌다. 달리는 명확한 사물이나 장면을 텍스트로 묘사하면 그에 상응하는 이미지를 만들어내는 능력이 뛰어나다. 달리는 텍스트 프롬프트를 기반으로 실물에 가까운 이미지를 생성하는 데 강하다. 가령, "해변에서 일몰을 보는 고양이" 같은 프롬프트를 입력하면, 이를 기반으로 사실적인 이미지를 생성한다. 또한, 다양한 스타일의 이미지를 생성할 수 있는 기능도 갖추고 있다. 달리는 오픈AI의 API를 통해 접근할 수 있으며, 사용자는 다양한 프롬프트를 입력해 이미지를 생성할 수 있다. 이 과정에서 사용자는 특정 세부 사항이나 스타일을 지정하여 이미지 결과물을 맞춤화할 수 있다. 구체적이고 사실적인 이미지 생성에 강하며, 다양한 스타일의 이미지를 구현할 수 있다. 특히 실용적인 목적을 위한 이미지 생성에 적합하다. 또한, 달리는 다양한 언어를 지원하여 글로벌 사용자들에게 폭넓게 사용되고 있다. 달리는 예술적 표현보다는 실용적인 이미지 생성에 초점을 맞추고 있기 때문에, 미드저니와 같은 고유의 예술적 스타일을 구현하는 데는 한계가 있다. 사용자가 원하지 않는 요소가 이미지에 포함되거나, 프롬프트와 약간 동떨어진 결과물이 나올 수도 있다.

스테이블 디퓨전

스테이블 디퓨전은 스태빌리티 AI(Stability AI)가 개발한 오픈 소스 이미지 생성 모델로, 강력한 커스터마이징 기능과 높은 유연성을 제공한다. 이 AI 모델은 사용자들이 로컬 환경에서 직접 실행할 수 있어, 개인 맞춤형 이미지 생성과 연구 개발에 적합하다. 스테이블 디퓨전은 텍스트 프롬프트뿐만 아니라, 사용자가 원하는 이미지의 특정 부분을 수정하거나, 여러 이미지를 합성하는 등의 고급 기능을 제공한다. 오픈 소스 프로젝트로서, 다양한 커뮤니티의 지원을 받고 있으며, 사용자가 모델을 커스터마이즈하거나 확장할 수 있다. 사용자는 모델을 다운로드하여 자신의 로컬 컴퓨터에서 실행할 수 있다. 이를 통해 사용자는 인터넷에 연결되지 않은 상태에서도 이미지 생성이 가능하며, 데이터 보안 측면에서 더 유리하다. 또한, 다양한 플러그인과 확장 기능을 통해 사용자 경험을 향상시킬 수 있다. 스테이블 디퓨전은 높은 유연성과 확장성을 제공하며, 사용자가 모델을 직접 조정하거나 새로운 기능을 추가할 수 있다는 점에서 강력하다. 특히, 개인 연구자나 개발자들이 다양한 실험을 진행하기에 적합하다. 또한, 로컬 환경에서 실행 가능하다는 점은 데이터 프라이버시를 중시하는 사용자들에게 큰 장점으로 작용한다. 로컬에서 실행하기 때문에, 모델의 성능은 사용자의 하드웨어에 크게 의존한다. 고성능 하드웨어가 필요할 수 있으며, 초보자에게는 설치나 설정 과정이 다소 복잡할 수 있다. 또한, 미드저니나 달리와 비교했을 때 초기 사용자 경험이 다소 부족할 수 있다.

미드저니, 달리, 스테이블 디퓨전은 각기 다른 강점과 특징을 가지고 있으며, 사용자의 필요에 따라 선택할 수 있는 다양한 옵션을 제공한다. 미드저니는 예술적이고 창의적인 이미지를 필요로 하는 사용자를 위한 최적의 선택이며, 달리는 현실적이고 구체적인 이미지 생성에 강점을 지니고 있다. 스테이블 디퓨전은 유연성과 확장성을 중시하는 사용자에게 적합하며, 특히 개인화된 환경에서의 이미지 생성이 필요할 때 유용하다. 이러한 차이점들을 고려하여, 자신의 목적에 맞는 도구를 선택하는 것이 중요하다.

각주

  1. 남혁우 기자, 〈"이미지 이어 가상환경 생성"…미드저니, 하드웨어 사업 진출〉, 《지디넷코리아》, 2024-08-29
  2. 2.0 2.1 정병일 기자, 〈AI 이미지 생성하는 '미드저니', 25개 무료 제공〉, 《뉴스프리존》, 2024-08-23
  3. Viktor Eriksson, Joel Lee, 〈AI 이미지 생성 도구 미드저니, 일반 공개 및 구독 요금제 발표〉, 《아이티월드》, 2024-08-26
  4. 박찬 기자, 〈미드저니, 첫 모바일 앱 출시...저변 확대 시동〉, 《AI타임스》, 2023-10-20
  5. 박찬 기자, 〈미드저니·달리, 평범한 흰색 이미지 생성이 의외로 어려워〉, 《AI타임스》, 2024-04-02
  6. 김미정 기자, 〈AI 이미지 생성기 미드저니 논란...피카소부터 워홀까지 1만6천명 작가 활용〉, 《지디넷코리아》, 2024-01-04
  7. 김영주 기자, 〈AI 화가의 우승…시대의 흐름인가, 예술의 사망인가〉, 《중앙일보》, 2022-09-05

참고자료

같이 보기


  질문.png 이 문서는 로고 수정이 필요합니다.  

  검수요청.png검수요청.png 이 미드저니 문서는 인공지능 서비스에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.