모달(modal)은 인공지능(AI) 시스템이 처리하는 데이터의 유형 또는 입력 방식을 나타내는 핵심 개념이다. 주로 모달리티(modality)와 관련이 있는데, 모달리티는 데이터의 종류 또는 입력 방식을 의미하며, 인공지능 시스템에서 처리하는 다양한 형태의 데이터를 지칭한다. 예를 들어, 모달리티는 텍스트, 이미지, 오디오, 비디오 등의 다른 유형의 데이터를 포함한다. 여러 유형의 데이터를 처리하는 것을 멀티모달이라고 부른다.
모달은 여러 맥락에서 사용될 수 있지만, 기본적으로 모달리티(modality)라는 개념과 밀접하게 연결된다. 그러나 모달 자체는 구체적으로 다음과 같은 두 가지 주요 분야에서 사용된다.
컴퓨터 과학 및 논리학[편집]
컴퓨터 과학에서 모달 논리(Modal Logic)는 가능성이나 필연성 같은 다양한 양식을 다루는 논리 체계다. 여기서 모달은 진리값이 단순히 "참"이나 "거짓"으로 결정되는 것이 아니라, 문장이 특정 조건 하에서 필수적으로 또는 가능하게 참일 수 있음을 의미한다. 모달 논리는 인공지능 분야에서 중요한 역할을 하며, 특히 지식 표현이나 추론 시스템에서 유용하게 사용된다. 예를 들어, AI 시스템이 어떤 정보가 "확실하다" 또는 "가능하다"와 같은 다양한 지식 상태를 표현할 때, 모달 논리를 사용하여 이를 수학적으로 정의하고 다룰 수 있다.
모달은 또한 사용자 인터페이스(UI)에서 중요한 용어로, 주로 모달 창(modal window) 또는 모달 대화 상자를 의미한다. 이 용어는 사용자가 특정 작업을 완료할 때까지 다른 인터페이스 요소들과 상호작용할 수 없도록 제한하는 팝업 창이나 경고 창을 말한다. 예를 들어, 파일을 저장하거나 삭제 여부를 묻는 창이 모달 창의 예시다. 이러한 모달 창은 사용자가 중요한 작업에 집중하도록 돕는다.[1]
단일모달 및 멀티모달[편집]
단일모달(Single-Modal)은 AI가 하나의 데이터 유형만 처리하는 경우를 의미한다. 예를 들어, 자연어 처리(NLP) 모델이 텍스트 데이터만 처리하는 것이 단일모달 시스템이다. 반면 멀티모달(Multi-Modal)은 AI가 두 개 이상의 데이터 유형을 동시에 처리할 수 있는 경우를 의미한다. 예를 들어, 텍스트와 이미지를 함께 분석하거나, 비디오와 오디오 데이터를 동시에 이해하는 시스템이 멀티모달 시스템이다. 모달리티는 특히 멀티모달 모델(Multimodal Model)에서 중요한 역할을 하며, 이러한 모델은 텍스트, 이미지, 음성 등 다양한 데이터 소스 간의 상호작용을 통해 더 풍부한 이해와 성능을 제공할 수 있다.[2]
참고자료[편집]
같이 보기[편집]
 이 모달 (프로그래밍) 문서는 인공지능 기술에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.
|
[접기]인공지능 : 인공지능 서비스, 인공지능 기술 □■⊕, 인공지능 로봇, 인공지능 기업, 인공지능 인물
|
|
인공지능 기술
|
AI 워싱 • 랭체인 • 로봇공학 • 로봇기술 • 인지과학 • 자동추론 • 자연어 처리 • 지능 • 지식표현 • 컴퓨터 비전 • 킬 스위치 • 튜링 테스트 • 프롬프트 • 프롬프트 엔지니어링
|
|
문자인식과 음성인식
|
ICR • OCR • OMR • URL • 감정 • 글자 • 단어 • 답변 • 대화 • 동영상 • 디자인 • 맥락 • 문단 • 문서 • 문자 • 문자인식 • 문자채팅 • 문장 • 발음 • 번역 • 분류 • 상담 • 소스코드 • 스토리 • 얼굴 • 얼굴인식 • 음성 • 음성채팅 • 음성인식(STT) • 음성합성(TTS) • 의미 • 이미지 • 인공어 • 인공지능 음성 • 자막 • 자연어 • 질문 • 채팅 • 출처 • 코드 • 코딩 • 텍스트 • 통번역 • 통역 • 파일 • 폴더 • 화상채팅 • 화자인식
|
|
인공지능 데이터
|
노드 • 데이터라벨러 • 데이터라벨링 • 데이터셋 • 돌마 • 레이블 • 벡터 • 벡터DB • 벡터공간 • 스칼라 • 시뮬레이션 • 엣지 • 임베딩 • 청크(Chunk) • 크라우드워커 • 토큰 • 토큰화
|
|
인공지능 학습
|
ADP • CoLLM • DALL-E • DDPG • DQN • LAM • LMM • SARSA • sLLM • SLM • 강화학습 • 거대언어모델(LLM) • 결정이론적 메타추론 • 계통적 강화학습 • 과적합 • 기억 • 단기기억 • 동적 계획법 • 딥러닝 • 딥큐러닝 • 머신러닝(기계학습) • 메타추론 • 모델 기반 강화학습 • 모델 프리 강화학습 • 미세조정(파인튜닝) • 반영식 아키텍처 • 비지도학습 • 사전학습 • 수시 알고리즘 • 어니 • 에이전트 • 인공지능 학습 • 자기지도학습 • 장기기억 • 전이학습 • 준지도학습 • 지도학습 • 추론 • 학습 • 훈련
|
|
인공지능 알고리즘
|
AGI • ANI • ASI • FFN • MHSA • RAG • ReLU 함수 • Seq2Seq • VLA • XAI • Word2Vec • 가중치 • 경사하강법 • 관계형 네트워크(RN) • 기울기 소실 • 뉴런 • 다층퍼셉트론 • 단층퍼셉트론 • 데이터마이닝 • 디코더 • 로지스틱 함수 • 리키 ReLU 함수 • 매개변수 • 미시 함수 • 방사신경망 • 볼츠만 머신 • 분산 샌드박스 • 비선형 함수 • 생성대립신경망(GAN) • 생성형 AI • 선형 함수 • 소프트맥스 함수 • 손실함수 • 수퍼얼라인먼트 • 순전파 • 순환신경망(RNN) • 스위시 함수 • 시그모이드 함수 • 신경망 • 신경망 구조 • 심층신경망(DNN) • 심층신뢰신경망(DBN) • 양방향 비고정값 암호 체계(TSID) • 어탠션 • 에이전트체인(CoA) • 역전파 • 역치 • 온도 • 원핫 • 은닉층 • 인공신경망(ANN) • 인공지능(AI) • 인코더 • 입력층 • 잔차신경망(레즈넷) • 제한 볼츠만 머신(RBM) • 전방전달신경망(FFNN) • 정렬위장 • 주의 메커니즘 • 초매개변수(하이퍼 파라미터) • 출력층 • 코헨 자기조직 신경망 • 탄젠트 함수 • 텍스트마이닝 • 트랜스포머 • 파이 • 퍼셉트론 • 하이퍼볼릭 탄젠트 함수(tanh) • 학습률 • 합성곱 신경망(CNN) • 확률분포 • 확률적 경사하강법 • 활성화 함수
|
|
계산복잡도
|
NP • NP-완전 • 계산복잡도 • 공간복잡도 • 시간복잡도 • 여 NP • 여 NP-완전
|
|
인공지능 프로그램
|
BCI • GPT • 딥블루 • 딥페이크 • 멀티모달 AI • 모달 • 모달리티 • 모달창 • 어니 • 알파고 • 알파고제로 • 알파폴드 • 왓슨 • 카페 • 컨트롤넷 • 텐서플로 • 텔레파시 • 토치 • 파이토치 • 한돌
|
|
인공지능 장비
|
GPU • 그래픽카드 • 레니게이드 • 반도체 • 엔비디아 • 엔비디아 A100 • 엔비디아 H100 • 엔비디아 H200 • 워보이 • 집적회로(칩)
|
|
인공지능 특징
|
결정이론 • 계산상의 합리성 • 논리학 • 논리주의자 • 분산성 • 불확실성 • 삼단논법 • 선호도 • 예측곤란성 • 완벽한 합리성 • 유계 합리성 • 이유 불충분의 원리 • 자율성 • 최대기대효용 • 할루시네이션 • 효용이론
|
|
인공지능 법적 지위
|
권리주체성 • 소버린 AI • 전자대리인 • 전자적 인간 • 책임법
|
|
위키 : 인공지능, 개발, 자동차, 교통, 지역, 지도, 산업, 기업, 단체, 업무, 생활, 쇼핑, 블록체인, 암호화폐, 인물, 행사, 일반
|
|