확률분포(Probability Distribution, 確率分布)는 확률변수 X가 특정한 값을 가질 확률을 나타내는 분포를 말한다.
확률분포는 확률변수가 가질 수 있는 모든 값과 그 값들이 나타날 확률을 수학적으로 표현한 개념이다. 이는 데이터 분석, 기계 학습, 통계적 추론 등 다양한 분야에서 필수적으로 사용되며, 실세계의 불확실성을 정량적으로 설명하는 역할을 한다. 확률분포는 크게 이산확률분포(discrete probability distribution)와 연속확률분포(continuous probability distribution)로 나뉜다.
확률분포란 간단하게 말해 확률변수 X의 함수라고 할 수 있다. 확률변수 X는 특정한 값을 가지게 되는데, 그 값을 가질 확률들은 일종의 함수와 같이 어떤 분포를 갖게 된다. 예를 들어 주사위를 3회 던졌을 때 그 중 짝수가 나오는 횟수를 확률변수 X라고 하자. 짝수가 0번 나올 수도 있고 1번 또는 2번, 3번까지 나올 수 있으므로 확률변수 X는 ‘0, 1, 2, 3’이라는 네가지 값을 취하게 된다. X가 각각의 값을 가질 확률을 계산하면 다음과 같다.
- X=0일 확률 P(X=0)
세 번 주사위를 던져 모두 홀수만 나와야 한다. 주사위의 여섯개의 눈 중에 세 개의 홀수가 나오므로 홀수가 나올 확률은 ½이다. 홀수가 세 번 나올 확률은 (1/2)³이다. 즉 P(X=0)=(1/2)³이다.
- X=1일 확률 P(X=1)
짝수가 한 번, 홀수가 두 번 나오는 경우이다. 짝수가 한 번 나올 확률은 ½, 홀수가 두 번 나올 확률은 (1/2)²이다. 여기에 짝수가 나오는 순서에 따라 (짝,홀,홀), (홀,짝,홀), (홀,홀,짝) 세 가지의 경우가 있을 수 있으므로 3을 곱해준다. 그러므로 P(X=1)=3·(1/2)(1/2)²=3·(1/2)³이다.
- X=2일 확률 P(X=2)
짝수가 두 번, 홀수가 한 번 나오는 경우이다. 짝수가 두 번 나올 확률은 (1/2)², 홀수가 한 번 나올 확률은 1/2이다. 또한 (짝,짝,홀),(짝,홀,짝),(홀,짝,짝) 세 가지의 경우가 있으므로 3을 곱한다. 그러므로 P(X=2)=3·(1/2)²(1/2)=3·(1/2)³이다.
- X=3일 확률 P(X=3)
세 번 모두 짝수가 나오는 경우이다. 즉 P(X=3)=(1/2)³이 된다.
이 확률분포 X에 대한 분포를 표로 나타내면 다음과 같다.
X
|
0
|
1
|
2
|
3
|
계
|
P
|
(1/2)³
|
3·(1/2)³
|
3·(1/2)³
|
(1/2)³
|
1
|
이렇게 확률변수 X가 특정값을 가질 확률을 나타내는 분포를 확률분포라 한다. 여기서는 확률분포를 표로 나타내었다. 확률분포는 확률변수의 성격에 따라 표나 그래프로 나타내기도 하며 일반적 함수처럼 식으로 나타내기도 한다.[1]
이산확률분포[편집]
이산확률분포는 이산확률변수 X가 가지는 확률분포를 말한다. 이산확률분포는 하나씩 셀 수 있으므로 이산확률분포표라는 표로 분포를 나타낸다. 또한 이산확률분포를 함수의 식 형태로 나타내면 확률질량함수라 한다. 이산확률분포는 확률변수가 유한하거나 셀 수 있는 개수의 값을 가질 때 적용된다. 예를 들어, 동전을 던져 앞면이 나올 확률이나 주사위를 굴려 특정 숫자가 나올 확률이 이에 해당한다. 대표적인 이산확률분포로는 베르누이 분포(Bernoulli distribution), 이항분포(Binomial distribution), 포아송 분포(Poisson distribution) 등이 있다. 베르누이 분포는 단일 시행에서 성공과 실패 두 가지 결과만 존재할 때 사용된다. 예를 들어, 동전을 한 번 던져 앞면이 나올 확률을 모델링할 수 있다. 이항분포는 여러 번의 독립적인 시행에서 성공 횟수를 나타낼 때 쓰인다. 예를 들어, 주사위를 10번 던졌을 때 6이 나오는 횟수를 예측할 수 있다. 포아송 분포는 일정한 시간이나 공간에서 특정 사건이 발생하는 횟수를 모델링하는 데 활용된다. 예를 들어, 특정 웹사이트에 매시간 접속하는 사용자 수를 예측하는 데 사용할 수 있다.
연속확률분포[편집]
연속확률분포는 확률변수가 연속적인 값을 가질 때 적용된다. 예를 들어, 특정 지역의 기온 변화나 고객의 대기 시간이 이에 해당한다. 대표적인 연속확률분포에는 정규분포(Normal distribution), 지수분포(Exponential distribution), 카이제곱 분포(Chi-square distribution), 감마 분포(Gamma distribution) 등이 있다. 정규분포는 평균을 중심으로 좌우 대칭적인 종 모양의 곡선을 가지며, 많은 자연현상에서 발견되는 중요한 확률분포이다. 지수분포는 특정 사건이 발생할 때까지의 시간을 모델링하는 데 사용된다. 예를 들어, 고객이 은행에서 대기하는 시간이 이에 해당할 수 있다. 감마 분포는 생존 분석이나 대기 시간 모델링과 같은 분야에서 사용된다. 카이제곱 분포는 주로 가설 검정에서 사용되며, 데이터의 분산을 평가하는 데 활용된다. 연속확률분포는 표가 아닌 함수식이나 그래프로 나타낼 수 있다.
주요 개념[편집]
확률분포를 이해하는 데 중요한 개념으로는 기댓값(expectation, mean), 분산(variance), 표준편차(standard deviation) 등이 있다.
- 기댓값: 확률분포에서 평균적인 값을 나타낸다. 예를 들어, 주사위를 던졌을 때 나올 수 있는 숫자의 평균은 3.5이다.
- 분산과 표준편차: 데이터의 흩어진 정도를 측정하는 척도로, 확률변수의 값들이 평균을 중심으로 얼마나 퍼져 있는지를 나타낸다.
- 확률밀도함수(PDF)와 누적분포함수(CDF): 연속확률분포에서 특정 구간 내 확률을 계산하는 데 필수적인 개념이다.
확률분포는 통계적 모델링과 기계 학습에서도 중요한 역할을 한다. 베이지안 추론(Bayesian inference)에서는 사전 확률(prior probability)과 사후 확률(posterior probability)을 계산하는 데 확률분포가 사용되며, 생성 모델(generative model)은 특정 확률분포를 따르는 데이터를 생성하는 데 활용된다. 예를 들어, 가우시안 혼합 모델(Gaussian Mixture Model, GMM)은 여러 개의 정규분포를 결합하여 데이터의 구조를 설명하는 데 사용되며, 변분 오토인코더(Variational Autoencoder, VAE)와 같은 딥러닝 모델에서도 확률분포를 활용하여 새로운 데이터를 생성한다.
최근 연구에서는 확률분포를 이용한 샘플링 기법과 최적화 기법이 활발하게 연구되고 있다. 마르코프 연쇄 몬테카를로(Markov Chain Monte Carlo, MCMC) 기법은 복잡한 확률분포에서 샘플을 추출하여 정밀한 확률적 추론을 가능하게 하며, 변분 추론(Variational Inference, VI) 은 MCMC보다 계산 효율성을 높이는 방향으로 발전하고 있다. 또한, 강화학습에서 정책 최적화를 위해 사용되는 확률적 정책 그라디언트(Stochastic Policy Gradient) 방법 역시 확률분포를 기반으로 동작한다.
참고자료[편집]
같이 보기[편집]
 이 확률분포 문서는 수학에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.
|
[접기]일반 : 자연, 시공간, 생물, 동물, 식물, 정치, 법률, 군사, 경제, 사회, 교육, 문화, 예술, 스포츠, 역사, 역사인물, 인간, 민족, 인체, 건강, 질병, 정신, 성격, 행동, 언어, 수학 □■⊕, 위키 도움말
|
|
수학
|
IMO • KMO • 공리 • 그래프이론 • 기하학 • 대수기하학 • 대수학 • 산수 • 산학 • 선형대수학 • 수식 • 수학 • 수학경시대회 • 수학자 • 양 • 위상수학 • 응용수학 • 이산수학 • 정의 • 조합론 • 집합론 • 필즈상 • 해석학 • 도움말:수학
|
|
수
|
0 • 1 • 2 • 3 • 4 • 5 • 6 • 7 • 8 • 9 • 10 • 경(1016) • 공배수 • 공약수 • 구(1032) • 구골(10100) • 구골뱅 • 구골플렉스 • 구골플렉시안 • 그레이엄수(G64(4)) • 기수 • 로마숫자 • 만 • 무량대수(1068) • 무리수 • 무한대(∞) • 무한소 • 배수 • 백 • 벡터 • 복소수 • 부동소수점 • 분모 • 분수 • 분자 • 사원수 • 서수 • 소수 (decimal) • 소수 (prime number) • 소수점 • 수 • 숫자 • 스칼라 • 승수 • 실수 • 십진수 • 아라비아숫자 • 약수 • 양(1028) • 양수 • 억 • 원주율(π) • 유리수 • 음수 • 이진수 • 자(1024) • 자연로그의 밑(e) • 자연수 • 정수 • 조(1012) • 지수 • 천 • 텐서 • 합성수 • 해(1020) • 행렬 • 허수(i) • 황금비(φ)
|
|
계산
|
! • ↑ • cos • f(x) • lim • log • sin • tan • ∑ • ∫ • 가감승제 • 값 • 결합법칙 • 계산 • 곱 • 곱셈 • 곱하기 • 공식 • 교환법칙 • 구간 • 구구단 • 극한 • 근 • 근사값 • 나누기 • 나눗셈 • 나머지 • 난이도 • 내림 • 다항식 • 답 • 더하기 • 덧셈 • 도함수 • 독립변수 • 등식 • 라마누잔합 • 로그 • 루트(√) • 리만가설 • 매개변수 • 매개변수 (수학) • 몫 • 무한급수 • 미분 • 미적분 • 미지수 • 반올림 • 발산 • 방정식 • 백분율 • 변수 • 부등식 • 분배법칙 • 비례식 • 비율 • 빼기 • 뺄셈 • 사칙연산 • 산수 • 삼각함수 • 삼차방정식 • 상수 • 상용로그 • 셈 • 수렴 • 수식 • 수열 • 시그모이드 함수 • 식 • 약분 • 역수 • 역함수 • 역행렬 • 연산 • 오일러 공식 • 오일러 등식 • 올림 • 이차방정식 • 인수 (수학) • 인수분해 • 자연로그 • 적분 • 전개 • 정답 • 정리 • 정의역 • 제곱 • 제곱근 • 종속변수 • 증명 • 지수 • 차수 • 천분율 • 치역 • 퍼센트(%) • 풀이 • 피타고라스 정리 • 함수 • 합 • 항 • 항등식 • 해
|
|
도형
|
각도 • 각뿔 • 곡면 • 곡선 • 구 • 그래프 • 길이 • 내심 • 넓이 • 높이 • 다각형 • 다면체 • 도형 • 둔각 • 둘레 • 마름모 • 면 • 면적 • 무게중심 • 반경 • 반구 • 반원 • 반지름 • 방심 • 변 • 부피 • 빗변 • 사각뿔 • 사각형 • 사다리꼴 • 삼각뿔 • 삼각형 • 선 • 선분 • 수심 • 쌍곡선 • 예각 • 오각형 • 외심 • 원 • 원기둥(원통) • 원뿔 • 원환체(도넛모양) • 육각형 • 위상 • 위상공간 • 위상수학 • 이등변삼각형 • 입체 • 점 • 점선 • 정사각형 • 정사면체 • 정삼각형 • 정오각형 • 정육각형 • 정육면체 • 정팔각형 • 정팔면체 • 좌표 • 좌표계 • 좌표축 • 좌표평면 • 중첩 • 지름 • 직각 • 직경 • 직사각형 • 직선 • 직육면체 • 차원 • 초입방체(하이퍼큐브) • 축 • 타원 • 테서랙트 • 팔각형 • 평면 • 평행사변형 • 포물선 • 호
|
|
집합
|
공집합(Ø) • 교집합(∩) • 무한집합 • 벤 다이어그램 • 부분집합(⊂) • 알레프수(ℵ) • 여집합 • 원소 • 유한집합 • 전체집합 • 집합 • 차집합 • 합집합(∪)
|
|
통계
|
경우의 수 • 공분산 • 기댓값 • 기하평균 • 모분산 • 모집단 • 모평균 • 분산 • 분포 • 사건 • 산술평균 • 산포도 • 상관관계 • 순열 • 신뢰구간 • 신뢰도 • 유의수준 • 전수조사 • 정규분포 • 조합 • 조화평균 • 중앙값 • 통계 • 통계학 • 편차 • 평균 • 표본 • 표본분산 • 표본조사 • 표본평균 • 표준편차(σ) • 최빈값 • 합계 • 확률 • 확률밀도함수 • 확률분포 • 회귀분석
|
|
수학자
|
갈릴레오 갈릴레이 • 게오르크 칸토어 • 고트프리트 빌헬름 라이프니츠 • 니콜로 폰타나(타르탈리아) • 다비트 힐베르트 • 레오나르도 피보나치 • 레온하르트 오일러 • 로널드 그레이엄 • 르네 데카르트 • 버트런드 러셀 • 베르너 하이젠베르크 • 베른하르트 리만 • 브룩 테일러 • 블레즈 파스칼 • 스리니바사 라마누잔 • 아르키메데스 • 아이작 뉴턴 • 알콰리즈미 • 앙리 푸앵카레 • 오거스터스 드 모르간 • 요하네스 케플러 • 요한 베르누이 • 유클리드(에우클레이데스) • 유휘 • 이순지 • 이임학 • 조제프-루이 라그랑주 • 조지 불 • 존 내시 • 존 네이피어 • 존 월리스 • 존 폰 노이만 • 지롤라모 카르다노 • 최석정 • 카를 프리드리히 가우스 • 토머스 베이즈 • 피에르 드 페르마 • 피타고라스 • 헤론 • 홍정하 • 히파르코스
|
|
기타
|
IMO • KMO • 국제수학연맹 • 세계수학자대회 • 올림피아드 • 필즈상
|
|
위키 : 인공지능, 개발, 자동차, 교통, 아시아, 세계, 산업, 기업, 단체, 업무, 생활, 지도, 블록체인, 암호화폐, 인물, 행사, 일반
|
|
[접기]인공지능 : 인공지능 서비스, 인공지능 모델 □■⊕, 인공지능 데이터, 인공지능 개발, 인공지능 기술, 인공지능 로봇, 인공지능 기기, 인공지능 기업, 인공지능 인물, 인공지능 역사
|
|
인공지능 모델
|
CAG • FFN • GPT • GRU • GTE • GTR • ILSVRC • LAM • LMM • MCP • MHSA • NER • RAG • RoBERTa • SARSA • Seq2Seq • SLM • T5 • TTT • Vec2Vec • VGG넷 • Word2Vec • 거대언어모델(LLM) • 결정트리모델 • 그래프 신경망(GNN) • 다층퍼셉트론 • 단층퍼셉트론 • 레즈넷(ResNet, 잔차신경망) • 랜덤 포레스트 • 르넷(LeNet) • 모바일넷 • 방사신경망 • 버트(BERT) • 베이지안 신경망 • 볼츠만 머신 • 비전 트랜스포머(ViT) • 비트넷 • 사이클 GAN • 상태공간모델(SSM) • 생성대립신경망(GAN) • 생성형 AI • 샴 네트워크 • 순환신경망(RNN) • 스타일 GAN • 신경 • 신경기계번역(NMT) • 신경망 • 신경망 구조 • 심층신경망(DNN) • 심층신뢰신경망(DBN) • 알렉스넷 • 앙상블 • 언어모델 • 예측모델 • 워드넷 • 이미지넷 • 인공신경망(ANN) • 장단기기억 네트워크(LSTM) • 제한 볼츠만 머신(RBM) • 전방전달신경망(FFNN) • 카페 • 코헨 자기조직 신경망 • 통계적 기계번역(SMT) • 트랜스포머 • 퍼셉트론 • 합성곱 신경망(CNN) • 홉필드 네트워크
|
|
인공지능 알고리즘
|
DDPG • DQN • K-NN 알고리즘 • K-평균 클러스터링 • RMSprop • VAE • VLA • 결정이론적 메타추론 • 결정트리 • 경사하강법 • 관계형 네트워크(RN) • 기울기 • 기울기 소실 • 기울기 폭발 • 뉴런 • 동적 계획법 • 디퓨전 모델 • 랜덤포레스트 • 레이어 정규화 • 마스킹 • 매개변수 • 멀티헤드 셀프어텐션 • 멀티헤드 어텐션 • 멀티헤드 잠재 어텐션(MLA) • 메타추론 • 모멘텀 • 미니배치 경사하강법 • 반영식 아키텍처 • 배깅 • 배치 경사하강법 • 배치 정규화 • 병렬분산처리(PDP) • 복잡도 • 부스팅 • 분산 샌드박스 • 셀프어텐션 • 수시 알고리즘 • 수퍼얼라인먼트 • 순전파 • 스태킹 • 아담(Adam) • 아담W • 양방향 비고정값 암호 체계(TSID) • 어텐션(주의 메커니즘) • 에이전트체인(CoA) • 역전파 • 역치 • 온도 • 욜로(YOLO) • 은닉층 • 인공지능(AI) • 인코더-디코더 어텐션 • 입력층 • 자비에르 초기화 • 잔차연결 • 잠재 디리클레 할당(LDA) • 잠재의미분석 • 장기의존성문제 • 정렬위장 • 주성분 분석(PCA) • 초기가중치 • 초매개변수(하이퍼 파라미터) • 출력층 • 층위 • 텍스트마이닝 • 파이 • 페이스넷 • 학습률 • 허 초기화(He 초기화) • 확률분포 • 확률적 경사하강법
|
|
인공지능 함수
|
GELU 함수 • ReLU 함수(렐루함수) • 가중치 • 가중합 • 거리 • 결과값 • 계단함수(스텝함수) • 교란변수 • 균등분포 • 노름 • 다중회귀분석 • 독립변수 • 로그함수 • 로지스틱 함수 • 로짓변환 • 리키 ReLU 함수 • 맨해튼 거리 • 몬테카를로 방법 • 미분 • 미시함수 • 미적분 • 민코프스키 거리 • 베이즈 정리 • 베이지안 추론 • 볼록함수 • 분산 • 비선형함수 • 빅-오 표기법 • 사인(sin) • 사전확률 • 사후확률 • 삼각함수 • 선형변환 • 선형함수 • 소프트맥스 함수 • 손실 • 손실함수 • 스위시 함수 • 시그모이드 함수 • 안장점 • 에너지 함수 • 연결함수(Concat 함수) • 연속변수 • 오목함수 • 웨이블릿 변환 • 유클리드 거리 • 이산변수 • 입력값 • 자카드 거리 • 적분 • 전이함수 • 정규분포 • 정규화 • 종속변수 • 지수함수 • 체비셰프 거리 • 체인룰 • 최소제곱법 • 출력값 • 코사인(cos) • 코사인 거리 • 코사인 유사도 • 탄젠트(tan) • 탄젠트 함수 • 통계 • 편미분 • 편향 • 평균절대오차 • 평균제곱근오차 • 평균제곱오차 • 표준편차 • 푸리에 변환 • 하이퍼볼릭 탄젠트 함수(tanh) • 합성곱 • 합성함수 • 확률 • 활성화 함수 • 후버손실함수
|
|
위키 : 인공지능, 개발, 자동차, 교통, 아시아, 세계, 산업, 기업, 단체, 업무, 생활, 지도, 블록체인, 암호화폐, 인물, 행사, 일반
|
|