group by

group by는 SQL에서 동일한 값을 가진 행들을 그룹화하여 집계 함수와 함께 사용되는 절이다. 데이터를 특정 기준으로 분류하고 각 그룹에 대한 통계를 계산할 때 유용하다.

개요[편집]

group by는 SQL에서 레코드를 하나 이상의 컬럼 값을 기준으로 그룹화할 때 사용하는 명령어이다. 일반적으로는 집계 함수(aggregate function)랑 함께 사용된다.

쉽게 말해서, group by는 "비슷한 애들끼리 묶어서 통계를 내줘"라고 하는 명령어이다.

기본 문법[편집]

SELECT 컬럼1, 집계함수(컬럼2)
FROM 테이블명
GROUP BY 컬럼1;

예를 들어 sales라는 테이블이 있고, 여기에는 region(지역)과 amount(판매금액)이라는 컬럼이 있다고 해보자.

SELECT region, SUM(amount)
FROM sales
GROUP BY region;

이 쿼리는 지역별로 판매금액의 총합을 구하는 것이다. region이 같으면 같은 그룹으로 묶고, 각 그룹에 대해 SUM(amount)를 계산한다.

동작원리[편집]

먼저 from 절에 있는 테이블에서 데이터를 불러온다.
where 절이 있다면 조건에 맞는 행만 필터링한다.
group by 절이 실행돼서, 지정한 컬럼 값이 같은 것들끼리 묶어준다.
select 절에 있는 집계 함수가 각 그룹에 대해 계산된다.
order by가 있으면 그 결과를 정렬한다.

주요 특징[편집]

그룹화 기준: 지정한 컬럼 값이 같은 행들을 하나의 그룹으로 묶음
집계 함수와 함께 사용: COUNT, SUM, AVG, MAX, MIN 등과 함께 작동
having 절과 연동: 그룹화된 결과에 대한 필터링 가능

사용 예제[편집]

기본 사용법

-- 부서별 직원 수 계산
SELECT department, COUNT(*) as employee_count
FROM employees
GROUP BY department;

다중 컬럼 그룹화

-- 부서별, 직급별 평균 급여
SELECT department, position, AVG(salary) as avg_salary
FROM employees
GROUP BY department, position;

HAVING 절 사용

-- 평균 급여가 500만원 이상인 부서만 조회
SELECT department, AVG(salary) as avg_salary
FROM employees
GROUP BY department
HAVING AVG(salary) >= 5000000;

자주 쓰이는 집계 함수[편집]

group by는 보통 다음 집계 함수들과 함께 사용된다

COUNT() : 항목 수
SUM() : 합계
AVG() : 평균
MAX() : 최댓값
MIN() : 최솟값

예:

SELECT department, COUNT(*)
FROM employees
GROUP BY department;
→ 부서별 직원 수를 계산

group by와 order by의 차이[편집]

group by는 데이터를 묶기 위한 것이고,
order by는 결과를 정렬하기 위한 것이다

둘은 함께 자주 쓰이지만, 목적이 다르다.

SELECT department, COUNT(*) as emp_count
FROM employees
GROUP BY department
ORDER BY emp_count DESC;

부서별 직원 수를 계산하고, 직원 수 기준으로 내림차순 정렬.

주의사항[편집]

select 절에 포함된 컬럼은 group by 절에 명시되거나 집계 함수로 감싸져야 함
where 절은 그룹화 전에 필터링, having 절은 그룹화 후에 필터링
NULL 값도 하나의 그룹으로 처리됨

성능 고려사항[편집]

그룹화할 컬럼에 인덱스가 있으면 성능 향상
그룹화 기준 컬럼 수가 많을수록 성능 저하 가능성
대량 데이터 처리 시 메모리 사용량 증가

같이 보기[편집]

이 Group by 문서는 데이터에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.

[접기]개발 : 프로그래밍, 소프트웨어, 데이터^□^■^⊕, 솔루션, 보안, 하드웨어, 컴퓨터, 사무자동화, 인터넷, 모바일, 사물인터넷, 게임, 메타버스, 디자인

데이터	ACID • CRUD • CSV • DAO • DB • DBMS • DB 명령어 • DCL • DDL • DML • DTO • ERD • ETL • JDBC • JPA • LOD • MDM • ODBC • ORM • RDBMS • RDF • SQL • 가상 데이터베이스 • 관계형 데이터베이스 • 그래프 • 기본키(PK) • 내부조인 • 널 • 노드 • 다이어그램 • 대리키 • 대체키 • 데이터 • 데이터댐 • 데이터 레이크 • 데이터마트 • 데이터 모델링 • 데이터뱅크 • 데이터베이스(DB) • 데이터베이스 언어 • 데이터 사이언스 • 데이터 사전 • 데이터 웨어하우스 • 데이터 정의어(DDL) • 데이터 제어어(DCL) • 데이터 조작어(DML) • 데이터 클러스터 • 데이터 토큰 (문자열) • 데이터 통합 • 덱 • 디비서버 • 라이트조인 • 락 • 레코드 • 레프트조인 • 로그 • 로그파일 • 로깅 • 롤백 • 리두로그 • 릴레이션 • 마스터데이터 • 마스터데이터관리(MDM) • 마이그레이션 • 메타데이터 • 배열 • 뷰 • 빅데이터 • 서브쿼리 • 수퍼키 • 순차리스트 • 스키마 • 스택 • 슬로우쿼리 • 엔티티 • 역정규화 • 연결리스트 • 외래키(FK) • 외부조인 • 인덱스 • 인덱싱 • 인젝션 • 자료구조 • 정규화 • 정보 • 조인 • 커밋 • 쿼리 • 큐 • 키 • 타깃 • 테이블 • 튜플 • 트랜잭션 • 트리 • 트리거 • 티비마이그레이터 • 풀조인 • 프로시저 • 필드 • 해시 • 해시맵 • 해시태그 • 해시테이블 • 해시함수 • 해싱 • 후보키

데이터베이스 관리 시스템 (DBMS)	관계형 데이터베이스 관리 시스템(RDBMS) • 노에스큐엘(NoSQL) • 데이터베이스 관리 시스템(DBMS) • 더비 • 디비투(DB2) • 레디스 • 마리아디비(MariaDB) • 마이에스큐엘(MySQL) • 몽고디비 • 빅테이블 • 사이베이스 • 선디비 • 알티베이스 • 액세스 • 에스큐엘(SQL) • 에스큐엘라이트(SQLite) • 에이치베이스 • 엠에스에스큐엘(MS-SQL) • 오라클(Oracle) • 인터베이스 • 인포믹스 • 카산드라 • 카우치디비 • 큐브리드 • 티베로 • 파이어버드 • 포스트그레스큐엘(PostgreSQL) • 하이퍼테이블

DB 명령어	alter • array • create • delete • drop • from • full join • grant • group by • having • inner join • insert • join • left join • null • order by • outer join • rename • revoke • right join • select • truncate • update • where

시스템 연계	API • CGI • EAI • ESB • JPA • RSS • SOA • SOAP • SSL • SSO • web3.js • XML • 디비투디비(DB-to-DB) • 레스트풀(RESTful) • 상호운용성 • 시스템 인터페이스 • 신디케이션 API • 오픈 API • 웹 API • 웹개방성 • 윈도우 API • 자바 API • 크롤링 • 프라이빗 API

위키 : 인공지능, 개발, 자동차, 교통, 아시아, 세계, 산업, 기업, 단체, 업무, 생활, 지도, 블록체인, 암호화폐, 인물, 행사, 일반

위키원

이름공간

변수

보기

더 보기

검색