9장 데이터 요약

그룹 함수 사용하기

SQL은데이터를 가져오지 않고 요약해야 할 때를 위해 그룹 함수라는 특별한 함수를 제공한다. 그룹 함수는 분석이나 보고를 목적으로 데이터를 가져올 수 있다. 다음과 같은 상황에서 사용한다.

  • 테이블에 있는 행의 수 확인

  • 테이블에 있는 여러 행의 합계 확인

  • 테이블에서 가장 큰 값, 작은 값, 평균 값 확인

위와 같은 상황에서 필요한 것은 데이터의 요약 정보이다.

SQL은 다섯 개의 그룹 함수 기능을 지원한다. (대다수의 DBMS에서 비슷하게 지원함)

함수
설명

AVG()

열의 평균값 반환

COUNT()

열에 있는 행의 개수 반환

MAX()

열의 최댓값 반환

MIN()

열의 최솟값 반환

SUM()

열의 합계 반환

AVG() 함수

행의 수와 합을 계산해 특정 열의 평균값을 반환한다. 또 모든 열의 평균값을 구하거나 특정 열 또는 평균값을 구할 수 있다.

prod_price 평균값 반환
vend_id가 'DLL01'인 제품의 평균값 반환

AVG()는 숫자열 하나의 평균값을 구하는데 사용할 수 있으며, 매개변수로 열 이름을 적어주어야 한다. 여러 열에 대한 평균값을 얻고 싶다면, 여러 AVG() 함수를 사용해야 한다.

COUNT() 함수

행의 개수를 세는 함수이다. 테이블에 있는 행의 수나 지정한 조건을 만족하는 행의 수를 구할 수 있다.

COUNT()는 2가지 방법으로 사용할 수 있다.

  • 테이블에 있는 모든 행의 수를 세기 위해 COUNT(*)를 사용한다. NULL 값을 포함한 모든 행의 수를 센다.

  • 지정한 열에 있는 모든 행의 수를 세기 위해 COUNT(열 이름)을 사용한다. NULL 값을 가진 행은 무시된다.

NULL을 포함한 모든 행의 수
NULL을 제외한 특정 행의 수

MAX() 함수

지정한 열에서 가장 큰 값을 반환한다. 열 이름을 명시해야 한다.

prod_price에서 가장 큰 값 반환

MIN() 함수

지정한 열에서 가장 작은 값을 반환한다. 열 이름을 명시해야 한다.

prod_price에서 가장 작은 값 반환

MAX()와 MIN()은 보통 숫자나 날짜 데이터에서 가장 크거나 작은 값을 구하기 위해 사용한다.

문자열 데이터에서 사용하면 정렬된 열의 마지막 / 처음에 있는 행을 가져온다.

SUM() 함수

지정한 열의 합을 구한다.

order_num이 20005인 quantity를 모두 더한 값 반환
order_num이 20005인 제품의 총액 반환

중복되는 값에 대한 그룹 함수

다섯 그룹 함수 모두 두 가지 방법으로 사용 가능하다.

  • ALL을 명시하거나 키워드 없이 사용하면 모든 행에 대해 계산을 수행한다.

  • 중복되는 값을 제거하기 위해 DISTINCT 사용

중복을 제거한 prod_price의 평균값

COUNT(*)와 DISTINCT는 같이 사용할 수 없다.

DISTINCT는 COUNT()에 열 이름이 지정된 경우에만 함께 사용할 수 있다. 또한 계산이나 수식과 함께 사용할 수 없고 반드시 열 이름과 함께 사용해야 한다.

MIN(), MAX()에서 DISTINCT 사용은 큰 의미 없다

그룹 함수 결합하기

SELECT 문에서는 필요한 만큼 그룹 함수를 사용할 수 있다.

별칭을 사용해 가독성을 높이자

정리하기

  • 그룹 함수

  • 5가지 그룹 함수의 개념과 사용법

도전 과제

  1. OrderItems에 있는 quantity 열을 사용해 판매 수량의 총합계를 구하는 SQL 문 작성하기

  1. 1의 문장을 수정해 BR01 항목의 총합계를 구하는 SQL 문 작성하기

  1. Products 테이블에서 가격이 10 또는 그 이하 중에서 가장 비싼 제품의 가격을 가져오는 SQL 문 작성하기. 계산된 필드를 max_price라고 하라

Last updated

Was this helpful?