12장 테이블 조인
Last updated
Was this helpful?
Last updated
Was this helpful?
SQL의 유용한 기능 중 하나는 데이터 검색 쿼리에서 테이블 조인이 가능하다는 점이다. 조인은 SQL SELECT 문을 사용하여 수행할 수 있는데, SQL을 학습할 때 조인과 조인 문법을 잘 이해하는 것이 중요하다.
조인을 효과적으로 사용하려면 관계형 테이블과 관계형 데이터베이스 디자인을 이해해야 한다.
관계형 데이터베이스 디자인의 기본 원리는 같은 데이터를 여러 곳에 저장하는 것은 좋은 일이 아니라는 점이다. 관계형 테이블은 정보를 쪼개 여러 개의 테이블에 저장하도록 설계되었다. 테이블은 공통 열을 통해 연결된다. 고유한 값을 가진 식별자인 기본 키를 기준으로 연결된다.
관계형 데이터는 효율적으로 저장되고 쉽게 조작할 수 있다. 이 때문에 관계형 데이터베이스가 비관계형 데이터베이스보다 이 좋다.
데이터를 여러 개의 테이블로 나누어 저장하면 저장 공간 측면에서 더 효율적이고 데이터 조작이 쉬워지며 확장성이 높아진다.
그러면 데이터가 여러 테이블로 나누어 저장된 경우 어떻게 하나의 SELECT 문으로 원하는 데이터를 가져올까?
이를 해결하는 방법이 조인이다. 즉, 조인은 SELECT 문 안에서 테이블을 연결할 때 사용하는 메커니즘이다. 특별한 문법을 사용해 여러 개의 테이블을 조인하면, 하나의 결과를 가져올 수 있다. 조인은 각 테이블에서 적절한 행을 서로 연결하는 역할을 한다.
대화형 DBMS 도구 사용하기
조인은 데이터베이스 테이블에는 실제 존재하지 않는다. DBMS에서 필요할 때 생성하고, 쿼리가 수행되는 동안에만 유지된다.
많은 DBMS가 테이블 관계를 쉽게 정의할 수 있도록 그래픽 인터페이스를 제공한다. 이를 통해 참조 무결성을 유지하는데 큰 도움을 받을 수 있다. 참조 무결성은 DBMS가 데이터 무결성 규칙을 따른다는 것을 의미하고, DBMS에서 제공하는 인터페이스를 통해 이 규칙을 관리할 수 있다.
조인을 생성하는 것은 간단하다. 포함하려는 모든 테이블과 각 테이블 사이의 관계를 명시하면 된다.
조인 관계를 설정하기 위해 WHERE 절을 이용하는데 이는 테이블 조인에 대한 내용이 없던 데이터베이스 테이블에 관계를 지정해준다. WHERE 절은 필터로 동작해 지정한 조건과 일치하는 행만 가져온다. WHERE 절이 없다면 논리적 조건과 관계없이 첫 번째 테이블에 있는 모든 행은 두 번째 테이블에 있는 모든 행과 짝이 된다. 이를 카티전 곱이라 한다.
카티전 곱 Cartisian Product
조인 조건 없이 테이블 관계에 의해 반환된 결과.
검색된 행의 수 = 첫 테이블의 행 수 x 두번째 테이블의 행 수
두 개 이상의 테이블에서 연결 가능한 행을 모두 결합하는 조인 방법으로 WHERE 절에서 조인 조건절을 생략하거나 잘못 설정해 양쪽 테이블을 연결하는 조건이 하나도 없는 경우에 발생한다.
WHERE 절을 잊지 말자
조인을 사용할 때 WHERE 절을 꼭 확인하자. 그렇지 않으면 카티전 곱으로 위와 같이 원하지 않는 수많은 데이터를 가져올 수 있다.
그리고 WHERE 절이 올바른지도 확인하자. 잘못된 필터 조건은 DBMS가 엉뚱한 데이터를 가져오게 하는 원인이 된다.
대용량 테이블에서 잘못된 WHERE 절로 카티전 곱이 발생하면 속도가 현저히 저하된다.
상호 조인 Cross Join
카티전 곱을 반환하는 조인 타입을 상호 조인이라 한다.
지금까지 사용한 조인은 동등 조인 혹은 이퀴 조인(Equi-Join)이라 하는데 이 조인은 두 개의 테이블에 있는 공통 열의 값이 같은 것을 결과로 가져온다. 이런 타입의 조인을 내부 조인이라고도 부른다.
조인 타입을 표시할 때는 새로운 문법을 사용한다.
두 테이블 간 관계를 FROM 절에서 INNER JOIN으로 명시했다. 그리고 WHERE 절에서 ON 절을 사용하여 조인 조건을 지정했다. 이처럼 조인 타입은 새로운 문법을 이용한다.
SQL은 SELECT 문에서 조인할 수 있는 테이블의 개수를 제한하지 않는다. 여러 개의 조건을 생성할 때도 기본 규칙은 같다. 먼저 조인할 모든 테이블을 적고, 테이블 간 관계를 정의한다.
성능 고려
DBMS는 프로그램 실행 중 지정된 테이블을 연결하는 조인을 처리한다. 이런 프로세스는 리소스를 많이 소비하기에 불필요한 테이블을 조인하지 않도록 주의해야 한다. 더 많은 테이블은 성능을 저하의 원인이 된다.
관계형 데이터베이스의 이해
조인의 개념과 내부 조인
Customers 테이블에서 고객명과 Orders 테이블에서 관련된 주문 번호를 가져와 그 결과를 고객명 그리고 주문 번호 순으로 정렬하는 SQL 문을 작성하라. 간단한 이퀴 조인 문법으로 한 번, 내부 조인으로 한 번 작성하기
1 계속... 고객명과 주문 번호 외 OrderTotal이라는 이름의 세 번째 열을 추가하기. (OrderTotal에는 각 주문의 총가격이 포함) 이를 위한 2가지 방법. 1) OrderItems 테이블에서 서브쿼리를 사용해 OrderTotal 열 생성 2) 기존 테이블에 OrderItems 테이블을 조인한 다음 그룹 함수 사용
11장 도전 과제 2 계속... 제품 BR01이 주문된 날짜를 가져오는 SQL 문 작성하기. 조인과 간단한 이퀴 조인 문법을 사용하기
11장 도전 과제 3 계속... ANSI 내부 조인 문법을 사용해 다시 작성하기. 두 개의 내부 조인과 prod_id로 필터링할 WHERE 사용
10장의 1000 이상 값을 가진 주문 번호를 찾는 도전 과제 계속... 조인을 사용해 Customers 테이블에서 고객명, OrderItems 테이블에서 주문의 합계를 가져오는 SQL문 작성하기. Orders 테이블 포함, GROUP BY와 HAVING 절, 고객명 정렬 사용해야 함. 이퀴 조인이나 ANSI 내부 조인 문법 사용하기.