2011년 1월 2일 일요일

MySQL에서 MINUS와 INTERSECT 집합 연산

INTERSECT 집합 연산 사용
INTERSECT 는 두개 집합에서 SELECT되는 튜플들을 모두 INNER JOIN의 조인 조건으로 포함시켜서 실행하면 쉽게 동일한 결과를 얻을 수 있다.


예제 쿼리)
SELECT member_id as uid, member_name as uname FROM member
INTERSECT
SELECT emp_id as uid, emp_name as uname FROM emp;
(이 형태의 쿼리는 MySQL에서는 지원되지 않음)


위의 쿼리에서 SELECT되는 튜플들이 uid와 uname이므로 
이 두개의 컬럼을 INNER JOIN의 조건으로 포함시켜서 아래와 같이 작성해주면 된다.


SELECT member_id as uid, member_name as uname
FROM member m 
  INNER JOIN emp e ON e.emp_id=m.member_id 
    AND e.emp_name=m.member_name;








MINUS 집합 연산 사용

MINUS 연산은 첫번째 집합에는 있지만, 두번째 집합에는 없는 것들을 조회하는 것이므로,
아래와 같이 3가지 방법으로 해결할 수 있다.



예제 쿼리)
SELECT member_id as uid, member_name as uname FROM member
MINUS
SELECT emp_id as uid, emp_name as uname FROM emp;
(이 형태의 쿼리는 MySQL에서는 지원되지 않음)


단, MINUS 집합 연산은 항상 DISTINCT하게 중복 레코드를 제거하고 리턴하기 때문에
SELECT의 최종 결과에 DISTINCT를 붙혀 줘야 다른 DBMS의 MINUS와 동일한 결과를
얻을 수 있다. (만약, 필요치 않거나 중복 가능성이 없는 결과인 경우 DISTINCT 없어도 됨)

  • NOT IN을 사용하는 방법
    SELECT DISTINCT m.member_id as uid, m.member_name as uname
    FROM member m
    WHERE (m.member_id, m.member_name) NOT IN
      (SELECT e.emp_id, e.emp_name FROM emp e);
  • NOT EXISTS를 사용하는 방법
    SELECT DISTINCT m.member_id as uid, m.member_name as uname
    FROM member m
    WHERE NOT EXISTS (
      SELECT 1
      FROM emp e
      WHERE e.emp_id=m.member_id
        AND e.emp_name=m.member_name
    );
  • LEFT OUTER JOIN을 이용하는 방법
    SELECT DISTINCT m.member_id as uid, m.member_name as uname
    FROM member m
      LEFT JOIN emp e ON emp e ON e.emp_id=m.member_id
        AND e.emp_name=m.member_name
    WHERE e.emp_id IS NULL;

조회되는 데이터의 성격에 따라서 성능의 차이는 있겠지만,
일반적인 데이터에서는 밑으로 내려갈수록 빠른 성능(세번째 > 두번째 > 첫번째)을 보인다.
가능하면 두번째 아니면 세번째 방법을 사용할 것을 권장하며, 
대상 레코드가 아주 많다면, 세번째 방법을 사용할 것을 권장한다.

댓글 1개:

  1. minus 쿼리들 실행계획 들도 적어주시면 좋을듯 한데.. ^^;
    저도 세번쩨로 쓰고 있습니다.
    책 아주 잘보고 있습니다. 양이 많아 아직 반도 못봤지만..ㅋㅋㅋ
    구글링 하면 자주 나와서 게속 들어오는 사이트가 되네요.
    좋은글 항상 감사합니다. ^^

    답글삭제