7장 - 관계 데이터 연산

728x90

데이터베이스의 원리와 응용

본 강의에서는 데이터베이스 입문자들에게 꼭 필요한 데이터베이스 기초 이론, 데이터 모델과 연산, SQL, 데이터베이스 설계에 대해 공부하고자 한다.

www.kocw.net

이번 시간에는 관계 데이터 연산에 대해 학습한다.

학습목표

관계 데이터 연산의 개념

관계 데이터 연산(Relational Data Operation)

원하는 데이터를 얻기 위해 릴레이션에 필요한 처리 요구를 수행하는 것
관계 대수와 관계 해석이 있다.
- 기능과 표현력 측면에서 능력이 동등함
- 처리절차를 얼마나 자세히 기술하느냐에 따라 차이를 보인다.
관계 데이터 연산은 관계 대수와 관계 해석으로 나눌 수 있다.
- 관계 대수 : 원하는 결과를 얻기 위해 데이터 처리 과정을 순서대로 기술하는 절차적 언어
  - 대표적인 연산 : 선택(Selection), 투영(Projection), 조인(Join), 합집합, 교집합, 차집합 등
- 관계 해석 : 원하는 결과를 얻기 위해 처리를 원하는 데이터가 무엇인지만 기술하는 비절차적 언어
  - 대표적인 연산 : 튜플 변수, 원자 공식, 양화기 등
관계 데이터 연산이 필요한 이유
- 데이터 조회 : 특정 조건에 맞는 데이터만 추출하거나, 여러 테이블의 데이터를 결합하여 새로운 정보를 생성할 수 있다.
- 데이터 수정 : 데이터를 추가, 삭제, 수정하는 작업을 수행할 수 있다.
- 데이터 분석 : 데이터를 분석하여 통계 정보를 얻거나, 특정 패턴을 찾아낼 수 있다.

관계 대수(Relational Algebra)의 개념

원하는 결과를 얻기 위해 릴레이션의 처리 과정을 순서대로 기술하는 절차적 언어
릴레이션을 처리하는 연산자들의 모임
- 일반 집합 연산자와 순수 관계 연산자로 분류된다.
폐쇄 특성(closure property)이 존재한다.
- 피연산자도 릴레이션이고 연산의 결과도 릴레이션이다. 즉, 관계 대수에서 어떤 연산을 수행하든지 간에 그 결과는 항상 테이블 형태로 나타낼 수 있는 관계(릴레이션)이라는 뜻이다.

관계 대수의 장점

관계 대수의 단점

일반 집합 연산자(Set Operation)

일반 집합 연산자의 특성

피연산자가 2개 필요하다.
- 2개의 릴레이션을 대상으로 연산을 수행
합집합, 교집합, 차집합은 피연산자인 두 릴레이션이 합병이 가능해야 한다.
- 합병 가능(union-compatible) 조건
  - 두 릴레이션의 차수가 같아야 한다.
  - 두 릴레이션에서 서로 대응되는 속성의 도메인이 같아야 한다.

순수 관계 연산자(Relational Operation)

셀렉트 : 릴레이션에서 특정 조건을 만족하는 튜플만 선택하여 결과 릴레이션을 구성

하나의 릴레이션을 대상으로 연산을 수행
데이터 언어적 표현법 : 릴레이션 where 조건식
조건식
- 비교식, 프레디킷(predicate)이라고도 한다.
- 속성과 상수의 비교나 속성들 간의 비교로 표현
- 비교연산자(<, >, =)와 논리연산자를 이용해 작성

프로젝트 : 릴레이션에서 특정 속성들의 값으로 결과 릴레이션을 구성

조인 : 두 릴레이션의 공통 속성을 기준으로 튜플들을 연결하여 만들어진 새로운 튜플들을 반환

디비전 : 릴레이션2의 모든 튜플과 관련이 있는 릴레이션1의 튜플로 결과 릴레이션을 구성. 즉, 하나의 릴레이션(피제수 R)의 모든 튜플이 다른 릴레이션(제수 S)의 모든 튜플과 연결될 수 있는지 확인하는 연산이다.

728x90