데이터베이스 응용 기술
by Frinee이 글은 김연희 저 - "데이터베이스 개론 3판"을 공부하고 정리하여 작성하였습니다.
1. 객체지향 데이터베이스
1. 객체지향 데이터 모델
- 객체지향 데이터 모델은 객체와 객체 식별자, 속성과 메서드, 클래스, 클래스 계층 및 상속, 복합 객체 등을 지원하는 객체지향 개념에 기반을 둔 데이터 모델
- 다양한 응용 분야의 데이터 모델링을 위한 새로운 요구 사항 지원
- 의미상 관계가 있는 데이터베이스 구조를 표현할 때의 강력한 설계 기능 제공
객체와 식별자
- 객체(object): 현실 세계에 존재하는 개체를 추상적으로 표현한 것
- 각 객체는 시스템 전체에서 유일하게 식별될 수 있는 객체 식별자를 가지고, 객체 식별자를 특정 객체에 접근하기 위한 유일한 수단으로 사용
- 객체 식별자를 사용해 객체 간 관계를 참조할 수 있음
속성과 메서드
- 속성(attribute)은 데이터 모델의 속성과 같은 의미로 볼 수 있음
- 하지만 객체지향 데이터 모델의 속성은 값을 여러 개 가질 수 있고 사용자가 정의한 클래스뿐 아니라 해당 클래스의 하위 클래스도 도메인으로 정의할 수 있음
- 메서드(method)는 객체에 수행할 수 있는 연산이고 객체의 속성 값을 검색•추가•삭제•수정하는 데 주로 사용 (프로그래밍의 함수 기능)
- 특정 객체의 속성과 메서드에 접근하려면 메시지(message)를 사용해야 함.
- 한 객체의 속성 값을 수정하기 위해 이 역할을 담당하는 메서드를 실행시키는 메시지를 해당 객체에 보내야 함.
클래스
- 클래스(class)는 속성과 메서드를 공유하는 유사한 성질의 객체들을 하나로 그룹화한 것
- 객체는 클래스의 구성원으로, 클래스 인스턴스 또는 객체 인스턴스라고도 함.
- 클래스 내부는 해당 클래스의 객체를 위한 데이터 구조와 메서드 구현에 관한 세부 사항을 기술함.
클래스 계층과 상속
- 클래스를 단계적으로 세분화하면 클래스 간 계층 관계가 발생하여 결과적으로 클래스 계층이 하나 형성됨.
- 클래스 계층에서 상위에 있는 클래스를 상위클래스, 하위에 있는 클래스를 하위클래스라 함.
- 상위클래스와 하위클래스는 일반적으로 IS-A가 성립한다.
IS-A는 A is B라는 의미
- 상속(inheritance)은 상위클래스의 속성과 메서드를 모든 하위클래스에 물려주는 개념
- 하위클래스가 상속받는 상위클래스의 수에 따라 단일 상속과 다중 상속으로 나뉨
복합 객체
- 시스템에서 기본으로 제공하지 않는 사용자 정의 클래스를 도메인으로 하는 속성을 가진 객체를 복합 객체(composite object)라 한다.
- 복합 객체에서 사용자 정의 클래스를 도메인으로 하는 속성은 해당 클래스에 속하는 객체 인스턴스의 객체 식별자를 값으로 가지게 됨.
2. 객체지향 질의 모델
- 관계 데이터베이스에선 질의 대상과 결과가 모두 릴레이션이지만, 객체지향 데이터베이스에서는 질의 대상이 클래스이고 질의 결과는 클래스에 속하는 객체 집합이다.
- 객체지향 데이터베이스에선 객체지향 개념을 기반으로 클래스, 속성, 메서드, 객체 등을 이요해 질의를 표현
- 클래스 하나 또는 클래스 하나와 해당 클래스의 하위 클래스 전체를 대상으로 하는 질의를 단일 오퍼랜드(single operand)라고 한다.
- 여러 클래스를 대상으로 하는 질의를 다중 오퍼랜드(multiple operand)라 한다.
(예)
SELECT P
FROM P : 운동선수
WHERE P.키 〉= 180 AND P.소속팀.연고지 = '서울';
→ 키가 180이상이고, 소속팀의 연고지가 서울인 모든 운동선수 검색
2. 객체관계 데이터베이스
- 객체지향 데이터베이스가 특수한 몇몇 분야에서만 많이 사용되는 한계를 극복해야 했음
- 이에 관계 데이터 모델에 객체지향 개념을 적용한 객체관계 데이터 모델을 사용하는 객체관계 데이터베이스가 나타남.
- 객체관계 데이터 모델은 객체지향 개념과 관계 데이터 모델의 개념을 통합한 것
- 릴레이션, 객체, 메서드, 클래스, 상속, 캡슐화, 복합 객체 등 모두 지원함.
- 관계 데이터베이스 표준 질의어 SQL을 표준으로 채택하여 발전 중
- 객체관계 데이터베이스를 위한 SQL은 기본 질의어 기능과 사용자 정의 타입, 객체, 객체 식별자, 메서드 등과 같은 객체지향 특성도 갖고 있음
객체지향 데이터베이스 vs 객체관계 데이터베이스
- 둘 다 객체의 개념을 지원하고, 사용자 정의 타입, 객체 식별자, 상속 등 포함하는 유사점이 있음
- 객체지향 데이터베이스는 객체지향 프로그래밍 기반에서 데이터베이스의 기능을 추가하는 데에 목적
- 반면, 객체관계 데이터베이스는 관계 데이터베이스에 기반을 두고 사용자가 더 풍부한 데이터 타입을 추가할 수 있도록 한 것이 목적
3. 분산 데이터베이스 시스템
데이터베이스 시스템을 물리적으로 한 장소에 설치하여 운영하는 것을 중앙 집중식 데이터베이스 시스템이라 함.
반면 물리적으로 분산된 데이터베이스 시스템을 네트워크로 연결해, 사용자가 논리적으로 하나의 집중식 데이터베이스 시스템처럼 사용할 수 있도록 한 것을 분산 데이터베이스 시스템이라 함.
1. 분산 데이터베이스 시스템의 구성
분산 처리기
- 분산 데이터베이스 시스템에서 물리적으로 분산되어 지역별로 필요한 데이터를 처리할 수 있는 지역 컴퓨터를 말함.
- 분산 처리기는 지역에서 운영하는 데이터베이스를 자체적으로 관리할 수 있는 DBMS를 갖고 있음.
분산 데이터베이스
- 물리적으로 분산된 지역 데이터베이스를 말하며 해당 지역의 분산 처리기와 함께 지역의 데이터 처리를 지원함.
- 보통 해당 지역에서 가장 많이 사용하는 데이터를 저장하며 각 지역 분산 처리기에 설치된 DBMS가 관리함.
통신 네트워크
- 네트워크를 통해 지역 분산 처리기끼리 자원을 공유하고 논리적으로 하나의 시스템과 같은 기능을 제공함.
- 통신 네트워크에 있는 모든 분산 처리기는 특정 통신규약에 따라 데이터를 전송하고 수신하며 효율적인 설계가 중요함.
2. 분산 데이터베이스 시스템의 주요 목표
- 분산 데이터 독립성은 데이터베이스가 분산되지 않은 것처럼 사용할 수 있다는 의미로 분산 데이터베이스 시스템의 주요 목표이다.
- 그리고 분산 데이터 독립성을 지원하기 위해서는 분산 투명성을 보장해야 함.
- 분산 투명성에는 위치 투명성, 중복 투명성, 단편화 투명성, 병행 투명성, 장애 투명성이 있다.
위치 투명성
- 사용자가 접근하려는 데이터의 실제 저장 위치를 알 필요 없이 데이터베이스의 논리적인 이름만으로 데이터에 접근할 수 있다는 의미
- 데이터베이스 관리 시스템이 시스템 카탈로그에서 데이터의 모든 위치 정보를 관리하다가 데이터 접근에 대한 요구 발생 시 이 정보를 제공함으로써 데이터 접근을 수행
- 다른 지역에 있는 데이터 접근 요청의 경우 처리 방법
- 다른 지역의 데이터를 가져와 처리
- 데이터 접근 요청을 하는 트랜잭션을 데이터가 있는 지역으로 보내 처리 후, 결과 데이터만 가져옴.
- 이 두 가지 방법을 모두 사용해 처리
- 위치 투명성이 보장되면 응용 프로그램이 데이터의 저장 위치를 알 필요가 없어져 응용 프로그램의 처리가 간단해짐.
- 그리고 자주 사용하는 데이터는 요청이 발생한 지역으로 가져가 처리함으로써 효율적인 처리 가능
중복 투명성
- 데이터베이스 분산 저장 방법
- 데이터가 중복되지 않게 분할하여 저장
- 지역 분산 데이터베이스에 데이터를 중복하여 저장
- 데이터 중복의 장단점
구분 | 내용 |
장점 | 1. 한 지역에서 문제가 발생해도 다른 지역에서 작업 수행이 가능하므로 신뢰성, 가용성이 높아짐 2. 동일한 데이터가 저장된 여저 지역에서 병렬 처리가 가능하여 데이터 처리 성능 향상 3. 데이터 처리 요청이 여러 지역에 분산되어 처리 부담을 줄일 수 있음 |
단점 | 1. 저장 공간을 많이 사용함. 2. 데이터 변경 시 중복 저장된 데이터를 모두 같이 변경해야 하므로 비용 증가 및 데이터 불일치 발생 |
- 그럼에도 데이터 처리 효율성, 신뢰성, 가용성의 장점이 크기 때문에 데이터를 중복해 저장하는 방법을 많이 사용함.
- 완전 중복: 동일한 데이터를 둘 이상의 지역에 있는 분산 데이터베이스에 저장하는 방법
- 부분 중복: 일부 데이터만 중복하여 저장하는 것
- 지역의 분산 데이터베이스에서 중복되는 데이터가 전혀 없는 경우를 분할 데이터베이스라 함.
- 중복 투명성은 사용자가 중복을 인식하지 못하고 하나의 데이터베이스 시스템에 데이터가 저장된 것처럼 사용하는 것
단편화 투명성
- 단편화는 하나의 릴레이션을 더 작은 조각(단편)으로 나누고 각 조각을 별개의 릴레이션으로 처리하는 것
- 단편화를 하면 각 조각이 전체 릴레이션의 일부가 되기 때문에 저장 공간을 적게 사용하고 관리할 데이터 수도 줄어듦
- 단편화 수행 조건
- 완전성: 전체 릴레이션의 모든 데이터는 어느 한 조각에는 꼭 속해야 한다.
- 회복성: 단편화된 조각들로부터 원래의 전체 릴레이션을 회복할 수 있어야 한다.
- 분리성: 전체 릴레이션의 모든 조각을 서로 중복되지 않게 분리해야 한다.
- 수평적 단편화
- 릴레이션을 수평적으로 단편화하는 것으로, 튜플 단위로 나눈다.
- 수직적 단편화
- 릴레이션을 수직적으로 단편화하는 것으로, 속성 단위로 나눈다.
- 혼합 단편화
- 수평적 단편화와 수직적 단편화를 모두 사용하여 릴레이션을 나눈다.
병행 투명성
- 분산 데이터베이스와 관련된 트랜잭션들이 동시에 수행되더라도 결과는 항상 일관성을 유지하는 것
장애 투명성
- 특정 시스템에 문제가 발생하더라도 전체 시스템이 작업을 계속 수행할 수 있는 것
3. 분산 데이터베이스의 구조
전역 개념 스키마
- 분산 데이터베이스에 저장할 모든 데이터 구조와 제약 조건을 정의함.
- 전역 개념 스키마는 관계 데이터 모델의 관점에서 보면 데이터베이스 안에 존재하는 모든 릴레이션 스키마의 집합
단편화 스키마
- 전역 개념 스키마를 분할하는 방법인 단편화를 정의하고 전역 개념 스키마와 각 조각 스키마의 대응 관계도 정의함.
할당 스키마
- 단편화는 전역 스키마를 논리적으로 분할한 것이고 분할된 각 조각 스키마의 인스턴스는 실제로 하나 이상의 지역에 물리적으로 저장
- 할당 스키마는 각 조각 스키마의 인스턴스를 물리적으로 저장해야 되는 지역을 정의
지역 스키마
- 지역별로 저장하고 있는 데이터 구조와 제약조건을 정의
4. 분산 데이터베이스의 질의 처리
- 중앙 집중식 데이터베이스 시스템에서는 최선의 질의 전략 기준을 데이터베이스가 위치한 디스크 접근 횟수를 이용
- 분산 데이터베이스 시스템에서는 디스크 접근 횟수뿐만 아니라, 네트워크에서 데이터를 전송하는 비용과 하나의 질의문을 분해하여 여러 지역에서 병렬 처리하면서 얻는 성능상 이점도 고려함.
5. 분산 데이터베이스 시스템의 장•단점
- 장점
- 신뢰성과 가용성 증대
- 지역 자치성과 효율성 증대
- 확장성 증대
- 단점
- 데이터 분산, 단편화, 중복 등 추가로 고려할 사항이 많아 설계 및 구축 비용이 더 많이 듦
- 관리가 복잡하고 관리 비용도 많이 듦
- 추가 통신 비용과 처리 비용 발생
4. 멀티미디어 데이터베이스 시스템
- 멀티미디어 데이터베이스 시스템은 숫자나 문자 데이터와 같은 일반 데이터뿐만 아니라 영상, 음향 및 애니메이션과 같은 멀티미디어 데이터도 효과적으로 저장하고 처리하는 기능을 제공
1. 멀티미디어 데이터의 특성
- 일반적으로 데이터의 각 타입을 미디어라 하고, 여러 미디어의 조합으로 이루어진 데이터를 멀티미디어 데이터라 함.
- 멀티미디어 데이터의 유형
유형 의미 텍스트 문자로 구성된 데이터 그래픽 수학 공식을 기반으로 제작된 벡터 이미지 데이터 이미지 정적 이미지나 사진과 같이 픽셀 단위로 표현되는 비트맵 이미지 비디오 동영상, 애니메이션 오디오 음성, 소리, 음악
- 대용량 데이터
- 크기가 수 킬로바이트에서 수십 메가바이트 이상을 가져 압축해서 저장해야 함.
- 일반 데이터와는 다른 구조로 별도의 저장 공간을 구성해서 관리
- 검색 방법이 복잡한 데이터
- 설명 기반 검색
- 초기의 멀티미디어 시스템에서 많이 사용한 방법
- 멀티미디어의 특성을 나타내는 키워드나 자세한 설명을 멀티미디어 데이터와 함께 저장했다가 검색에 이용
- 많은 양의 데이터를 처리하기에 적합하지 않고 주관적 관점이 포함되어 설명이 달라질 수 있음
- 내용 기반 검색
- 멀티미디어 데이터 실제 내용을 이용하여 검색하는 방법
- 특정 객체를 포함한 멀티미디어 검색을 실시
- 멀티미디어 데이터가 포함한 내용의 정보를 추출하여 데이터베이스에 저장하는 기술과 이 정보를 이용해 사용자 질의를 처리하는 멀티미디어 데이터용 질의 처리 기법이 필요
- 설명 기반 검색
- 구조가 복잡한 데이터
- 멀티 미디어는 원시 데이터, 등록 데이터, 서술 데이터 등으로 구성
- 원시 데이터는 텍스트, 그래픽, 이미지, 비디오, 오디오 등 기본 타입의 데이터
- 등록 데이터는 멀티미디어 데이터의 특성과 필요한 정보를 별도로 추출한 데이터
- 해상도, 크기, 색상, 포맷 등
- 등록 데이터는 원시 데이터를 처리하는 데 도움이 됨
- 서술 데이터는 멀티미디어 데이터를 검색하는 데 사용되는 것
- 멀티미디어 데이터에 지정된 키워드나 자세한 설명 등
- 멀티미디어 데이터들은 공간이나 시간적으로 관련 있는 경우가 많으므로 복잡한 관계성을 표현하고 관리할 수 있는 기술이 필요함.
2. 멀티미디어 데이터베이스의 발전 과정
- 멀티미디어 데이터 저장 및 처리 방법
- 관계 데이터베이스 시스템 확장을 통한 멀티미디어 데이터 처리
- 객체지향 데이터베이스 확장을 통한 멀티미디어 데이터 처리
관계 데이터베이스에서의 멀티미디어 데이터 처리
- 멀티미디어 데이터를 위한 새로운 데이터 타입을 추가하여 멀티미디어 데이터를 관계 데이터베이스에 저장하고 처리함.
- 개발 초기에 이미지와 같은 대용량 멀티미디어 데이터를 저장하고 관리하기 위해 많이 사용함.
EX) GENESIS, STAIRS 등
- 이미지, 그래픽 등 대용량 멀티미디어 데이터를 처리하기 위해 이진 대형 객체(BLOB)라는 새로운 데이터 타입을 지원
- 관계 데이터베이스가 제공하는 안정적인 이론과 다양한 기법을 그대로 사용할 수 있는 장점이 있음.
- 하지만 단순히 멀티미디어 데이터를 저장하고 검색하는 일부 기능만 제공하고 시공간적 특성 표현, 데이터 통합 모델링 기능, 다양한 연산 표현 및 조작 기능은 거의 제공하지 못한다는 한계가 존재
객체지향 데이터베이스에서의 멀티미디어 데이터 처리
- 1980년대 후반부터 객체지향 데이터베이스를 활용한 방법을 시도하기 시작함.
- 다양한 관계의 표현, 데이터 추상화와 캡슐화, 상속 등 멀티미디어 데이터를 처리하는 데 필요한 다양한 기능을 제공
EX) ORION, MULTOS, MINOS 등
- 이 시스템들의 공통 특징은 멀티미디어 데이터를 객체와 클래스로 표현하고, 데이터 추상화, 캡슐화, 상속 등 개념을 지원함.
- 이 시스템도 멀티미디어 데이터의 복잡하고 다양한 모델링 요구 사항을 완벽히 충족시키지 못한다는 한계가 있음
3. 멀티미디어 데이터베이스 관리 시스템의 구성
- 멀티미디어 데이터베이스 시스템은 데이터베이스 시스템의 기본 기능 뿐만 아니라 멀티미디어 데이터 특성에 따른 다양하고 새로운 사항도 고려해야 함.
- 멀티미디어 데이터는 보통 대용량이고 시공간적 연속성을 지님.
- 데이터를 제공할 때 중간에 끊겨서는 안 됨.
- 멀티미디어 데이터를 관리하는 데이터베이스 관리 시스템
- UniSQL, 오라클, 인포믹스 ,O2, DB2 UDB 등
- 미디어 데이터 유형에 따라 멀티미디어 데이터베이스 관리 시스템의 구성이 달라짐
📁 파일 시스템을 이용하는 방식
- 초기에 많이 사용하던 방식으로 응용 프로그램에 필요한 멀티미디어 데이터를 파일로 저장하고 관리함.
- 프로그래밍 언어로 데이터를 처리하는 코드를 직접 작성하여 응용 프로그램에 포함시킴
- 데이터를 응용 프로그램에서 관리하는 방식이여서 개발이 어려움.
- 파일의 단순한 저장 구조에 복잡한 멀티미디어 데이터를 저장하기도 어려움.
- 데이터의 동시 공유, 회복, 보안 등 데이터베이스 관리 시스템의 고급 기능을 제공하기 어려움.
⛓️ 관계 데이터베이스 관리 시스템을 이용하는 방식
- 텍스트 같은 일반 데이터는 관계 데이터베이스에 저장하고, 이미지나 비디오 같은 데이터는 파일에 저장
- 지리 정보 시스템(Geographical Information Systems) 등에서 많이 사용함.
- 파일에 저장된 데이터에 대한 처리 요청을 프로그래밍 언어로 작성하고, 관계 데이터베이스에 저장된 데이터에 대한 처리 요청을 SQL 로 작성
- 데이터 처리 요청을 위해 두 가지 방법을 모두 지원해야 한다는 부담이 있고 멀티미디어 데이터에 데이터베이스 관리시스템의 고급 기능을 제공할 수 없는 문제가 있음
확장된 관계 데이터베이스 관리 시스템을 이용하는 방식
- 이미지, 오디오, 비디오 등 대용량 멀티미디어 데이터를 모두 저장하도록 기존 관계 데이터베이스 관리 시스템을 확장한 방식
- 기존 관계 데이터베이스 관리 시스템에 BLOB 객체 데이터 타입을 추가하는 방식
- 모든 멀티미디어 데이터에 데이터베이스 관리 시스템의 고급 기능을 제공할 수 있지만 완벽히 지원하기 어려움
- 멀티미디어 데이터의 특성을 반영한 처리 요청을 SQL로 표현하기 어려움
📦 객체지향 데이터베이스 관리 시스템을 이용하는 방식
- 객체지향 데이터베이스 관리 시스템은 다양한 관계의 표현, 데이터 추상화와 캡슐화, 상속 등의 객체지향 개념을 지원하여 멀티미디어 데이터 처리 기능을 제공
- 기존 관계 데이터베이스 관리 시스템의 동시성 제어, 질의 최적화, 회복 기능 등을 제공하지 못하는 경우가 많음
4. 멀티미디어 데이터의 질의
- 멀티미디어 데이터 검색 요청을 SQL로 표현하기 어려워 멀티미디어 데이터베이스 관리 시스템만의 질의 처리 기법이 필요함.
- 데이터 자체의 질의보다는 데이터에 포함된 특정 객체, 설명, 키워드를 이용한 질의를 사용
멀티미디어 데이터 질의 유형
- 텍스트 질의: 사용자가 제시한 키워드를 포함하는 문서를 검색하는 질의가 대부분
- 이미지 질의: 사용자가 제시한 키워드와 관련 있는 이미지를 검색하는 내용 검색이나, 사용자가 제시한 이미지와 유사한 이미지를 검색하는 유사도 검색 질의
- 비디오 질의: 비디오는 장면을 대상으로 하는 검색 질의
- 공간 질의: 주어진 범위 조건에 맞는 특정 위치를 검색하는 질의
멀티미디어 데이터 질의 처리
- 매칭(matching) 기법: 수학 함수로 저장된 데이터와 질의 조건으로 주어진 데이터 간의 유사도를 수학 함수로 계산하여, 유사도가 높은 데이터를 검색
- 랭킹(ranking) 기법: 검색 결과를 질의 조건과의 관련 정도에 따라 정렬하여 관련성이 높은 결과부터 제공
- 필터링(filtering) 기법: 질의 조건과 관련성이 적은 데이터를 단계적으로 제거하여 검색 범위를 줄임
- 인덱스(index) 기법: 인덱스 구조를 이용해 질의 조건에 적합한 데이터 검색
5. 기타 데이터베이스 시스템
1. 웹 데이터베이스
- WWW(world wide web) 서비스, 즉 인터넷 서비스는 누구나 쉽게 사용할 수 있다는 장점이 있어 대중화에 성공함.
- 초기 인터넷 서비스는 단순한 정보 검색 기능만 제공했지만 이후 전자 상거래, 디지털 라이브러리 등 다양한 분야에서 대량의 데이터를 관리하는 새로운 유형의 웹 서비스가 등장.
- 새로운 유형의 웹 서비스를 관리하기 위한 웹 서비스와 데이터베이스를 통합한 웹 데이터베이스가 등장함.
- 웹 데이터베이스에는 웹 서비스와 데이터베이스 시스템을 연결해주는 미들웨어가 필요함.
- 웹 서비스는 미들웨어를 통해 데이터베이스 시스템의 기능을 제공받기 때문에 미들웨어는 데이터베이스 통로라고도 함.
- 미들웨어 구현 방법
- 미들웨어를 통해 데이터베이스에 접근하는 프로그램을 웹 서버 쪽에 두는 서버 확장 방법
- 클라이언트 쪽에 두는 클라이언트 확장 방법
2. 데이터 웨어하우스
- 기업과 같은 대규모 조직에서는 정보 시스템에 저장된 데이터를 분석하고 요약하여 추출한 유용한 정보를 의사 결정 지원 시스템을 통해 의사 결정에 이용함.
- 이 때문에 의사 결정에 도움이 되는 데이터를 빠르고 정확히 추출할 수 있는 방법을 연구하는 데 그 중에 하나가 데이터 웨어하우스이다.
- 데이터 웨어하우스는 데이터베이스 시스템에서 의사 결정에 필요한 데이터를 미리 추출하여, 이를 원하는 형태로 변환하고 통합한 읽기 전용의 데이터 저장소이다.
- 트랜잭션 처리 중심의 일반 데이터베이스와는 다르게 데이터 웨어하우스는 의사결정을 위한 정보의 집합으로 검색 위주의 의사 결정 업무를 위한 것
- 그리고 데이터 웨어하우스는 올바른 의사 결정을 위해 과거와 현재 데이터를 함께 유지함.
데이터 웨어하우스의 특징
주제 지향적(subject-oriented) 내용
- 의사결정이 필요한 주제를 중심으로 데이터를 구성함. 즉, 의사 결정에 필요한 주제와 관련된 데이터만 유지함.
- 데이터 웨어하우스는 최고 경영자난 데이터 분석가 등이 사용하므로 데이터를 좀 더 이해하기 쉬운 형태로 제공하기 위해 주제 지향적 특징을 지님
통합된(integrated) 내용
- 여러 데이터베이스에서 필요한 데이터를 추출하여 의사 결정에 필요한 분석 및 비교 작업을 지원
- 구조가 다른 여러 데이터베이스에서 데이터를 추출할 때 이름이나 타입 등에서 충돌이 발생할 수 있음
- 데이터 웨어하우스는 내부적으로 데이터가 항상 일관된 상태를 유지하도록 여러 데이터베이스에서 추출한 데이터를 통합하여 저장하는 특징
시간에 따라 변하는(time-variant) 내용
- 데이터 웨어하우스는 올바른 의사 결정을 위해 현재와 과거 데이터를 함께 유지함.
- 중요한 순간마다 사진을 찍는 것처럼 해당 시점의 데이터를 주기적으로 유지함.
- 데이터 웨어하우스가 저장하고 있는 각 시점의 데이터를 스냅샷이라 함.
- 데이터 간의 시간적 관계나 동향을 분석하여 의사결정을 하기 위해 과거와 현재 데이터를 동시에 유지함.
비소멸성(nonvoatile)을 가진 내용
- 데이터 웨어하우스는 검색 작업만 수행되는 읽기 전용의 데이터를 유지하기 때문에 삽입•삭제•갱신 이상이 발생할 염려가 없음
자료
- 데이터베이스 개론 3판 (김연희 저, 2024.1)
'[컴퓨터 과학자 스터디] > 데이터베이스' 카테고리의 다른 글
데이터 과학과 빅데이터 (2) | 2024.12.09 |
---|---|
보안과 권한 관리 (0) | 2024.12.05 |
회복과 병행 제어 (0) | 2024.12.02 |
정규화 (2) | 2024.11.29 |
데이터베이스 설계 (2) | 2024.11.27 |
블로그의 정보
프리니의 코드저장소
Frinee