Frinee의 코드저장소

데이터베이스 기본 개론

by Frinee
이 글은 김연희 저 - "데이터베이스 개론 3판"을 공부하고 정리하여 작성하였습니다.

 

1. 데이터베이스의 필요성

  • 데이터(data): 현실 세계에서 단순히 관찰하거나 측정하여 수집한 사실이나 값
  • 정보(information): 데이터를 의사결정에 유용하게 활용할 수 있도록 처리하여 체계적으로 조직한 결과물
  • 데이터에서 정보를 추출하는 과정 또는 방법을 정보 처리라 함.
  • 즉, 데이터를 상황에 맞게 분석하거나 해석하여 데이터 간 의미 관계를 파악하는 것

1.1. 정보 시스템과 데이터베이스

  • 정보시스템(information system): 조직 운영에 필요한 데이터를 수집하여 유용한 정보를 만들어 주는 수단
  • 정보 시스템은 사용 목적에 따라 부르는 명칭이 다름
  • 경영 정보 시스템(Management Information System): 기업의 경영 관리에 필요한 의사 결정용 정보 시스템
  • 의사 결정 지원 시스템(Decision Support System): 복합적이고 광범위한 의사 결정을 위해 사용되는 정보 시스템

 

2. 데이터베이스의 정의와 특징

2.1. 데이터베이스의 정의

  • 일반적으로 특정 조직의 여러 사용자가 공유하여 사용할 수 있도록 통합해서 저장 운영 데이터의 집합이라 정의함.
  1. 데이터베이스는 공유 데이터
    • 특정 조직의 여러 사용자가 함께 소유하고 이용할 수 있어야 함
  2. 데이터베이스는 통합 데이터
    • 똑같은 데이터가 여러 개 존재하는 것을 허용하지 않는다.
    • 하지만 의도적으로 중복을 허용하는 경우도 있긴 함.
  3. 데이터베이스는 저장 데이터
    • 컴퓨터가 접근할 수 있는 매체에 데이터베이스를 저장해야 함.
  4. 데이터베이스는 운영 데이터
    • 조직을 운영하고 조직의 주요 기능을 수행해야 하고 지속적으로 유지해야 함.

2.2. 데이터베이스의 특징

  1. 실시간 접근: 사용자의 데이터 요구에 실시간으로 응답할 수 있어야 함.
  2. 변화하는 특성: 데이터를 계속 삽입, 수정, 삭제하여 현재의 정확한 데이터를 유지해야 함
  3. 동시 공유: 여러 사용자가 동시에 이용할 수 있는 동시 공유의 특징을 제공해야 함
  4. 참조: 저장된 주소나 위치가 아닌 데이터의 내용, 즉 값으로 참조할 수 있어야 함

 

3. 데이터 과학 시대의 데이터

3.1. 형태에 따른 데이터 분류

  1. 정형 데이터
    • 정해진 구조에 따라 저장된 데이터
    ex) 엑셀 스프레드 시트, 관계 데이터베이스의 테이블
  2. 반정형 데이터
    • 구조에 따라 저장되지만 데이터 내용 안에 구조에 대한 설명이 함께 존재함
    • 데이터 내용에 대한 구조를 파악하는 파싱(parsing)이 필요하고 보통 파일 형태로 저장
    ex) HTML, XML, jSON 문서나 웹 로그, 센서 데이터 등
  3. 비정형 데이터
    • 정해진 구조가 없이 저장된 데이터
    ex) 소셜 데이터의 텍스트, 영상, 이미지, 음성 , 워드 등

XML 데이터베이스와 멀티미디어 데이터베이스

더보기
  • XML 데이터베이스
    • 웹에서 시스템 간 데이터 교환을 위해 작성된 XML 문서를 효율적으로 저장하고 검색할 수 있도록 개발
    • 기존 데이터베이스에 XML 문서를 하나의 단위로 저장하는 방법과 XML 전용 데이터베이스를 따로 구성하는 방법으로 나뉨
    • 후자의 경우 데이터처리를 위해 XQuery를 사용
  • 멀티미디어 데이터베이스
    • 문자, 숫자 뿐만 아니라 이미지, 영상 등이 조합된 멀티미디어 데이터를 효율적으로 저장하고 검색할 수 있도록 개발됨
    • 다양한 형태의 데이터를 저장하고 처리하기 위해 객체지향적 접근이 필요

3.2. 특성에 따른 분류

  1. 범주형 데이터
    • 범주는 구분할 수 없는 값, 즉 종류를 나타내는 값을 가진 데이터
    • 성별, 학년 등
    • 명목형 데이터: 서열이 없는 값을 가진 데이터
    • 순서형 데이터: 서열이 있는 값을 가진 데이터
  2. 수치형 데이터
    • 양적 측면에서 연산이 가능한 숫자 값을 가진 데이터
      • 이산형 데이터: 단절된 값을 가진 데이터 (소수점이 없는 경우)
      • 연속형 데이터: 연속적으로 이어지는 값을 가진 데이터

 

자료

  • 데이터베이스 개론 3판 (김연희 저, 2024.1)

'[컴퓨터 과학자 스터디] > 데이터베이스' 카테고리의 다른 글

관계 데이터 연산  (0) 2024.11.21
관계 데이터 모델  (0) 2024.11.21
데이터 모델링  (1) 2024.11.17
데이터베이스 시스템  (1) 2024.11.16
데이터베이스 관리 시스템  (1) 2024.11.14

블로그의 정보

프리니의 코드저장소

Frinee

활동하기