iOS 개발일기

[정보처리기사 실기] 02. 데이터 입출력 구현 본문

메모장/정보처리기사 실기

[정보처리기사 실기] 02. 데이터 입출력 구현

맨날 까먹으니 적어두자 2024. 10. 3. 20:05

데이터베이스 관리 시스템(DBMS; DataBase Management System)

  • 사용자의 요구에 따라 정보를 생성해주고, 데이터베이스를 관리해주는 소프트웨어
  • 기존의 파일 시스템이 갖는 데이터의 종속성과 중복성의 문제를 해결하기 위해 제안된 시스템
  • 기능
    • 정의(Definition) : 데이터의 타입과 구조에 대한 정의, 이용 방식, 제약 조건 등을 명시
    • 조작(Manipulation) : 데이터 검색, 갱신, 삽입, 삭제 등을 위해 인터페이스 수단을 제공
    • 제어(Control) : 데이터의 무결성, 보안, 권한 검사, 병행 제어 제공

 

 

스키마(Schema)

  • 데이터베이스의 구조와 제약 조건에 관한 전반적인 명세를 기술한 것
  • 종류
    • 외부 스키마(External Schema)
      • 사용자나 응용 프로그래머가 각 개인의 입장에서 필요로 하는 데이터베이스의 논리적 구조를 정의한 것
      • 서브 스키마(Sub Schema) 라고도 한다.
    • 개념 스키마(Conceptual Schema)
      • 데이터베이스의 전체적인 논리적 구조
      • 모든 응용 프로그램이나 사용자들이 필요로 하는 데이터를 종합한 조직 전체의 데이터베이스로 하나만 존재
    • 내부 스키마(Internal Schema)
      • 물리적 저장장치의 입장에서 본 데이터베이스 구조
      • 설제로 저장될 레코드의 형식, 저장 데이터 항목의 표현 방법, 내부 레코드의 물리적 순서 등을 나타낸다.

 

 

데이터베이스 설계

  • 사용자의 요구를 분석하여 그것을 컴퓨터에 저장할 수 있는 데이터베이스의 구조에 맞게 변형한 후, DBMS로 데이터베이스를 구현하여 일반 사용자들이 사용하게 하는 것
  • 고려사항
    • 무결성 : 삽입, 삭제, 갱신 등의 연산 후에도 데이터베이스에 저장된 데이터가 정해진 제약조건을 항상 만족해야 한다.
    • 일관성 : 데이터베이스에 저장된 데이터들 사이나 특정 질의에 대한 응답이 처음부터 끝까지 변함없이 일정해야 한다.
    • 회복 : 시스템에 장애가 발생했을 때, 장애 발생 직전의 상태로 복구할 수 있어야 한다.
    • 보안 : 불법적인 데이트의 노출 또는 변경이나 손실로부터 보호할 수 있어야 한다.
    • 효율성 : 응답시간의 단축, 시스템의 생산성, 저장 공간의 최적화 등이 가능해야 한다.
    • 데이터베이스 확장 : 데이터베이스 운영에 영향을 주지 않으면서 지속적으로 데이터를 추가할 수 있어야 한다.
  • 설계 순서
    1. 요구 조건 분석
      • 데이터베이스를 사용할 사람들로부터 필요한 용도를 파악
      • 수집된 정보를 바탕으로 조건 명세 작성
    2. 개념적 설계(정보 모델링, 개념화)
      • 정보의 구조를 얻기 위하여 현실 세계의 무한성과 계속성을 이해하고, 다른 사람과 통신하기 위하여 현실 세계에 대한 인식을 추상적 개념으로 표현하는 과정
      • 개념 스키마 모델링과 트랜잭션 모델링을 병행 수행
      • 요구 분석에서 나온 결과인 요구 조건 명세를 DBMS에 독립적인 E-R 다이어그램으로 작성
      • DBMS에 독립적인 개념 스키마 설계
    3. 논리적 설계(데이터 모델링)
      • 현실 세계에서 발생하는 자료를 컴퓨터가 이해하고 처리할 수 있는 물리적인 저장장치에 저장할 수 있도록 변환하기 위해 특정 DBMS가 지원하는 논리적 자료 구조로 변환시키는 과정
      • 트랜잭션의 인터페이스 설계
    4. 물리적 설계(데이터 구조화)
      • 논논리적인 설계에서 논리적 구조로 표현된 데이터를 디스크 등의 물리적인 저장장치에 저장할 수 있는 물리적인 데이터로 변환하는 과정
      • 다양한 데이터베이스 응용에 대해서 처리 성능을 얻기 위해 데이터베이스 파일의 저장 구조 및 엑세스 경로를 결정
    5. 구현 
      • 논리적 설계와 물리적 설계에서 도출된 데이터베이스 스키마를 파일로 생성하는 과정
      • DBMS의 DDL(데이터 정의어)을 이용하여 데이터베이스 스키마를 기술한 후, 컴파일하여 빈 데이터베이스 파일 생성
      • 응용 프로그램을 위한 트랜잭션 작성 및 데이터베이스 접근을 위한 응용 프로그램 작성

 

 

데이터 모델

  • 현실 세계의 정보들을 컴퓨터에 표현하기 위해서 단순화, 추상화하여 체계적으로 표현한 개념적 모형
  • 구성요소
    • 개체(Entity) : 사람이 생각하는 개념이나 정보 단위 같은 현실 세계의 대상체
    • 속성(Attribute) : 데이터베이스를 구성하는 가장 작은 논리적 단위
    • 관계(Relationship) : 개체와 개체 사이의 논리적인 연결
  • 종류
    • 개념적 데이터 모델
      • 현실 세계에 대한 인간의 이해를 돕기 위해 현실 세계에 대한 인식을 추상적 개념으로 표현하는 과정
      • 정보 모델이라고도 하며, 대표적인 모델로 E-R 모델이 있다.
    • 논리적 데이터 모델
      • 개념적 모델링 과정에서 얻은 개념적 구조를 컴퓨터가 이해하고 처리할 수 있는 컴퓨터 세계의 환경에 맞도록 변환하는 과정
      • 데이터 간의 관계 표현에 따라 관계 모델, 계층 모델, 네트워크 모델로 구분
    • 물리적 데이터 모델
  • 표시 요소
    • 연산(Operation) : 데이터베이스에 저장된 실제 데이터를 처리하는 작업에 대한 명세
    • 구조(Structure) : 데이터베이스에 논리적으로 표현될 대상으로서의 개체 타입과 개체 타입 간의 관계
    • 제약 조건(Constraint) : 데이터베이스에 저장될 수 있는 실제 데이터의 논리적인 제약 조건

 

 

식별자(Identifier)

  • 하나의 개체 내에서 각각의 인스턴스를 유일하게 구분할 수 있는 구분자
  • 모든 개체는 반드시 1개 이상의 식별자를 가져야 한다.
  • 분류
    • 대표성 여부
      • 주 식별자(Primary Identifier) : 개체를 대표하는 유일한 식별자
      • 보조 식별자(Alternate Identifier) : 주 식별자를 대신하여 개체를 식별할 수 있는 식별자
    • 스스로 생성 여부
      • 내부 식별자(Internal Identifier) : 개체 내에서 스스로 만들어지는 식별자
      • 외부 식별자(Foreign Identifier) : 다른 개체와 관계에 의해 외부 개체의 식별자를 가져와 사용하는 식별자
    • 단일 속성 여부
      • 단일 식별자(Single Identifier) : 주 식별자가 한 가지 속성으로만 구성된 식별자
      • 복합 식별자(Composit Identifier) : 주 식별자가 두 개 이상의 속성으로 구성된 식별자
    • 대체 여부
      • 원조 식별자(Original Identifier) : 업무에 의해 만들어지는 가공되지 않은 원래의 식별자, 본질 식별자라고도 한다.
      • 대리 식별자(Surrogate Identifier) : 주 식별자의 속성이 2개 이상인 경우 속성들을 하나의 속성으로 묶어 사용하는 식별자, 인조 식별자라고도 한다.

 

 

주 식별자(Primary Identifier) 특징

  • 유일성 : 개체 내의 모든 인스턴스들은 주 식별자에 의해 유일하게 구분되어야 한다.
  • 최소성 : 유일성을 만족시키기 위해 필요한 최소한의 속성으로만 구성되어야 한다.
  • 불변성 : 주 식별자가 특정 개체에 한 번 지정되면, 그 식별자는 변하지 않아야 한다.
  • 존재성 : 주 식별자가 지정되면 식별자 속성에 반드시 데이터 값이 존재해야 한다.

 

 

E-R(Entity-Relationship) 모델

  • 1976년 피터 첸(Peter Chen)에 의해 제안되고 기본적인 구성 요소가 정립되었다.
  • 개체와 개체 간의 관계를 기본 요소로 이용하여 현실 세계의 무질서한 데이터를 개념적인 논리 데이터로 표현하기 위한 방법
  • E-R 다이어그램
    • 사각형 : 개체(Entity) 타입
    • 마름모 : 관계(Relationship) 타입
    • 타원 : 속성(Attribute) 타입
    • 이중 타원 : 다중값(복합) 속성
    • 밑줄 타원 : 기본키 속성
    • 복수 타원 : 복합 속성
    • 관계 : 1:1, 1:N, N:M 등의 개체 간 관계에 대한 대응수를 선 위에 기술
    • 선, 링크 : 개체 타입과 속성 연결

 

 

관계형 데이터베이스 구조

  • 릴레이션(Relation) : 데이터들을 표(Table)의 형태로 표현한 것으로, 구조를 나타내는 릴레이션 스키마와 실제 값들인 릴레이션 인스턴스로 구성
  • 튜플(Tuple)  
    • 릴레이션을 구성하는 각각의 행으로 속성의 모임으로 구성
    • 파일 구조에서 레코드와 같은 의미
    • 튜플의 수 : 카디널리티(Cardinality), 기수, 대응수
  • 속성(Attribute)
    • 데이터베이스를 구성하는 가장 작은 논리적 단위
    • 파일 구조에서 데이터 항목 또는 데이터 필드에 해당
    • 속성의 수 : 디그리(Degree), 차수
  • 도메인(Domain)
    • 하나의 속성(Attribute)이 취할 수 있는 같은 타입의 원자값들의 집합
    • 실제 속성 값이 나타날 때 그 값의 합법 여부를 시스템이 검사하는데에도 이용

 

 

관계형 데이터베이스의 제약조건 - 키(Key)

  • 키(Key) : 데이터베이스에서 조건에 만족하는 튜플을 찾거나 순서대로 정렬할 떄 기준이 되는 속성
  • 종류 : 
    • 후보키(Candidate Key)
      • 릴레이션을 구성하는 속성들 중에서 튜플을 유일하게 식별하기 위해 사용되는 속성들의 부분집합
      • 기본키로 사용할 수 있는 속성들
      • 유일성과 최소성을 모두 만족시켜야 한다.
    • 기본키(Primary Key)
      • 후보키 중에서 특별히 선정된 주키(Main Key)
      • 중복된 값 또는 NULL을 가질 수 없다.
      • 한 릴레이션에서 특정 튜플을 유일하게 구별할 수 있는 속성
    • 대체 키(Alternate Key)
      • 후보키가 둘 이상일 때 기본키를 제외한 나머지 후보키
      • 보조키라도고 한다.
    • 슈퍼키(Super Key)
      • 다른 릴레이션의 기본키를 참조하는 속성 또는 속성들의 집합
      • 한 릴레이션에 속한 속성 A와 참조 릴레이션의 기본키인 B가 동일한 도메인 상에서 정의되어 있을 때의 속성 A를 외래키라고 한다.
      • 외래키로 지정되면 참조 릴레이션의 기본키에 없는 값은 입력할 수 없다.

 

 

관계형 데이터베이스의 제약조건 - 무결성(Integrity)

  • 데이터베이스에 저장된 데이터 값과 그것이 표현하는 현실 세계의 실제 값이 일치하는 정확성
  • 무결성 제약조건 : 데이터베이스에 들어 있는 데이터의 정확성을 보장하기 위해 부정확한 자료가 데이터베이스 내에 저장되는 것을 방지하기 위한 제약조건
  • 종류 : 
    • 개체 무결성 : 기본 테이블의 기본키를 구성하는 어떤 속성도 NULL이나 중복 값을 가질 수 없다는 규정
    • 참조 무결성 : 릴레이션은 참조할 수 없는 외래키 값을 가질 수 없다는 규정
    • 도메인 무결성 : 주어진 속성 값이 정의된 도메인에 속한 값이어야 한다는 규정
    • 사용자 정의 무결성 : 속성 값들이 사용자가 정의한 제약조건에 만족되어야 한다는 규정
    • NULL 무결성 : 릴레이션의 특정 속성 값이 NULL이 될 수 없도록 하는 규정
    • 고유 무결성 : 릴레이션의 특정 속성에 대해 각 튜플이 갖는 속성 값들이 서로 달라야 한다는 규정
    • 키 무결성 : 하나의 릴레이션에는 적어도 하나의 키가 존재해야 한다는 규정
    • 관계 무결성 : 릴레이션에 어느 한 튜플의 삽입 가능 여부 또는 한 릴레이션의 튜플들 사이의 관계에 대한 적절성 여부를 지정한 규정

 

 

이상현상(Anomaly)

  • 데이터의 중복성으로 인해 릴레이션을 조작할 때 발생하는 비합리적인 현상
  • 종류 : 
    • 삽입 이상(Insertion Anomaly) : 데이터를 삽입하기 위해 불필요한 데이터도 함께 삽입해야하는 현상
    • 갱신 이상(Update Anomaly) : 중복된 데이터 중 일부만 수정되어 데이터 모순이 일어나는 현상
    • 삭제 이상(Deletion Anomaly) : 어떤 정보를 삭제하면, 의도하지 않은 다른 정보까지 삭제되어버리는 현상

 

 

정규화(Normalization)

  • 관계형 데이터 모델에서 데이터의 중복성을 제거하여 이상 현상을 방지하고, 데이터의 일관성과 정확성을 유지하기 위해서 무손실 분해하는 과정
  • 단계 : 
    1. 1정규형(1NF) : 원자값으로 구성
    2. 2정규형(2NF) : 부분 함수 종속 제거 (완전 함수적 종속 관계)
    3. 3정규형(3NF) : 이행 함수 종속 제거
    4. 보이스-코드 정규형(BCNF) : 결정자 후보 키가 아닌 함수 종속 제거
    5. 4정규형(4NF) : 다중 값 종속 제거
    6. 5정규형(5NF) : 조인 종속 제거

 

 

반 정규화(De-Nomalization)

  • 데이터베이스의 성능 향상을 위하여, 데이터 중복을 허용하고 조인을 줄이는 데이터베이스 성능 향상 기법
  • 기법 : 테이블 병합, 테이블 분할(수직, 수평), 테이블 추가, 컬럼 중복화, 중복 관계 추가

 

 

트랜잭션(Transaction)

  • 데이터베이스의 상태를 변환시키는 하나의 논리적 기능을 수행하기 위한 작업의 단위, 일련의 연산을 의미
  • 특성 : ACID 
    • Atomicity(원자성) 
      • 트랜잭션의 연산은 데이터베이스에 모두 반영되든지 아니면 전혀 반영되지 않아야 한다.
      • All or Nothing
      • Commit / Rollback 회복성 보장
    • Consistency(일관성)
      • 트랜잭션이 실행 성공 후 항상 일관된 데이터베이스 상태를 보존해야 한다.
      • 무결성 제약조건, 동시성 제어
    • Isolation(독립성)
      • 둘 이상의 트랜잭션이 동시에 병행 실행되는 경우 어느 하나의 트랜잭션 실행 중에 다른 트랜잭션의 연산이 끼어들 수 없다.
    • Durability(영속성)
      • 성공적으로 완료된 트랜잭션의 결과는 영구적으로 데이터베이스에 저장되어야 한다.