Odds and Ends
[정보처리기사 실기 요약] - 3. 데이터 입출력 구현 (CH1.논리 데이터 저장소 확인, CH2.물리 데이터 저장소 설계, CH3.데이터베이스 기초 활용하기) 본문
[정보처리기사 실기 요약] - 3. 데이터 입출력 구현 (CH1.논리 데이터 저장소 확인, CH2.물리 데이터 저장소 설계, CH3.데이터베이스 기초 활용하기)
Squidward 2022. 10. 8. 16:05Chap01 논리 데이터 저장소 확인 (중요도: ***)
1. 데이터 모델: 현실세계 정보를 인간/컴퓨터가 이해하도록 추상화하여 표현한 모델
2. 데이터 모델 절차: 요구사항 분석 > 개념적 설계 > 논리적 설계 > 물리적 설계
3. 논리 데이터 모델링: 업무의 모습을 모델링 표기법으로 형상화하여 사람이 이해하기 쉽게 표현하는 프로세스
4. 논리적 데이터 모델링 종류
- 관계 데이터 모델: 테이블 형태, 1:1 , 1:N , N:M
- 계층 데이터 모델: 트리 형태(상하 관계), 1:N
- 네트워크 데이터 모델: 그래프 형태, N:M
5. 관계 대수 연산자 종류
1) 일반 집합 연산자
- 합집합
- 교집합
- 차집합
- 카티션 프로덕트
2) 순수 관계 연산자
- 셀렉트
- 프로젝트
- 조인
- 디비전
6. 관계 해석: 튜플 관계해석과 도메인을 해석하는 비절차적 언어
7. 논리 데이터 모델링 속성: 개체(Entity), 속성(attributes), 관계(Relationship)
8. 개체 관계(E-R) 모델: 데이터와 그들간 관계를 사람이 이해할 수 있는 형태로 표현한 모델
9. 정규화: 데이터 모델에서 데이터 중복성을 제거하여 이상 현상을 방지하고, 데이터의 일관성/정확성 유지를 위해 무손실 분해하는 과정
10. 이상현상: 데이터 중복성으로 인해 릴레이션 조작 시 발생하는 비합리적인 현상
- 삽입 이상: 불필요한 세부정보 입력하는 경우
- 삭제 이상: 원치 않는 다른정보가 같이 삭제되는 경우
- 갱신 이상: 특정부분만 수종되어 중복된 값이 모순을 일으키는 경우
11. 정규화 단계
- 1정규형: 도메인이 원자값
- 2정규형: 부분함수 종속제거 (완전 함수적 종속을 만족)
- 3정규형: 이행함수 종속 제거
- 보이스-코드 정규형(BCNF): 결정자 후보 키가 아닌 함수 종속 제거
- 4정규형: 다중 값 종속 제거
- 5정규형: 조인 종속 제거
12. 반정규화: 정규화도니 개체, 속성, 관계에 대해 성능향상과 개발운영의 단순화를 위해 중복/통합/분리 등을 수행하는 데이터 모델링 기법
Chap02 물리 데이터 저장소 설계 (중요도: ***)
1. 참고무결성 제약조건: 릴레이션과 릴레이션 사이에 대한 참조의 일관성을 보장하기 위한 조건
- 제한(Restricted): 다른 테이블이 삭제할 테이블을 참조 중이면 제거하지 않는 옵션
- 연쇄(Cascade): 참조하는 테이블까지 연쇄적으로 제거하는 옵션
- 널값(Set Null): 참조되는 릴레이션에서 튜플을 삭제하고, 참조하는 튜플들의 외래값에 NULL 값을 넣는 옵션(만약 NOT NULL 명시시 삭제 연산 거절됨)
ALTER TABLE 테이블 ADD
FOREIGN KEY (외래키)
REFERENCES 참조테이블(기본키)
ON DELETE [ RESTRICT | CASCADE | SET NULL ];
2. 인덱스: 데이터 레코드를 빠르게 접근하기 위해 '키값, 포인터' 쌍으로 구성되는 데이터 구조
- 클러스터드 인덱스: 인덱스 키의 순서에 따라 데이터가 정렬되어 저장되는 방식
- 넌클러스터드 인덱스: 인덱스의 키값만 정렬되어 있고 실제 데이터는 정렬되지 않는 방식
3. 뷰: 접근이 허용된 자료만을 제한적으로 보여주기 위해 하나 이상의 기본 테이블로 구성된 가상 테이블
4. 클러스터: 데이터 액세스 효율을 향상시키기 위해 동일한 성격의 데이터를 동일한 데이터 블록에 저장하는 물리적 저장 방법. 클러스터의 분포도가 넓을수록 유리하다.
5. 파티션: 대용량의 테이블이나 인덱스를 작은 논리적 단위인 파티션으로 나누는 것
- 범위 분할 : 지정한 열의 값을 기준으로 분할함
- 해시 분할: 해시 함수를 적용한 결과 값에 따라 데이터를 분할
- 리스트 분할: 특정 파티션에 저장될 데이터에 대한 명시적 제어가 가능한 분할기법
- 조합 분할: 범위,해시,리스트 분할 중 2개 이상의 파티셔닝을 결합하는 방식. 파티션이 너무 클 때 사용
6. 파티션 장점: 성능 향상, 가용성 향상, 백업 가능, 경합 감서
Chap03 데이터 베이스 기초 활용하기 (중요도: ***)
1. 데이터베이스: 다수 인원/시스템/프로그램이 사용할 목적으로 통합하여 관리되는 데이터의 집합
2. 데이터베이스의 정의
- 통합된 데이터: 자료 중복 배제한 데이터 모임
- 저장된 데이터: 저장매체에 저장된 데이터
- 운영 데이터: 조직 업무를 수행하는데 필요한 데이터
- 공용 데이터: 여러 어플리케이션, 시스템이 공동으로 사용하는 데이터
3. 데이터베이스 특성
- 실시간 접근성: 쿼리에 대하여 실시간 응답이 가능해야 함
- 계속적인 변화: 새로운 데이터의 삽입, 삭제 갱신으로 항상 최신 데이터 유지
- 동시공용: 다수의 사용자가 동시에 같은 내용의 데이터를 이용할 수 있어야함
- 내용 참조: 사용자가 요구하는 데이터 내용으로 데이터 찾음
4. 데이터베이스 종류
- 파일 시스템: 파일에 이름을 부여하고 저장/검색을 위해 논리적으로 어디에 위치시켜야하는 지 정의한 뒤 관리하는 DB 전단계의 데이터 관리 방식
- 관계형 데이터베이스 시스템(RDBMS): 관계형 모델 기반 _ 종류 : Oracle, SQL Server, MySQL, Maria DB 등
- 계층형 데이터베이스 시스템(HDBMS): 데이터를 상하 종속적인 관계로 계층화하여 관리 _ 종류 : IMS, System 2000 등
- 네트워크 데이터베이스 관리시스템(NDBMS): 데이터를 네트워크상의 망상 형태로 표현한 데이터 모델 _ 종류: IDS,IDMS 등
5. DBMS(Database Management System): 데이터관리 복잡성 해결하는 동시 Data 추가/변경/검색/삭제/백업/복구/보안 등 기능지원
6. DBMS 유형
- 키-값 DBMS: Unique한 키에 하나의 값을 가진 형태
- 컬럼 기반 데이터 저장 DBMS: Key 안에 (Column, Value) 조합으로 된 여러개의 필드를 갖는 DBMS
- 문서저장 DBMS: 값(Value)의 데이터타입이 문서인 DBMS
- 그래프 DBMS: 시맨틱 웹과 온톨로지 분야에서 활용되는 그래프로 데이터를 표현하는 DBMS
6. DBMS 특징: 무결성, 일관성, 회복성, 보안성, 효율성
7. 빅 데이터: 시스템, 서비스, 회사 등에서 주어진 비용/시간 내에 처리 가능한 큰 크기의 비정형 데이터
- 빅데이터 특성: 데이터 양/다양성/속도
- 빅데이터 수집/저장/처리 기술
- 비정형/반정형 데이터 수집: 내/외부 정제되지 않은 데이터를 확보하여 수집/전송
- 정형 데이터 수집: 내/외부 정제된 데이터 수집/전송
- 분산 데이터 저장/처리: 대용량 파일의 효과적인 분산 저장/분산 처리 기술
- 분산데이터베이스: HDFS 칼럼 기반 데이터베이스로 실시간 랜덤 조회/업데이트 가능
** HDFS : 대용량 데이터의 집합을 처리하는 응용 프로그램에 적합하도록 설계된 하둡 분산 파일 시스템
8. NoSQL(Not Only SQL): 저장에 고정된 테이블 스키마가 필요하지 않고 조인 연산 사용 불가, 수평적으로 확장 가능한 DBMS
- NoSQL 특성
- 언제든지 데이터 접근 가능
- 외부에서 전송된 정보를 통해 결정
- 일관성이 유지됨
- NoSQL 유형
- Key-Value Store: Unique한 키에 하나의 값
- Column Family data store : Key 안에 (컬럼,벨류) 조합으로 여러개의 필드를 갖는 디비
- Document Store : 값(Value)의 데이터타입이 문서인 DBMS
- 그래프 DBMS: 시맨틱 웹과 온톨로지 분야에서 활용되는 그래프로 데이터를 표현하는 DBMS
* 시맨틱 웹: 서비스 검색/조합/중재 자동화
* 온톨로지: 실세계에 존재하는 모든 개념을 컴퓨터가 이해하도록 서술한 지식베이스
9. 데이터 마이닝: 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙/패턴을 찾아내는 기술
10. 데이터 마이닝 절차: 목적 설정 > 데이터 준비 > 가공 > 마이닝 기법 적용 > 정보 검증
11. 데이터 마이닝 주요 기법
- 분류 규칙: 과거 데이터 토대로 새로운 레코드 결과 값 예측
- 연관 규칙: 항목 간 종속관계
- 연속 규칙: 연관 규칙에 시간 관련 정보가 포함된 기법
- 데이터 군집화: 대상 레코드들을 유사한 특성을 지닌 몇개의 소그룹으로 분할하는 작업
'정보처리기사 요약 정리' 카테고리의 다른 글
[정보처리기사 실기 요약] - 5. 인터페이스 구현 (CH1. 인터페이스 구현, CH2.인터페이스 구현 검증) (0) | 2022.10.09 |
---|---|
[정보처리기사 실기 요약] - 4. 통합 구현 (CH1.연계 요구사항 분석, CH2.연계 매커니즘 구성, CH3.내외부 연계 모듈 구현) (0) | 2022.10.09 |
[정보처리기사 실기 요약] - 2.화면설계 (ch01. UI 요구사항 확인, ch02.UI 설계) (1) | 2022.10.08 |
[정보처리기사 실기 요약] - 1. 요구사항 확인 (ch03. 요구사항 확인, ch04.분석 모델 확인하기) (0) | 2022.09.29 |
[정보처리기사 실기 요약] - 1. 요구사항 확인 (ch2.현행 시스템 분석) (0) | 2022.09.28 |