독서

[데이터베이스 개론] 회복과 병행 제어

오렌지색 귤 2022. 3. 15. 23:32
반응형

트랜잭션

 

 

정의

 

하나의 작업을 수행하는 데 필요한 데이터베이스의 연산들을 모아놓은 것

 

데이터베이스에 장애가 발생했을 때, 데이터를 복구하는 작업의 단위이다

 

 

특성

 

1. 원자성 Atomicity

 

트랜잭션을 구성하는 연산들이 모두 정상적으로 실행되거나 하나도 실행되지 않아야 한다는 all-or-nothing 방식

 

트랜잭션이 원자이므로 쪼개져서 반은 되고 반은 안되는건 불가능

 

 

2. 일관성 Consistency

 

트랜잭션이 성공적으로 수행된 후에도 데이터베이스가 일관된 상태를 유지해야 함을 의미

 

질량 보존의 법칙 같은 느낌

 

 

3. 격리성 Isolation

 

현재 수행 중인 트랜잭션이 완료될 때까지 트랜잭션이 생성한 중간 연산 결과에 다른 트랜잭션들이 접근할 수 없음을 의미

 

 

트랜잭션이 동시에 수행되지만 독립적으로 수행되려면 당연

 

4. 지속성 Durability

 

영속성이라고도 하는데 트랜잭션이 성공적으로 완료된 후 데이터베이스에 반영한 수행 결과는 어떠한 경우에도 손실되지 않고 영구적이어야 함을 의미

 

시스템에 장애가 발생해도 트랜잭션 작업 결과는 데이터베이스에 남아 있어야 하며, 이를 보장하려면 회복 기능이 필요

 

 

 

트랜잭션의 특성            DBMA의 기능

원자성      ------------------ 회복 기능
일관성      ------------------ 병행 제어 기능
격리성      ------------------ 병행 제어 기능
지속성      ------------------ 회복 기능

 

 

 

트랜잭션의 연산

 

Commit : 트랜잭션이 성공적으로 수행되었음을 선언 (작업 완료)

 

Rollback : 트랜잭션을 수행하는 데 실패했음을 선언 (작업 취소)

 

 

 

 

트랜잭션의 상태

 

 

 

활동 상태 : 트랜잭션이 수행되기 시작하여 현재 수행 중인 상태

 

부분 완료 상태 : 트랜잭션의 마지막 연산이 실행된 직후의 상태

 

완료 상태 : 트랜잭션이 성공적으로 완료되어 commit 연산을 실행한 상태

 

트랜잭션이 완료 상태가 되면 트랜잭션이 수행한 최종 결과를 데이터베이스에 반영하고, 데이터베이스가 새로운 일관된 상태가 되면서 트랜잭션이 종료된다

 

 

실패 상태 : 하드웨어나 소프트웨어의 문제, 트랜잭션 내부의 오류 등 여러 이유로 인해 장애가 발생하여 트랜잭션의 수행이 중단된 상태

 

철회 상태 : 트랜잭션을 수행하는 데 실패하여 rollback 연산을 실행한 상태

 

 

 

 

 


장애와 회복

 

장애의 유형

 

1. 트랜잭션 장애

 

의미 : 트랜잭션 수행 중 오류가 발생하여 정상적으로 수행을 계속할 수 없는 상태

 

원인 : 트랜잭션의 논리적 오류, 잘못된 데이터 입력, 시스템 자원의 과다 사용 요구, 처리 대상 데이터의 부재 등

 

2. 시스템 장애

 

의미 : 하드웨어의 결함으로 정상적으로 수행을 계속할 수 없는 상태

 

원인 : 하드웨어 이상으로 메인 메모리에 저장된 정보가 손실되거나 교착 상태가 발생한 경우 등

 

3. 미디어 장애

 

의미 : 디스크 장치의 결함으로 디스크에 저장된 데이터베이스의 일부 혹은 전체가 손상된 상태

 

원인 : 디스크 헤드의 손상이나 고장 등

 

 

데이터베이스의 저장 연산

 

저장 장치의 종류

 

1. 휘발성 저장 장치 (소멸성)

 

의미 : 장애가 발생하면 저장된 데이터가 손실됨

 

예 : 메인 메모리 등

 

2. 비휘발성 저장 장치 (비소멸성)

 

의미 : 장애가 발생해도 저장된 데이터가 손실되지 않음. 단, 디스크 헤더 손상같은 저장 장치 자체에 이상이 발생하면 데이터가 손실될 수 있음

 

예 : 디스크, 자기 테이프, CD/DVD 등

 

3. 안정 저장 장치

 

의미 : 비휘발성 저장 장치를 이용해 데이터 복사본 여러 개를 만드는 방법으로, 어떤 장애가 발생해도 데이터가 손실되지 않고 데이터를 영구적으로 저장할 수 있음

 

 

 

데이터 이동 연산

 

 

 

input(X) : 디스크 블록에 저장되어 있는 데이터 X를 메인 메모리 버퍼 블록으로 이동시키는 연산

 

output(X) : 메인 메모리 버퍼 블록에 있는 데이터 X를 디스크 블록으로 이동시키는 연산

 

read(X) : 메인 메모리 버퍼 블록에 저장되어 있는 데이터 X를 프로그램의 변수로 읽어오는 연산

 

write(X) : 프로그램의 변수 값을 메인 메모리 버퍼 블록에 있는 데이터 X에 기록하는 연산

 

 

 

 

 

회복 기법

 

회복 : 데이터베이스에 장애가 발생했을 때 장애가 발생하기 전의 모순이 없고 일관된 상태로 복구시키는 것

 

데이터베이스 관리 시스템에 있는 회복 관리자 (recovery manager) 가 담당

 

 

 

 

회복을 위한 연산

 

1. 덤프 dump : 데이터베이스 전체를 다른 저장 장치에 주기적으로 복사하는 방법

 

2. 로그 log : 데이터베이스에서 변경 연산이 실행될 때마다 데이터를 변경하기 이전 값과 변경한 이후의 값을 별도의 파일에 기록하는 방법

 

3. redo 재실행 : 가장 최근에 저장한 데이터베이스 복사본을 가져온 후 로그를 이용해 복사본이 만들어진 이후에 실행된 모든 변경 연산을 재실행하여 장애가 발생하기 직전의 데이터베이스 상태로 복구 (전반적으로 손상된 경우에 주로 사용)

 

4. undo 취소 : 로그를 이용해 지금까지 실행된 모든 변경 연산을 취소하여 데이터베이스를 원래의 상태로 복구 (변경 중이었거나 이미 변경된 내용만 신뢰성을 잃은 경우에 주로 사용)

 

 

 

 

 

로그 회복 기법

 

1. 즉시 갱신 회복 기법

 

트랜잭션 수행 중에 데이터를 변경한 연산의 결과를 데이터베이스에 즉시 반영한다

 

그리고 장애 발생에 대비하기 위해 데이터 변경에 대한 내용을 로그 파일에도 기록한다

 

한 트랜잭션 내에서도 연산이 끝날 때마다 commit

따라서 undo, redo 연산 모두 수행해야 한다

 

 

 

2. 지연 갱신 회복 기법

 

트랜잭션이 수행되는 동안에는 데이터 변경 연산의 결과를 데이터베이스에 즉시 반영하지 않고 로그 파일에만 기록해두었다가, 트랜잭션이 부분 완료된 후에 로그에 기록된 내용을 이용해 데이터베이스에 한 번에 반영한다

 

undo 연산은 필요 없고 redo 연산만 필요하다

장애가 발생할 경우 로그에 기록된 내용을 버리기만 하면 데이터베이스가 원래 상태를 그대로 유지한다

 

 

 

3. 검사 시점 회복 기법

 

로그를 이용한 회복 기법은 로그 전체를 분석하여 로그에 기록된 모든 트랜잭션을 대상으로 redo 나 undo 연산을 수행한다

👉 데이터베이스 회복에 너무 많은 시간이 걸리고 redo 연산을 수행할 필요가 없는 트랜잭션에도 redo를 실행하는 일이 발생하기도 한다

👉 비효율성을 해결하기 위해 제안된 방법이 검사 시점 회복 기법

 

로그회복 기법과 같은 방법으로 로그 기록을 이용하되, 일정 시간 간격으로 검사 시점 (checkpoint)을 만들어둔다

 

장애가 발생하면 가장 최근 검사 시점 이전의 트랜잭션에는 회복 작업을 수행하지 않고, 이후의 트랜잭션에만 회복 작업을 수행한다

 

 

 

4. 미디어 회복 기법

 

전체 데이터베이스의 내용을 일정 주기마다 다른 안전한 저장 장치에 복사해두는 덤프를 이용한다

 

 

 

 

 


병행 제어

 

병행 수행 concurrency : 여러 사용자가 데이터에비스를 동시에 공유할 수 있도록 여러개의 트랜잭션이 동시에 수행됨

 

인터리빙 방식 interleaving : 병행 수행은 실제로 여러 트랜잭션이 차례로 번갈아 수행됨

 

병행 제어 concurrency control : 여러 개의 트랜잭션이 병행 수행되면서 같은 데이터에 접근하여 연산을 실행하더라도, 문제 없이 정확한 수행 결과를 얻을 수 있도록 트랜잭션의 수행을 제어하는 것. 동시성 제어라고도 한다

 

 

병행 제어의 문제

 

1. 갱신 분실 lost update : 하나의 트랜잭션이 수행한 데이터 변경 연산의 결과를 다른 트랜잭션이 덮어써 변경 연산이 무효화되는 것

 

 

2. 모순성 inconsistency : 하나의 트랜잭션이 여러 개의 데이터 변경 연산을 실행할 때 일관성 없는 상태의 데이터베이스에서 데이터를 가져와 연산을 실행함으로써 모순된 결과가 발생하는 것

 

덮어쓰는 것은 아니지만 트랜잭션 도중에 껴들어서 값을 바꾸는 경우

 

 

3. 연쇄 복귀 cascading rollback : 트랜잭션이 완료되기 전에 장애가 발생하여 rollback 연산을 수행하면, 이 트랜잭션이 장애 발생 전에 변경한 데이터를 가져가 변경 연산을 실행한 또 다른 트랜잭션에도 rollback 연산을 연쇄적으로 실행해야 한다는 것

 

일관성에 아무런 영향을 미치지는 않지만 트랜잭션 도중에 값을 바꾸고 커밋되어 버리면, 후에 rollback 연산이 필요한 경우 문제가 발생한다

 

 

 

트랜잭션 스케줄

 

 

1. 직렬 스케줄 : 인터리빙 방식을 이용하지 않고 각 트랜잭션별로 연산들을 순차적으로 실행시키는 것

 

항상 모순이 없는 정확한 결과를 얻으나 병행 수행이라고 할 수 없다 (잘 사용되지 않는다)

 

 

 

2. 비직렬 스케줄 : 인터리빙 방식을 이용하여 트랜잭션을 병행해서 수행시키는 것

 

각각의 스케줄마다 문제가 발생할 수 있어 최종 수행 결과의 정확성을 보장할 수 없다

 

 

 

3. 직렬 가능 스케줄 : 직렬 스케줄에 따라 수행한 것과 같이 정확한 결과를 생성하는 비직렬 스케줄

 

인터리빙 방식을 이용하면서도 결과의 정확성을 보장할 수 있다

 

하지만 직렬 가능 스케줄인지 여부를 판단하는 것이 쉽지 않고 복잡한 작업이다

 

따라서 대부분의 데이터베이스 관리 시스템에서는 직렬 가능 스케줄인지 검사하기보다는 직렬 가능성을 보장하는 병행 제어 기법을 사용한다

 

 

 

 

 

병행 제어 기법

 

병행 제어 기법의 기본 원리는 모든 트랜잭션이 따르면 직렬 가능성이 보장되는 나름의 규약을 정의하고, 트랜잭션들이 이 규약을 따르도록 하는 것이다

 

 

 

 

 

로킹 기법 locking : 병행 수행되는 트랜잭션들이 동일한 데이터에 동시에 접근하지 못하도록 lock과 unlock이라는 2개의 연산을 이용해 제어

 

기본 원리 : 한 트랜잭션이 먼저 접근한 데이터에 대한 연산을 모두 마칠 때까지, 해당 데이터에 다른 트랜잭션이 접근하지 못하도록 상호 배제하여 직렬 가능성을 보장

 

 

 

모든 트랜잭션이 지켜야 하는 기본 로킹 규약

- 트랜잭션이 데이터에 read 또는 write 연산을 실행하기 전에 반드시 lock 연산을 실행해야 한다

- lock 연산을 통해 독점권을 획득한 데이터에 대한 모든 연산을 수행하고 나면 unlock 연산을 실행해서 독점권을 반납해야 한다

- 데이터에 lock 연산을 실행한 트랜잭션만 해당 데이터에 unlock 연산을 실행할 수 있다

 

 

로킹 단위가 커질수록 병행성은 낮아지지만 제어가 쉽고

로킹 단위가 작아질수록 제어가 어렵지만 병행성은 높아진다

 

 

 

lock 연산

 

1. 공용 lock

 

트랜잭션이 데이터에 대해 공용 lock 연산을 실행하면, 해당 데이터에 read 연산을 실행할 수 있지만 write 연산은 실행할 수 없다

 

그리고 해당 데이터에 다른 트랜잭션도 공용 lock 연산을 동시에 실행할 수 있다

 

 

2. 전용 lock

 

트랜잭션이 데이터에 전용 lock 연산을 실행하면 해당 데이터에 read 연산과 write 연산을 모두 실행할 수 있다

 

그러나 해당 데이터에 다른 트랜잭션은 공용이든 전용이든 어떤 lock 연산도 실행할 수 없다

 

 

 

 

 

기본 로킹 규약만으로는 트랜잭션 스케줄의 직렬 가능성을 완벽하게 보장할 수 없다

 

 

위의 그림에서는 분명 기본 로킹 규약을 준수했지만, 잘못된 결과를 낸다

 

 

 

 

2단계 로킹 규약

 

모든 트랜잭션이 lock과 unlock 연산을 다음과 같이 2단계로 나누어 실행해야 한다

 

1. 확장 단계 : 트랜잭션이 lock 연산만 실행할 수 있고, unlock 연산은 실행할 수 없는 단계

 

2. 축소 단계 : 트랜잭션이 unlock 연산만 실행할 수 있고, lock 연산은 실행할 수 없는 단계

 

위의 그림과 같이 2단계 로킹 규약을 적용하면 트랜잭션 스케줄의 직렬 가능성을 보장할 수 있다

 

하지만 교착 상태가 발생할 수 있어 이에 대한 해결책이 필요하다

 

 

 

 


PS

데이터베이스 개론 2판, 한빛아카데미, 김연희 저

반응형