[database] 트랜잭션(transaction)과 격리성(Isolation)
트랜잭션(Transaction)
트랜잭션은 데이터베이스의 상태를 변화시키기 위해서 수행하는 작업의 단위를 뜻합니다.
여러개의 테이블에 차례대로 데이터를 insert를 한다고 가정합니다.
테이블이 쪼개져 있으므로 테이블간의 데이터 정합성을 유지하는 것이 중요합니다.
A, B에는 insert를 했으나 C에 insert 하기 전 서버가 에러 또는 특정 작업에 의해 정상적으로 처리하지 못하는 상황이 되었다고 한다면, 결과적으로 이 데이터는 믿을 수 없는 데이터가 됩니다.
이를 해결하기 위한 방법으로 DB는 All or Nothing전략을 취합니다. 즉, A,B,C에 정상적으로 insert하거나 아무것도 insert하지 않는 것입니다. DB에서는 이 전략을 위해서 트랜잭션이라는 단위를 사용하빈다. 트랜잭션 단위는 나누어지지 않는 최소한의 단위라고 정의합니다. 위 로직에 트랜잭션이 적용되면 오류가 났을 시, A,B에 대한 insert한 것을 Rollback함으로써 Nothing으로 전략을 취합니다.
트랜잭션은 4가지의 특징을 가집니다.
1. 원자성(Atomicity)
트랜잭션은 더 이상 분해가 불가능한 업무의 최소단위이므로, 전부 처리되거나 아예 하나도 처리되지 않아야 한다.
2. 일관성(Consistency)
일관된 상태의 데이터베이스에서 하나의 트랜잭션을 성공적으로 완료하고 나면 그 데이터베이스는 여전히 일관된 상태여야 한다.
즉, 트랜잭션 실행의 결과로 데이터베이스 상태가 모순되지 않아야 한다.
3. 격리성(Isolation)
실행 중인 트랜잭션의 중간결과를 다른 트랜잭션이 접근할 수 없다.
4. 영속성(Durability)
트랜잭션이 일단 그 실행을 성공적으로 완료하면 그 결과는 데이터베이스에 영속적으로 저장된다.
트랜잭션의 격리성(Transcation Isolation)
트랜잭션의 격리성은 '실행 중인 트랜잭션의 중간결과를 다른 트랜잭션이 접근할 수 없다' 라는 정의를 가지고 있습니다.
막연하게 접근할 수 없다라기 보다는 일반적으로 접근 레벨이 있으며 DB에 따라 설정이 가능합니다.
이런 격리성은 강하게 처리할 수 있으며 반대로 약하게 처리할 수도 있습니다.
격리성으로 인해 나타날 수 있는 문제점은 일반적으로 Dirty Read, Non-Repeatable Read, Phantom Read 3가지가 있습니다.
Dirty Read
Dirty Read는 다른 트랜잭션에 의해 수정됐지만 아직 커밋되지 않은 데이터를 읽는 것을 말합니다.
Non-Repeatable Read
Non-Repeatable Read는 한 트랜잭션 내에서 같은 Key를 가진 Row를 두 번 읽었는데 그 사이에 값이 변경되거나 삭제되어 결과가 다르게 나타나는 현상을 말합니다.
Phantom Read
한 트랜잭션 내에서 같은 쿼리를 두 번 수정했는데, 첫 번째 쿼리에서 없던 유령(Phantom) 레코드가 두 번쨰 쿼리에서 나타나는 현상을 말합니다.
Phantom Read 와 Non-Repeatable Read의 차이는 Non-Repeatable Read는 1개의 Row씩 데이터의 값이 변경되는 것이며 Phantom Read는 다건을 요청하는 것에 대해서 데이터의 값이 변경되는 것입니다.
지정할 수 있는 격리성 수준
Database에서 제공하는 격리성 수준(Transaction Isolation Level)에 대해서 알아보도록 하겠습니다.
아래의 4개의 격리수준은 ANSI/ISO SQL표준(SQL92)에서 정의한 내용입니다.
Read Uncommitted
트랜잭션에서 처리중인 아직 커밋되지 않은 데이터를 다른 트랜잭션이 읽는 것을 허용합니다. 해당 수준에서는 Dirty Read, Non-Repeatable Read, Phantom Read가 일어날 수 있습니다. 이 설정은 정합성에 문제가 있기 때문에 권장하는 설정은 아닙니다.
Read Committed
트랜잭션이 커밋되어 확정된 데이터만 다른 트랜잭션이 읽도록 허용합니다. 따라서 Dirty Read의 발생가능성을 막습니다.
커밋 되지 않은 데이터에 대해서는 실제 DB 데이터가 아닌 Undo 로그에 있는 이전 데이터를 가져오는 것입니다.
하지만 Non-Repeatable Read와 Phantom Read에 대해서는 발생 가능성이 있습니다.
Repeatable Read
트랜잭션 내에서 삭제, 변경에 대해서 Undo 로그에 넣어두고 앞서 발생한 트랜잭션에 대해서는 실제 데이터가 아닌 Undo 로그에 있는 백업데이터를 읽게 합니다. 이렇게 함으로써 트랜잭션 중 값의 변경에 대해서 일정한 값으로 처리할 수 있습니다. 이렇게 하면 삭제와 수정에 대해서 트랜잭션 내에서 불일치를 가져오던 Non-Repeatable Read를 해소할 수 있습니다.
Serializable Read
트랜잭션 내에서 쿼리를 두 번 이상 수행할 때, 첫 번째 쿼리에 있던 레코드가 사라지거나 값이 바뀌지 않음은 물론 새로운 레코드가 나타나지 않도록 하는 설정입니다.
참고 자료
https://sabarada.tistory.com/117
더 보면 좋은 자료