数据库的脏读(数据库的作用)

admin

作者

一、MySQL 事务隔离级别-面试相关话题

SQL 92 定义了四个隔离级别（Isolation (database systems) - Wikipedia），其隔离程度由高到低是：

串行化（Serializable）可重复读（Repeatable reads）提交读（Read committed）未提交读（Read uncommitted）

未提交读(Read Uncommitted)：允许脏读，也就是可能读取到其他会话中未提交事务修改数据库的脏读的数据。

提交读(Read Committed)：只能读取到已经提交的数据。Oracle等多数数据库默认都是该级别 (不重复读)。

可重复读(Repeated Read)：可重复读。在同一个事务内的查询都是事务开始时刻一致的，InnoDB默认级别。在SQL标准中，该隔离级别消除了不可重复读，但是还存在幻象读。

串行读(Serializable)：完全串行化的读，每次读都需要获得表级共享锁，读写相互都会阻塞。

当前主流数据库默认隔离级别:

MySQL->repeatable read；

Oracle、MS SQL Server ->read commited；

二、查看事务隔离级别及设置

SELECT @@global.tx_isolation, @@session.tx_isolation, @@tx_isolation;

1.查看当前会话隔离级别

select @@session.tx_isolation;

2.查看系统当前隔离级别

select @@global.tx_isolation;

3.设置当前会话隔离级别

set session transaction ISOLATION LEVEL REPEATABLE READ;

set session transaction ISOLATION LEVEL READ COMMITTED;

4.设置系统当前隔离级别

set global transaction isolation level repeatable read;

@@tx_isolation -- 默认的行为（不带session和global）是为下一个（未开始）事务设置隔离级别。

三、为什么MySQL用的是Repeatable Read而不是Read Committed？

MySQL binlog的格式三种：statement、row、mixed；

statement: 记录的是修改SQL语句。row：记录的是每行实际数据的变更。mixed：statement和row模式的混合。

那MySQL在5.0这个版本或以前，binlog只支持STATEMENT这种格式数据库的脏读！而这种格式在读已提交(Read Commited)这个隔离级别下主从复制是有bug的，因此Mysql将可重复读(Repeatable Read)作为默认的隔离级别！

在MySQL 5.1版本开始，binlog支持row格式。可以将binglog的格式修改为row格式，此时是基于行的复制，自然就不会出现SQL执行顺序不一样的问题！因此由于历史原因，MySQL将默认的隔离级别设为可重复读(Repeatable Read)，保证主从复制不出问题。

四、Read Commited和Repeatable Read比较

先了解一下Read Commited和Repeatable Read差异：

1. Read Committed

想要避免脏读，最简单的方式就是在事务更新操作上加一把写锁，其他事务需要读取数据时候，需要等待这把写锁释放。

如上图所示，Transaction 1 在写操作时候，对数据 A 加了写锁，那么 Transaction 2 想要读取 A，就必须等待这把锁释放。这样就避免当前事务读取其他事务的未提交数据。

但是除了脏读，一致性的要求还需要「可重复读」，即「在一个事务内，多次读取的特定数据都必须是一致的（即便在这过程中该数据被其他事务修改）」。

上图就是没能保证「可重复度」，Transaction 2 第一次读取到了数据 A，然后 Transaction 1 对数据 A 更新到 A'，那么当 Tranction 2 再次读取 A 时候，它本来期望读到 A，但是却读到了 A'，这和它的预期不相符了。解决这个问题，就需要提升隔离级别到「Repeatable Read」。

2. Repeatable Read

这个名字非常容易理解，即保障在一个事务内重复读取时，始终能够读取到相同的内容。来看图：

如上所示，当 Transation 2 读取 A 时候，会同时加上一把 Read Lock，这把锁会阻止 Transaction 1 将 A 更新为 A'，Transaction 1 要么选择等待，要么就选择结束。

五、互联网项目为什么将隔离级别设为读已提交(Read Commited)？

创建一张测试表：

CREATE TABLE `test` (

`id` int(11) NOT NULL,

`color` varchar(20) NOT NULL,

PRIMARY KEY (`id`)

) ENGINE=InnoDB

测试数据：

insert into test(id, color) values(1, 'red');

insert into test(id, color) values(2, 'white');

insert into test(id, color) values(5, 'red');

insert into test(id, color) values(7, 'white');

1. 在Repeatable Read隔离级别下，存在间隙锁，导致出现死锁的几率比Read Commited高。

执行如下脚本：

select * from test where id <3 for update;

在Repeatable Read隔离级别下，存在间隙锁，可以锁住(2,5)这个间隙，防止其他事务插入数据。

而在Read Commited隔离级别下，不存在间隙锁，其他事务是可以插入数据。在Read Commited隔离级别下并不是不会出现死锁，只是出现几率比Repeatable Read低而已。

2. 在Repeatable Read隔离级别下，条件列未命中索引会锁表！而在Read Commited隔离级别下，只锁行。

执行语句：

update test set color = 'blue' where color = 'white';

在Read Commited隔离级别下，其先走聚簇索引，进行全部扫描。加锁如下：

但在实际中，MySQL做了优化，在MySQL Server过滤条件，发现不满足后，会调用unlock_row *** ，把不满足条件的记录放锁。

实际加锁如下：

然而，在Repeatable Read隔离级别下，走聚簇索引，进行全部扫描，最后会将整个表锁上，如下所示：

3. 在Read Commited隔离级别下，半一致性读(semi-consistent)特性增加了update操作的并发性。

在MySQL v5.1.15的时候，innodb引入了一个概念叫做“semi-consistent”，减少了更新同一行记录时的冲突，减少锁等待。

所谓半一致性读就是，一个update语句，如果读到一行已经加锁的记录，此时InnoDB返回记录最近提交的版本，由MySQL上层判断此版本是否满足update的where条件。若满足(需要更新)，则MySQL会重新发起一次读操作，此时会读取行的最新版本(并加锁)。

具体表现如下:

此时有两个Session，Session1和Session2。

Session1执行：update test set color = 'blue' where color = 'red'; 先不Commit事务。

与此同时Session2执行：update test set color = 'blue' where color = 'white';

Session 2尝试加锁的时候，发现行上已经存在锁，InnoDB会开启semi-consistent read，返回最新的committed版本(1,red),(2，white),(5,red),(7,white)。MySQL会重新发起一次读操作，此时会读取行的最新版本(并加锁)!

而在Reaptable Read隔离级别下，Session2只能等待。

六、读未提交(Read Uncommitted)和串行化(Serializable)隔离级别

项目中一般不采用读未提交(Read Uncommitted)和串行化(Serializable)两个隔离级别，原因如下：

1. 采用读未提交(Read Uncommitted)，一个事务读到另一个事务未提交读数据，存在脏读（Dirty Read）。

2. 采用串行化(Serializable)，每次读操作都会加锁，快照读失效，一般是使用MySQL自带分布式事务功能时才使用该隔离级别。

这个是XA事务，是强一致性事务，性能不佳。互联网的分布式方案，多采用最终一致性的事务解决方案。

在Read Commited级别下，不可重复读问题需要解决么？

不用解决，这个问题是可以接受的！毕竟数据库的脏读你数据都已经提交了，读出来本身就没有太大问题！Oracle的默认隔离级别就是Read Commited。

在Read Commited级别下，主从复制用什么binlog格式？

在该隔离级别下，用的binlog为row格式，是基于行的复制。Innodb的创始人也是建议binlog使用该格式。

阅读全文

发布于 2024-09-26 09:09:25

数据库的脏读

喜欢 0

分享空间
分享微博
手机扫一扫

海报

0 条评论

本站已关闭游客评论，请登录或者注册后再评论吧~

推荐阅读

0 条评论