数据库事务第一章---事务日志
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据库事务第⼀章---事务⽇志
⾸先抛出问题,望⼤家读完后,可以解答:什么是数据库事务?为什么要有数据库事务,解决什么问题?
⼀:知识回顾
⼀个合理的数据库设计,需要保证ACID原则(虽然被提及太多次,但这⾥还是要啰嗦⼀下)
原⼦性(Atomicity)
原⼦性是指事务是⼀个不可分割的⼯作单位,事务中的⼀系列操作要么都发⽣,要么都不发⽣。
⼀致性(Consistency)
事务前后数据的完整性必须保持⼀致。
隔离性(Isolation)
事务的隔离性是多个⽤户并发访问数据库时,数据库为每⼀个⽤户开启的事务,不能被其他事务的操作数据所⼲扰,多个并发事务之间要相互隔离。
持久性(Durability)
持久性是指⼀个事务⼀旦被提交,它对数据库中数据的改变就是永久性的,接下来即使数据库发⽣故障也不应该对其有任何影响
举个说烂的例⼦。
从A账户转账100元到B账户去。
第⼀步 A账户扣去100,第⼆步,B账户上增加100。
这两步操作肯定在同⼀个事务⾥。
原⼦性:要么这两步都不发⽣,要么都发⽣,不可以发⽣了第⼀步,然后第⼆步不发⽣了。
⼀致性:两步发⽣后,数据库⾥的数据要保持⼀致,总钱数肯定不能减少或者增多。
隔离性:这个例⼦中不能体现,下⼀章节会细讲
持久性:假如第⼀步后,服务宕掉了,等到重启后,数据库得有恢复数据的能⼒,要么回滚第⼀步,要么继续执⾏第⼆步。
⼆:提出问题
在详细介绍数据库技术层⾯是如何实现上述原则前,我们需要先了解系统程序是如何修改数据库数据的。
我们⼤家都知道,数据库的最终数据都是存在硬盘上的。
如果在设计程序时,需要频繁的和硬盘的数据进⾏IO交互,响应时间就会⾮常缓慢(为什么IO交互时间慢,因为这⾥是随机IO,需要在磁盘上多个地⽅移动磁头,这⾥不再细说),所以这是我们需要避免的。
为了解决这个问题,数据库在⾃⾝的设计上,它也作出了努⼒。
当第⼀次从数据库⾥查询出⼀系列数据时,数据库会将该查询结果数据缓存在它⾃⼰的内存中(也称⾼速缓冲区,就是⼀块内存结构,⽤来存储数据备份,所有数据库⽤户共享),所以其实每⼀次的查询,服务器进程都会尝试先从⾼速缓冲区⾥捞数据,如果命中,就直接返回,避免了直接和硬盘进⾏IO交互,如果命中不了,才会去硬盘上找。
修改操作也如此,会先去修改内存中的数据,然后写⼊硬盘上去。
问题来了:
1. ⾼速缓冲区是什么?
mysql使⽤的是InnoDB存储引擎。
InnoDB层有⾃⼰的缓冲区,存放在主机内存中,它的⽬的主要是在应⽤层管理⾃⼰的数据,避免慢速的读写操作影响了InnoDB的响应时间。
这个缓冲区分为两块,innodb buffer pool 和 relog buffer ,前者就是上述的⾼速缓冲
区,InnoDB buffer pool存储了从磁盘设备读到的InnoDB数据,也缓冲了对InnoDB数据写。
relog buffer 下⾯的内容会着重介绍,这⾥先略过。
2. 如果修改完了内存数据,还没来得及写⼊硬盘,数据库服务挂了,操作会不会丢失?
数据库为此同样也做出了努⼒。
它也怕写⼊硬盘时出现故障,所以它⼲脆先不写⼊硬盘⾥,⽽是先通过事务⽇志的⽅式记录操作⾏为。
三:引出主题 -- 事务⽇志
什么是事务⽇志呢?为什么要有事务⽇志呢?
事务⽇志是真实存在主机硬盘上的⽇志⽂件。
简单来说,每⼀次的修改操作,都先修改⾼速缓存区拷贝的数据(这⾥不太准确,下⾯会详述),然后将修改⾏为记录到事务⽇志⾥去,之后,才异步将修改内容持久化到硬盘上去。
事务⽇志可以帮助提⾼事务效率:
使⽤事务⽇志,存储引擎在修改表的数据时只需要修改其内存拷贝,再把该修改⾏为记录到持久在硬盘上的事务⽇志中,⽽不⽤每次都将修改的数据本⾝持久到磁盘。
事务⽇志采⽤的是追加的⽅式,因此写⽇志的操作是磁盘上⼀⼩块区域内的顺序I/O,⽽不像随机I/O需要在磁盘的多个地⽅移动磁头,所以采⽤事务⽇志的⽅式相对来说要快得多。
事务⽇志持久以后,内存中被修改的数据在后台可以慢慢刷回到磁盘。
如果数据的修改已经记录到事务⽇志并持久化,但数据本⾝没有写回到磁盘,此时系统崩溃,存储引擎在重启时能够⾃动恢复这⼀部分修改的数据。
⽬前来说,⼤多数存储引擎都是这样实现的,我们通常称之为预写式⽇志(Write-Ahead Logging),也称⽇志先⾏,修改数据需要写两次磁盘(第⼀次是将更新⾏为记录到事务⽇志,第⼆次是真正的将更新后的数据记录到数据库⽂件中)。
可能看了上⾯的东西,你还是不清楚事务⽇志是个什么,也不太清楚数据存储的流程是怎么⾛的,那么我们现在可以总结⼀下,确实⽐较复杂,⽹上查阅的资料也概括的不全⾯。
MySQL redo log存储状态
1. 存在redo log buffer中,物理上在MySQL进程内存中;
2. 写到磁盘write, 但是没有持久化fsync,物理上是在⽂件系统的page cache⾥⾯;
3. 持久化到磁盘,对应的是hard disk.
当有修改操作发⽣时,
第⼀步,会去修改 innodb buffer pool(上⾯有过介绍)内存中的数据,同时也会在 relog buffer 内存中记录下操作步骤,由于这两个都是修改内存的操作,速度⾮常快。
第⼆步,InnoDB 有⼀个后台线程,每隔 1 秒,就会把 redo log buffer 中的⽇志,调⽤ write ⽅法将 redo log 写到⽂件系统的 page cache(这个就是操作系统的⽂件存储区域),这⾥就是在写事务⽇志⽂件,存储在硬盘上,然后调⽤ fsync 同步⽅法持久化到磁盘。
那这个log到底记录了什么?分两部分
1. redo log
在系统启动的时候,就已经为redo log分配了⼀块连续的存储空间,以顺序追加的⽅式记录Redo Log,通过顺序IO来改善性能。
所有的事务共享redo log的存储空间,它们的Redo Log按语句的执⾏顺序,依次交替的记录在⼀起。
如下⼀个简单⽰例:
记录1:<trx1, insert...>
记录2:<trx2, delete...>
记录3:<trx3, update...>
记录4:<trx1, update...>
记录5:<trx3, insert...>
2. undo log
undo log主要为事务的回滚服务。
在事务执⾏的过程中,除了记录redo log,还会记录⼀定量的undo log。
undo log记录了数据在每个操作前的状态,如果事务执⾏过程中需要回滚,就可以根据undo log进⾏回滚操作。
单个事务的回滚,只会回滚当前事务做的操作,并不会影响到其他的事务做的操作。
以下是undo+redo事务的简化过程
假设有2个数值,分别为A和B,值为1,2, 分别更为3,4
1. start transaction;
2. 记录 A=1 到undo log;
3. update A = 3;
4. 记录 A=3 到redo log;
5. 记录 B=2 到undo log;
6. update B = 4;
7. 记录B = 4 到redo log;
8. 将redo log刷新到磁盘
9. commit
在1-8的任意⼀步系统宕机,事务未提交,该事务就不会对磁盘上的数据做任何影响。
如果在8-9之间宕机,恢复之后可以选择回滚,也可以选择继续完成事务提交,因为此时redo log已经持久化。
若在9之后系统宕机,内存映射中变更的数据还来不及刷回磁盘,那么系统恢复之后,可以根据redo log把数据刷回磁盘。
所以,redo log其实保障的是事务的持久性和⼀致性,⽽undo log则保障了事务的原⼦性。
扩展:为了控制 redo log 的写⼊策略,InnoDB 提供了 innodb_flush_log_at_trx_commit 参数,控制 redo log 的刷新。
它有三种可能取值:
设置为 0 的时候,表⽰每次事务提交时都只是把 redo log 留在 redo log buffer 中 ; 这样可能丢失1s的事务数据。
设置为 1 的时候,表⽰每次事务提交时都将 redo log 直接持久化到磁盘;这样的话,数据库对IO的要求⾮常⾼,如果底层硬件提供的IOPS⽐较差,MySQL数据库并发很快就会由于硬件IO的问题⽽⽆法提升。
(当然,InnoDB的组提交⽅法为降低IOPS做了很⼤优化)设置为 2 的时候,表⽰每次事务提交时都只是把 redo log 写到 page cache。
如果只是MySQL数据库挂掉了,由于⽂件系统没有问题,那么对应的事务数据并没有丢失。
只有在数据库所在的主机操作系统损坏或者突然掉电的情况下,数据库的事务数据可能丢失1秒之类的事务数据。
这样的好处就是,减少了事务数据丢失的概率,⽽对底层硬件的IO要求也没有那么⾼(log buffer写到⽂件系统中,⼀般只是从log buffer的内存转移的⽂件系统的内存缓存中,对底层IO没有压⼒)
注意,事务执⾏中间过程的 redo log 也是直接写在 redo log buffer 中的,这些 redo log 也会被后台线程⼀起持久化到磁盘。
也就是说,⼀个没有提交的事务的 redo log,也是可能已经持久化到磁盘的。
数据丢失的场景:
如果主机掉电或者MySQL异常宕机,innodb buffer pool将⽆法及时刷新到磁盘,那么InnoDB就只能从上⼀个checkpoint使⽤redo log来前滚;⽽redo log buffer如果不能及时刷新到磁盘,那么由于redo log中数据的丢失,就算使⽤redo 前滚,⽤户提交的事务由于没有真正的记录到⾮易失型的磁盘介质中,就丢失掉了。
引出⼀个问题:是否保证原⼦性,就可以保持了⼀致性呢?
下⼀个章节会回答这个问题。
介绍数据库事务的隔离性是什么?解决了什么问题?如何实现的?。