当前位置:首页 > 科技  > 软件

一分钟了解,预写日志 WAL 的核心思路...

来源: 责编: 时间:2024-07-03 17:25:28 63观看
导读上一篇《刷盘,还是不刷盘,是一个问题》中我们遇到了哪些问题?(1) 已提交事务+未提交事务的ACID特性怎么保证?画外音:上一篇中遇到的问题,主要是原子性与持久性。(2) 数据库崩溃,怎么实施故障恢复?(3) 每次都刷盘随机写,性能低,

上一篇《刷盘,还是不刷盘,是一个问题》中我们遇到了哪些问题?0yC28资讯网——每日最新资讯28at.com

(1) 已提交事务+未提交事务的ACID特性怎么保证?0yC28资讯网——每日最新资讯28at.com

画外音:上一篇中遇到的问题,主要是原子性与持久性。0yC28资讯网——每日最新资讯28at.com

(2) 数据库崩溃,怎么实施故障恢复?0yC28资讯网——每日最新资讯28at.com

(3) 每次都刷盘随机写,性能低,怎么提高数据库性能?0yC28资讯网——每日最新资讯28at.com

画外音:正常情况下,不需要每个事务提交,都进行刷盘。0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

要提升随机写性能,最容易想到的,就是利用高性能的顺序写日志,记录事务中的一些信息,来实现已提交事务的数据“要刷盘”,未提交事务的数据“不刷盘”,以及实现故障恢复。0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

这个顺序写的日志,记录什么内容呢?

事务中,对数据库的写操作。0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

如何来标识写操作的时序呢?

每条日志记录会有一个递增的日志序列号(log sequence number,LSN),唯一标识一条日志记录。0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

还有一种特殊的日志记录,叫检查点(checkpoint)。0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

检查点记录了某一个时刻,缓冲池(buffer pool)中所有数据页(page)的状态信息。0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

有了检查点和顺序写日志,我们就可以通过:0yC28资讯网——每日最新资讯28at.com

  • 重放(redo)已提交事务的操作;
  • 取消(undo)未提交事务的操作;
  • 顺序写替代随机写;

来解决,上面提到的三大难题。0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

这,就是我们今天要聊的核心技术,预写日志(write-ahead logging,WAL)。0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

预写日志不仅仅是一种日志,更像是一种模式,一种协议,它要求在进行数据写入操作时,必须先写入操作日志。0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

预写日志的分层结构是怎么样的?

如同数据的内存-磁盘两层结构一样,为了提升性能,预写日志也分为内存-磁盘两层结构:0yC28资讯网——每日最新资讯28at.com

  • 内存层:WAL buffer
  • 磁盘层:WAL log file

0yC28资讯网——每日最新资讯28at.com

预写日志会记录哪些信息呢?

还是之前那个事务T1:0yC28资讯网——每日最新资讯28at.com

  • 0yC28资讯网——每日最新资讯28at.com

    0yC28资讯网——每日最新资讯28at.com

    开始事务
  • 读取记录A的值(假设A=1)
  • 修改记录A的值(假设修改为2)
  • 提交事务

0yC28资讯网——每日最新资讯28at.com

预写日志首先会记录,T1事务开始:0yC28资讯网——每日最新资讯28at.com

LSN=0:<T1, BEGIN>0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

读取A的值是一个读操作,不需要进行记录。0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

修改记录A的值是一个写操作,需要进行记录,而且要记录修改前的值,与修改后的值,类似于:0yC28资讯网——每日最新资讯28at.com

LSN=1:<T1, A, 1, 2>0yC28资讯网——每日最新资讯28at.com

以方便未来进行redo与undo(如上图中的屎黄色1)。0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

接下来,事务会对缓冲池中的数据进行修改(如上图中的屎黄色2)。0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

到目前为止,预写日志都还是写在buffer中,并没有刷到磁盘上。0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

事务提交时,预写日志,以及缓冲池会发生什么?

首先,T1事务提交,也会记录到buffer中:0yC28资讯网——每日最新资讯28at.com

LSN=2:<T1, COMMIT>0yC28资讯网——每日最新资讯28at.com

但这样,还远远不够。0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

预写日志,必须全部从buffer里刷到磁盘上,也就是日志文件中,事务才能标记上“已提交”,并返回给应用程序。0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

没错,只要预写日志从buffer刷到磁盘,而不需要数据从buffer刷到磁盘,就能返回应用程序,事务提交成功。0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

至于数据什么时候从buffer刷回磁盘,这取决于缓冲池刷盘策略,例如:隔一段时间异步刷盘(如上图中的屎黄色便签)。0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

这,就是预写日志的核心思路。0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

总结与思考:

(1) 日志序列号(log sequence number,LSN),唯一标识一条日志记录,递增;0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

(2) 检查点(checkpoint),记录了某一个时刻,缓冲池(buffer pool)中所有数据页(page)的状态信息。0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

(3) 预写日志记录什么核心信息?0yC28资讯网——每日最新资讯28at.com

  • 事务开始
  • 事务结束(提交/回滚)
  • 事务的写操作,修改前/修改后的值

0yC28资讯网——每日最新资讯28at.com

(4) 数据库何时能向应用程序返回“事务成功”?0yC28资讯网——每日最新资讯28at.com

预写日志刷盘成功之后。0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

(5) 上一篇《刷盘,还是不刷盘,是一个问题》结尾的问题:在数据库返回应用程序事务成功之前,要不要将数据刷回磁盘?0yC28资讯网——每日最新资讯28at.com

只要有预写日志机制,只需要预写日志刷盘,不需要数据刷盘。0yC28资讯网——每日最新资讯28at.com

0yC28资讯网——每日最新资讯28at.com

新的场景出现了:如果数据库崩了,怎么利用检查点(checkpoint)以及预写日志,来进行刷盘和数据恢复呢?让你来设计,你会怎么做?0yC28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-98559-0.html一分钟了解,预写日志 WAL 的核心思路...

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 掌握 Python:15 个关于字符串操作的神级单行代码

下一篇: len() 函数妙用:十个增强 Python 程序可读性的实践

标签:
  • 热门焦点
Top