SQLServer中的事务日志管理(2/9):事务日志架构概述

当一切正常时,没有必要特别留意什么是事务日志,它是如何工作的。你只要确保每个数据库都有正确的备份。当出现问题时,事务日志的理解对于采取修正操作是重要的,尤其在需要紧急恢复数据库到指定点时。这系列文章会告诉你每个DBA应该知道的具体细节。


虽然我们想回避它,去讨论下事务日志的内部结构和内部运行机制,但适当的理解下日志维护技术是有益的。这个话题在Paul Randal的讲座《理解SQL Server里的日志和恢复》里已经讲得很透彻,另外Kalen Delaney的《深入解析Microsoft SQL Server 2008》书里也有很详细的讲解,因此在这里我们将会简单介绍。

虚拟日志文件(Vitual Log Files(VLF))

事务日志文件是连续的文件;换句话说,SQL Server是连续写事务日志的(不像数据文件,它是随机写入的,因为数据是在随机的数据页里修改的)。

存储注意事项

在写入数据和日志文件的不同方式意味着它们也会有不同的存储注意事项,例如对于存储各个文件类型的硬盘,要配置合适的RAID,这个会在以后的文章里介绍。

每个插入日志文件的日志记录会用逻辑序列号(Logical Sequence Number(LSN))标记。当数据库和它关联的日志文件第一次创建时,第1条日志记录标志着逻辑文件的开始,同时也是物理文件的开始。LSN接下来也是自增长;最近增加的日志记录总会有最大的LSN,也标志着逻辑文件的结束(等下会详细讲解)。所有日志记录与提供的事务在LSN链(LSN chain)里链接,LSN上有指针前后指向当前操作的成功的和进行中的事务操作。

在内部,SQL Server把事务日志文件分成许多所谓的虚拟日志文件(virtual log files(VLFs))段。图1描述了8个VLFs组成的事务日志,还有标记了日志的活动部分。

SQLServer中的事务日志管理(2/9):事务日志架构概述

2.1 有8个VLFs的日志记录

在第1篇文章里我们提到,任何与打开事务相关日志记录都需要回滚的可能。另外,在数据库里还有很多其他使用事务日志的活动(包括复制,镜像和修改数据快照),也需要保持事务日志记录直到这些活动已经处理。在图2.1里显示的最小LSN的日志记录,是定义为“用作成功的数据库范围回滚或数据库里其他活动和操作的最老记录“。有时候它们也称为日志“头”。

活动日志记录的原因

活动事务可以让日志记录活动,除此之外,还有很多原因让它活动。这个在接下来的文章都会谈到。

现在可以说,如果一条日志记录对于任何事务或活动需要的话,这个日志记录就是活动的,它对应的VLF也是活动的一部分。

如图2.1所示,最近的日志记录总有最大LSN,这标志着日志的逻辑尾。接下来的记录都会写在日志逻辑尾。在最小LSN和和最大LSN之间的文件部分称为活动日志(active log)

活动日志不包含“活动”(例如打开)事务的细节,这很重要。例如,假设有个开始于上午9点,持续30分钟执行的打开事务(T1)日志记录定义了最小LSN。如果接下来的事务(T2)开始于上午9点10分,结束于9点11分,它还会是活动日志的一部分,因为相关日志记录的LSN比最小LSN大。在上午9点30分,当T1提交时,对于开始于上午9点25分的打开事务(T3)的日志记录会有新的最小LSN。到这时,对于T2的日志记录不会是活动日志的一部分。

任何包含活动日志任何部分的VLF都被认为是活动VLF。例如,图2.1的VLF3就是个活动VLF,即使它包含的大部分日志记录不是活动日志的一部分。一旦事务开始并提交,我们可以(简单)想象出日志头会在图2.1里从左往右移动,因此刚才包含活动记录部分的VLFS现在变成了不活动(VLF1和VLF2),刚才没用到的(VLF8)的VLFS会变成活动日志部分。

标记一个VLF为“不活动”具体做什么取决于数据库使用的恢复模式,接下来我们会谈到。

日志截断与空间重用

这里要注意的重点是日志文件里截断的最小单位不是各个日志记录或日志块,是VLF。如果在VLF里的一条日志记录还是活动日志部分,那么整个VLF被认为是活动的且不能被截断(cannot be truncated)

一把来说,一个VLF会是2个物理状态的1个:活动(active)或不活动(inactive)。但是,基于VLF的可能不同“行为”,我们可以分出4个逻辑状态:

  1. 活动(Active)——这个状态的VLF是活动的,因为它至少包含活动日志部分的一条记录,因此它需要被回滚或其他目的。
  2. 可恢复(Recoverable)——这个状态的VLF是不活动的,但没被截断或备份,空间不可以重用。
  3. 可重用(Reusable)——这个状态的VLF是不活动的,它已被截断或备份,空间可以重用。
  4. 未使用(Unused)——这个状态的VLF是不活动的,在它里面还没有被记录的日志记录。

把一个VLF标记为不活动——按照我们的逻辑状态,这表示从状态2切换到状态3——被称为日志截断(log truncation)。

这个日志截断什么时候发生取决于使用的恢复模式。当数据库在简单(Simple)恢复模式时,活动的VLF在检查点操作时变成不活动。当检查点发生时,缓存中的任何脏页写回到硬盘,然后日志中的空间变成可重用。

但是,在完整(FULL)或大容量日志(BULL LOGGED)模式里,只有日志备份可以把活动的VLF变成不活动。这样的话,一旦日志备份已完成备份,任何VLFs不在需要是不活动的,因此是可重用的。

在图2.2,我们看看到检查点(或日志备份)的结果,VLF1和VLF2已被截断且是不活动。活动日志的开始现在是VLF3的开始,VLF8还从未用过,因此它是不活动的(状态4)。

SQLServer中的事务日志管理(2/9):事务日志架构概述

2.2 截断后,有8个VLF的事务日志

下一个要考虑的问题,当活动日志到达VLF7尾时会发生什么。日志文件中空间简单来想都是反复被重用的,尽管有让空间重用模式变得相当专制的复杂因素,对此在这个系列文章里我们不会深入探讨。

不过,在最简单的情况下,一旦日志的逻辑尾到达VLF尾,SQL Server会开始重用接下来顺序的不活动VLF。在图2.1,会是VLF8。当VLF8满了,它会回绕重用VLF1和VLF2。如果没有更多的可用VLF,日志会需要自动增长,增加更多的VLF。由于自动增长被停用或磁盘提供的日志文件满了(没磁盘空间了),活动日志的逻辑尾会遇上日志文件的逻辑尾,事务日志满了,就会发生9002错误。

这个架构解释了原因,例如,一个长时间运行的事务,或由于某个原因复制的事务没有发送到派发的数据库,或者是丢失连接的镜像,还有其它的原因,会造成日志增长非常大。例如,考虑下图2.2,关联最小LSN的事务非常长时间运行。日志已经包裹了,填满了VLF1,VLF2和VLF8,没有不活动的VLF了。即使在最小LSN后的每个事务已提交,在这些VLFs没有可重用的空间,因为所有的的VLF还是活动日志部分。

我们很容易演示这个例子。首先,重新执行1.1代码删除和重建TestDB数据库。

 1 USE master ;
 2 IF EXISTS ( SELECT  name
 3             FROM    sys.databases
 4             WHERE   name = 'TestDB' ) 
 5     DROP DATABASE TestDB ;
 6 CREATE DATABASE TestDB ON
 7 (
 8   NAME = TestDB_dat,
 9   FILENAME = 'C:\Program Files\Microsoft SQL Server\MSSQL10_50.MSSQLSERVER\MSSQL\DATA\TestDB.mdf'
10 ) LOG ON
11 (
12   NAME = TestDB_log,
13   FILENAME = 'C:\Program Files\Microsoft SQL Server\MSSQL10_50.MSSQLSERVER\MSSQL\DATA\TestDB.ldf'
14 ) ;
15 DBCC SQLPERF(LOGSPACE) ;

SQLServer中的事务日志管理(2/9):事务日志架构概述

然后创建一个小表,在显性事务里更新表里的行,把事务停留在打开状态(不要提交它)。

 1 USE TestDB
 2 CREATE TABLE Test
 3  (
 4     num INT,
 5      Filler CHAR(8000)
 6  )
 7  GO
 8  
 9  INSERT INTO dbo.Test
10          ( num, Filler )
11  VALUES  ( 1, -- num - int
12            REPLICATE('A', 8000)  -- Filler - char(8000)
13            )           
14            
15 BEGIN TRAN
16 UPDATE dbo.Test SET Filler=REPLICATE('B',8000) WHERE num=1
17 
18 DBCC SQLPERF(LOGSPACE) ;
19 
20 --ROLLBACK

SQLServer中的事务日志管理(2/9):事务日志架构概述

在新开会话里,进行数据库完整备份,插入100万条记录后,查看日志空间占用。

 1 -- full backup of the database
 2 BACKUP DATABASE TestDB
 3 TO DISK ='C:\Backups\TestDB.bak'
 4 WITH INIT;
 5 GO
 6 
 7 USE TestDB ;
 8 GO
 9 IF OBJECT_ID('dbo.LogTest', 'U') IS NOT NULL 
10     DROP TABLE dbo.LogTest ;
11 --===== AUTHOR: Jeff Moden
12 --===== Create and populate 1,000,000 row test table.
13 -- "SomeID" has range of 1 to 1000000 unique numbers
14 -- "SomeInt" has range of 1 to 50000 non-unique numbers
15 -- "SomeLetters2";"AA"-"ZZ" non-unique 2-char strings
16 -- "SomeMoney"; 0.0000 to 99.9999 non-unique numbers
17 -- "SomeDate" ; >=01/01/2000 and <01/01/2010 non-unique
18 -- "SomeHex12"; 12 random hex characters (ie, 0-9,A-F) 
19 SELECT TOP 1000000
20         SomeID = IDENTITY( INT,1,1 ),
21         SomeInt = ABS(CHECKSUM(NEWID())) % 50000 + 1 ,
22         SomeLetters2 = CHAR(ABS(CHECKSUM(NEWID())) % 26 + 65)
23         + CHAR(ABS(CHECKSUM(NEWID())) % 26 + 65) ,
24         SomeMoney = CAST(ABS(CHECKSUM(NEWID())) % 10000 / 100.0 AS MONEY) ,
25         SomeDate = CAST(RAND(CHECKSUM(NEWID())) * 3653.0 + 36524.0 AS DATETIME) ,
26         SomeHex12 = RIGHT(NEWID(), 12)
27 INTO    dbo.LogTest
28 FROM    sys.all_columns ac1
29         CROSS JOIN sys.all_columns ac2 ;
30 
31 DBCC SQLPERF(LOGSPACE) ;

SQLServer中的事务日志管理(2/9):事务日志架构概述

进行日志备份。

1 -- now backup the transaction log
2 BACKUP LOG TestDB
3 TO DISK ='C:\Backups\TestDB_log.bak'
4 WITH INIT ;
5 GO
6 
7 DBCC SQLPERF(LOGSPACE) ;

SQLServer中的事务日志管理(2/9):事务日志架构概述

可以看到,日志备份后,空间不会被重用。

我们把刚才的事务回滚。

1 ROLLBACK

再次备份日志。

1 -- now backup the transaction log
2 BACKUP LOG TestDB
3 TO DISK ='C:\Backups\TestDB_log.bak'
4 WITH INIT ;
5 GO
6 
7 DBCC SQLPERF(LOGSPACE) ;

SQLServer中的事务日志管理(2/9):事务日志架构概述

可以看到,日志空间已经被重用了。

在这样的情况下,如果活动日志占用的“区域”很大,大量的空间没被重用,这样的话,日志文件大小会增大(增长并增长……)。可以延迟日志文件截断的其他因素会在第8篇——救命,我的日志满了里讨论。

太多虚拟日志文件?

一般来说,SQL Server决定VLF的大小优化和个数分配。但是,频繁自动增长的事务日志,在小增量里会有很大数的小VLF。这个现象称为日志碎片(log fragmentation),我们可以通过第1篇里的代码演示下,同时可以使用DBCC LogInfo命令来询问VLF架构。

使用DBCC LogInfo询问日志信息

DBCC LogInfo是个未公开且不支持的命令——微软对此很少介绍。但是,它可以用来询问VLFs。它每个VLF返回一行,除了别的以外,还有VLF的状态。0值状态表示这个VLF是可用的(在状态3和4里),如上介绍,2值状态表示这个是不可用的(在状态1和2里)。在后续的文章我们会详细介绍它。

我们删除并重建TestDB数据。

 1 USE master ;
 2 IF EXISTS ( SELECT  name
 3             FROM    sys.databases
 4             WHERE   name = 'TestDB' ) 
 5     DROP DATABASE TestDB ;
 6 CREATE DATABASE TestDB ON
 7 (
 8   NAME = TestDB_dat,
 9   FILENAME = 'C:\Program Files\Microsoft SQL Server\MSSQL10_50.MSSQLSERVER\MSSQL\DATA\TestDB.mdf'
10 ) LOG ON
11 (
12   NAME = TestDB_log,
13   FILENAME = 'C:\Program Files\Microsoft SQL Server\MSSQL10_50.MSSQLSERVER\MSSQL\DATA\TestDB.ldf'
14 ) ;

然后运行DBCC LogInfo命令。

1 -- how many VLFs?
2 DBCC Loginfo
3 GO

SQLServer中的事务日志管理(2/9):事务日志架构概述

现在我们并没有返回任何有意义的列;4行返回表示我们有4个VLF。现在我们往表里插入100条记录到TetsDB数据库的LogTest表,再次执行DBCC LogInfo命令。

 1 USE TestDB ;
 2 GO
 3 IF OBJECT_ID('dbo.LogTest', 'U') IS NOT NULL 
 4     DROP TABLE dbo.LogTest ;
 5 --===== AUTHOR: Jeff Moden
 6 --===== Create and populate 1,000,000 row test table.
 7 -- "SomeID" has range of 1 to 1000000 unique numbers
 8 -- "SomeInt" has range of 1 to 50000 non-unique numbers
 9 -- "SomeLetters2";"AA"-"ZZ" non-unique 2-char strings
10 -- "SomeMoney"; 0.0000 to 99.9999 non-unique numbers
11 -- "SomeDate" ; >=01/01/2000 and <01/01/2010 non-unique
12 -- "SomeHex12"; 12 random hex characters (ie, 0-9,A-F) 
13 SELECT TOP 1000000
14         SomeID = IDENTITY( INT,1,1 ),
15         SomeInt = ABS(CHECKSUM(NEWID())) % 50000 + 1 ,
16         SomeLetters2 = CHAR(ABS(CHECKSUM(NEWID())) % 26 + 65)
17         + CHAR(ABS(CHECKSUM(NEWID())) % 26 + 65) ,
18         SomeMoney = CAST(ABS(CHECKSUM(NEWID())) % 10000 / 100.0 AS MONEY) ,
19         SomeDate = CAST(RAND(CHECKSUM(NEWID())) * 3653.0 + 36524.0 AS DATETIME) ,
20         SomeHex12 = RIGHT(NEWID(), 12)
21 INTO    dbo.LogTest
22 FROM    sys.all_columns ac1
23         CROSS JOIN sys.all_columns ac2 ;
1 USE TestDB
2 -- how many VLFs?
3 DBCC Loginfo
4 GO

SQLServer中的事务日志管理(2/9):事务日志架构概述

现在我们有131行返回,这表示我们有131个VLF!来自model数据库的增长属性决定日志文件有非常小的初始大小,然后在相对小的增量里增长。对于数据库对象,对于这里活动,这些属性是不合适的,会导致大量的VLF。

日志文件碎片对性能会造成很大的影响,尤其在灾难恢复,还原,日志备份;换句话说,这些操作会读日志文件。我们会在第7篇——事务日志的大小和增长详细讨论它,还会展示如何通过修正日志文件的大小来避免碎片。但是,为了给你它会有的影响的大致情况,Lichi Shea已经演示了:但与16个VLF的数据库和20000个VLF的数据相比,在进行数据修改的性能上会带来很大的影响。

最后,在一个日志文件里VLF的合理个数问题取决于日志的大小。一般来说,微软认为超过200个VLF就要关注它造成问题的可能,但在很大的日志文件里(例如500GB)只有200个VLF也会是个问题,这些VLF太大,限制令空间重用。Kimberly Tripp的“事务日志VLF——太多还是太少”详细讨论了这个问题。

小结

在这篇文章里,我们按照事务日志架构的谈了一些背景知识,我们很有必要理解这些知识,我们也谈了日志文件的截断、空间重用和碎片等潜在问题。

在下篇文章里,我们会详细谈到在数据库还原与恢复里,事务日志是如何使用的。

更多相关文章
  • Linux运维 第四阶段 (五)MySQL用户和权限管理.日志管理一.用户和权限管理:1.相关概念:>mysql用户:类似VSFTPD虚拟用户:密码,自己独有的加密机制,PASSWORD函数:[email protected]:用户名16字符以内,主机(主机名.IP.网络地址.通配符(%,_):--skip-nam ...
  • 面对海量日志合规性日志管理和安全审计要怎么做
    企业中的主机.服务器.防火墙.交换机.防毒墙.无线路由等等要维护的设备越来越多,日志管理与安全审计的工作也变得越来越复杂.文/图 王文文随着很多中小企业公司慢慢发展,变成了上市或准上市公司.以前单一的防毒.防黑简单要求也细化到了集身份认证和日志管理.安全审计.法规遵从等等立体化的必须选项.比如国外有 ...
  • 学神1-13计划任务与日志管理
    本节所讲内容:at 定制单次执行的计划任务cron定制周期性计划任务配置脚本实现周期性任务配置公司内网服务器每天自动开关机Linux系统日志记录规律自定义日志记录方式配置远程收集日志服务器一.计划任务1.at 只能执行一次语法: at  时间服务:atd  必须开启[[email protected]~ ...
  • 2012年5月初,SANS发布了2012年度的第八次日志与事件管理调查报告.本次调查的受访对象超过了600名专业人士,涵盖了各行各业,超过一半来自大中型企业.调查问题1:收集日志的原因是什么?结果分析:82%的人认为最关键的原因是“检测/追踪来自内部/外部的可疑行为”:65%的人认为最关键的原因是“ ...
  • 项目log4j日志管理详解
    项目log4j日志管理详解 log4j日志系统在项目中重要性在这里就不再累述,我们在平时使用时如果没有特定要求,只需在log4j.properties文件中顶入输出级别就行了.如果要自定义输出文件,对于初次使用者可能会遇到一点的小麻烦.最近在项目中刚做了一个统计用户登录的日志文件,要求将用户登录到某 ...
  • SQLServer中的事务日志管理(9/9):监控事务日志
    当一切正常时,没有必要特别留意什么是事务日志,它是如何工作的.你只要确保每个数据库都有正确的备份.当出现问题时,事务日志的理解对于采取修正操作是重要的,尤其在需要紧急恢复数据库到指定点时.这系列文章会告诉你每个DBA应该知道的具体细节. 对于在我们关注下的所有数据库,在日志维护方面,我们的首要目标是 ...
  • SQLServer中的事务日志管理(8/9):优化日志吞吐量
    当一切正常时,没有必要特别留意什么是事务日志,它是如何工作的.你只要确保每个数据库都有正确的备份.当出现问题时,事务日志的理解对于采取修正操作是重要的,尤其在需要紧急恢复数据库到指定点时.这系列文章会告诉你每个DBA应该知道的具体细节. 对于日志文件的最大日志吞吐量,我们从存储架构思路的简单回顾开始 ...
  • SQLServer中的事务日志管理(7/9):处理日志过度增长
    当一切正常时,没有必要特别留意什么是事务日志,它是如何工作的.你只要确保每个数据库都有正确的备份.当出现问题时,事务日志的理解对于采取修正操作是重要的,尤其在需要紧急恢复数据库到指定点时.这系列文章会告诉你每个DBA应该知道的具体细节. 这篇文章会列出导致事务日志过度增长的常见的问题和错误管理形式, ...
  • SQLServer中的事务日志管理(6/9):大容量日志恢复模式里的日志管理
    当一切正常时,没有必要特别留意什么是事务日志,它是如何工作的.你只要确保每个数据库都有正确的备份.当出现问题时,事务日志的理解对于采取修正操作是重要的,尤其在需要紧急恢复数据库到指定点时.这系列文章会告诉你每个DBA应该知道的具体细节. 这个标题有点用词不当,因为运行在大容量日志恢复模式里的数据库, ...
一周排行
  •    三次握手:    客户端A向服务端B放松一个连接请求报文,B收到后发回一个确认报文,A收到确认报文后再发送一个确认报文,B收到后才正式建立连接.为什么后面客户端A需要再发送一个确认报文呢?这是为了防止上一次A发 ...
  • Linux运维第二阶段十六OS优化1
    Linux运维第二阶段(十六)OS优化(1)一.相关概念:OS optimization1 ...
  • 一石激起千层浪,上海广告公司一份“涨价”数据触动了电商最敏感的神经,京东商城和淘宝系的“战火”再起.昨日,针对阿里巴巴旗下一淘网发布的数据报告中关于“京东商城去年10月初价格涨幅超过15%”的说法,京东商城直呼不可能 ...
  •   这是本人第一次写博客,之前从一些开源技术网站上看到不少大牛和前辈们的文章,从中学习受益.本着开源界的奉献和学习精神,觉得有必要将自己的学习成果拿出来与大家一起交流分享,既当作是一种自我学习的总结也可能帮助到有需要 ...
  • OS:win7x64软件:pygame-1.9.1.win32-py2.7.msi :python-2.7.2.msi / python-2.7.2.amd64.msihttp://www.pygame.org/do ...
  • Ctrl+L选择整行(按住-继续选择下行)Ctrl+KK从光标处删除至行尾Ctrl+Shift+K删除整行Ctrl+Shift+D复制光标所在整行,插入在该行之前Ctrl+J合并行(已选择需要合并的多行时)Ctrl+ ...
  • /:根目录,是所有目录的绝对路径的起始点.一般根目录下只存放目录,不要存放文件,/etc./bin./dev./lib./sbin应该和根目录放置在一个分区中 /bin (类似的还有/usr/bin):此目录中放置了 ...
  • 配置 Microsoft SQL Server 数据库    如果将 Microsoft SQL 数据库用作 vCenter Server 存储库,则需要配置数据库以使用 vCenter Server.使用脚本创建本 ...
  • outlook2007搜索不完整
           这几天接到几个用户投诉outlook2007搜索不完整,输入关键字后只能搜索 ...
  • 刚刚把图片修改好上传到相册,稍晚整理 暂请见相册中pp:[url]http://840711.blog.51cto.com/pic/index.php?uid-69327-aid-63667.html[/url]