Microcomputer Applications Vol 20、No.4,2004 技术交流 微型电脑应用 2004年第 2O卷第 4期
N AS服务器的远程镜像技术
马青娇 施 亮 吴智铭
摘 要 本文中首先介绍 了远程镜像的同步复制与异步
复制技 术.分析比较 了两种远程复制技 术的优劣及适 用场合 、
对异步镜像技 术确保 复制站点 问数据的一致性,提 出了一 些
实现方法,最后介绍 了当前实现远程镜像的三种主要
。
关键词 同步远程镜像 异步远程镜像 NAS
一
、引言
Internet以及基于web的商业模式 的迅速发展,促成了一
个日益复杂的非集中式信息环境的形成,重要的商业数据往
往分布在多 台 Web服务器 、文件服务器 以及存储 区域 网络
(Storage Area Network,SAN)和附网连接存储 (Netw()rk At—
tached Storage.NAS)等多种系统中。与此同时,商业的发展正
面临不断增长的需求:要保持分布式数据的一致性、全球通用
性和7×24小时的不间断操作。这些不断加快 的、有时相互冲
突的发展趋势.突出了复制 、同步 、备份和管理 数据在 企业 发
展中的重要性 。
远程镜像技术可为两地点间的重要信息传输提供丰富的
存储空间,广泛用于灾难恢复和业务持续等战略目标上 以金
融服务业人士为例 ,他们 可以借此技术.在主要数据中心发生
崩溃后,保证电子商务的快速恢 复。目前 ,用NAS和SAN可以
实现跨平台的数据共享,用 NAS和SAN搭建安全的数据中心
是必然的发展趋势.为了确保灾难恢复和业务持续,众多网络
存储供应商基本上都是采用了远程镜像技术
本文中首先介绍 了应用 已久 的本地镜像(即 RAID—J),
然后对远程镜像 的两种技术即同步复制和异步复制进行 了分
析 和比较,然后指 出了异步复制需要解决的站点 数据一致
性问题,以及用于解决这一问题的一些重要技术.如:延迟写
入、再同步等,最后介绍 了当今应用比较广泛的三种远程镜像
方案
二、本地镜像
在 介绍远程镜像之前 ,首先 了解 一下本地镜 像(RAIl-j—
J) 在主机范围内.镜像技术起源于一项称为“对偶复制” 见
图2—1)的宿主功能。运作系统负责向 同的卷中写入相『司内
容。今天.在大多数有逻辑卷管理工具的企业级平台上部可以
得到此机制。
随着输 入/输 出(I/O)控制器越来越智能化,复制的责任
开始转向磁盘子系统。在那里,当从主机CPU和总干线 L卸载
时.复制变 得更快 更便宜 。主板 和子系统 层的 RAI1)一l和
RAID 5保护,可以防止单磁盘错误带来的损失。(见图2)
图 1 基于主机的对偶复制
// /。/ \
二 二
L—A_一j L -j
图2 基 于子 系统的镜像
NAS服务器的远程镜像不是在总线相连的磁盘之间,而
是在两个位于不同地点 的NAS服务器间进行远程复制。它的
众多优点之一是能在地理位置相隔很远的地方间延伸磁盘镜
像 下面将详细介绍传递这种远程复制的传统机制。
三、远程复制技术
目前主要有两大远程复制技术 :同步和异步。下面将对这
两种技术分析比较。
1.同步远程镜像
同 步数据复制.指通过将本地产生的数据以完全同步的
方式 复制到异地 .每一本地输入/输 出事务均需等待远程复制
的完成方予以释放。
面向主机的同步技术作为输人 输 出命令处 理过 程的一
部分写入远程主机。(见图3~1)很典型的.在得到远程证实信
息后 ,才向原主机发出输入/输出已完成的信号 。不同的实施
过程所需的写响应时间不同。写等待时间的增加,与传输握手
过程和物理介质有很大关系。大体上.由于住返传播延时影响
输入/输 出响应 时间 .所 以同步镜像只限于应用在相对较近的
距离上(数十公里)。然而.也有如web服务器复制允许相对较
慢的远程更新和操作.所以也可采用长距离的同步模式。
如果期 望远程镜像得到下面的结果 .可 以考 虑应用 同步
复制:远程拷贝总能与本地机要求复制的映像相匹配。在主站
点不起 作用时 .用 户团体 和直用程序可 以换到一个代替 站点
5 fl『娇 卜海交通大学 rJ动化系CIMS实验窜 坝 f. I 海 200030
施 亮 I 海交通大学 自动化系L’IMS实验窀 J.研究 导帅 I 海 200~)30
父钾铭 I 海交通大学f{动化系【 IMS 验窜 教授 博 f‘l导师 l 海 200030
· l 3 ·
维普资讯 http://www.cqvip.com
M icrocom puter Applications ol
后.副本(远程 )继续执行操 作
7
图3 同步远程镜像
同步复制实时性 强.灾难 发生时远端数据与本地数据完
全同步 但这种方式受带宽影响较大 .数据传输距 离较短
2.异步远程复制
异步数据复制则是指将本地产生 的数据 以后台同步的
式 复制到异地 ,每一本地输 入 输 出事务均正常释收 .无需等
待远程复制的完成。(见图 1)
A, 『】I()r
图 l 异步远程复制
使用同步镜像时.若 原站点 和副站点『日]的距离和低带宽
的电信线路 (1 5Mpbs或更少 )引起等待时间过长,j){IJ将 录用 异
步方法 ,异步技术保证在更新远程映像前完成 向原 机的基
奉输入 输 出:异步复制不影响本地事务,传输距离长.但其数
据 比本地数据略有延迟 。当原系统 发生错误.丢失缓冲数据和
传递中数据的可能性就更大丁
在异步复制环境中 ,最 关谜的就是要确保数据 的 一敛
特殊的预防
以及应用层 的恢复 序能解决剐站点 上满在
的数据的不完整问题。
有关权威机构 指出 :完 全相同的 汁算元 素.排 成完 拿独
立、异步运行的一个系统时.能显著提高lT操作的可荇活性
昕以在实际的远程镜像中也主《是采用 步机制 F面将 介
绍异步复制中确保数据一致性 、完整性的 一些方
(1)延迟写入
延迟写入技 术可以在确保本地数锯完奸无损 逆 远
更新 宅机定期进行数据完 整性的俭套.然后再进 行近 停复
制 :此种方法的另 个实现过程是 时地远 程运送数 .住
已知的时点复制 .后台俭验它的宄整性,然后用 丁 盖
( )依赖次序的写入
异 步策略 中很重要的 ·个想法 是确保按源程j丰的编荆顺
申进仃远程写入。同时期的关系数据庠管 系冼 .部 “屯 j
}占日志协 议”,用以恢 复任何由于I廿侔或其它错误引起磁盘未
能捕蔹的更新的
。
技术交流 微型电脑应用 2004年第20卷第-l期
远程镜 像中.分布于不同磁盘卷上的 日志和表空间使此
技术具有重要意 义。当两1\独立处理过程(线程 )异步运行 .想
要在远程磁盘上复制各 自的卷时.不能 保证维持原有的相对
次序。日志设备的远程复制若发_牛错误 .会导致关系数据库管
理系统的表实体的更新不能理解也不能 回退 因此 .镜像处理
中依赖次序 的写入有时要求单线程更新 :
(:{)记录和再 同步
有时远程镜像操作被故意打断或 无汁划中止 ,如果在此
期间,主卷 影卷对中任何一方继续被更新.则两个映像就不
再同步 厂。再同步则是远程拷 贝服务恢复后重新建立映像的
过程。
比较普遍的再同步方式有三种:完全同步 .按记录再 同步
和依据记分板更新再 同步。3.1)完全再 同步
完全再同步实质上是完全的磁盘 磁盘拷 贝(见图5).当
没有快速再 同步方法或 目标 卷处于未知状态 的情况下使用这
一 方法。“完全再同步”显然是最耗时的方式 。
图5 完全再同步(磁盘 磁盘拷贝)
减少再同步化耗时的方法是中断时变化记在 日志中。记
录(Journa1)和记分板(位向量)是两种公认的实现此功能的方
法.记录抓取每次新写入 日志的内容.同时,记分板跟踪变化
数据的位置。
:)按记录再 同步
按记录再 同步可以 比喻成对所 积 累的 陈旧映像 的回放
(见图fj) 适当地
.再 同步可以被记录 ,所 以可以被中断而
不会对 目标的 ·致性产生严重后果 (即.信息会有点过时 .但
有 条不素 )
Joum ■
图6 按记录再 同步
记录擅长按到达顺序收集变化数据 但是.记录的空间可
能会 为不适 当地记录第_二镜像和主卷的舒离而耗尽 。
3、依照 记分板更新再同步
记分 阪的指针跟踪中断后发生 变化的磁盘的位置 (见图
7) 采用不同的粒度 .例如每 】28千字节中取 】比特,可使记
板空『日J减 最小 与记录 同的是. 缩的记舒板一开始就 分
好,所以 会有“溢出”的危险
记分板冉同步是出于提高性能 考虑 的.它。 仅节省 了空
宝
_TL n 一 一 .
零
圈
维普资讯 http://www.cqvip.com
Microcomputer Applications Vol 技术交流 微 型电脑应用
间.而且显著减少 了’磁盘一磁盘复制和记录方法的再刷新时
问 性能的优 化是 由于仅传送最新更新数据到目的地 .而不是
把以前所有的都 传送 因为先前对I 一块的输 入,输 出已彼戡
盖 .所以没有必要再传送旧的数据 通过 i己分板 更新再同步必
须完全确保 目标数据 的一致性 .因 为复制顺序有可能与啄始
记录顺序不一致 。
sc●reb蛳 ●
‘h■ r~ mis
●D酞 s.■—『-
图7 基于记分板的再 同步
莹Ⅱ果中断时间达好几 个小时,并且有大面积的数据更新.
耶 幺记 分板和数据 日志可以提 供的返 回数据就越__米越 少.这
时磁盘一磁盘复制可能更勾高效
四、远程镜像的实现
NAS的远程镜像解决方案大致 可以分为 3种:利用数据
库复制的技术,文件系统 复制技术和将 镜像技 术归:F存储 系
统的卷(或块 )复制技术。每一种方案各有所长
1.数据库复制
关 系数据库管理 系统 (Rr)I MS)能 对本地和远 程的之持
怍出熟悉和灵活的决定。可以应用数据库的成熟技术 . 戈现 数
据的同步 异步复制 、灾难恢复、事务网退等容错技术.数据
管理 系统还可以用来在多 个数据库甚至不同数据库之间 复
事件 然而 .每一次数据更薪时需要传递大量信息 。而且为确
保其中的相互联 系和复制的一致性而引起的开销是 十分 可观
的 应用程序的吞吐能力很有可能人大低于其它远程镜像的
吞吐能 力.并且对广域 网(W人N)等待时间的影响也将扩大
在这种情况 ,数据不是处于 一1\自由的地位 ,因为必颈
用其它远程复制行 为覆盖用户文件和系统 文件
2.文件 系统复制
对于具有多种应用程序 的主 fJ【米说.录用 艾件 系统远 程
镜像比较台遁 尤其适用 于低 置的服务器 文『牛级别的复制
能圆满完成替代位置数据的更新 这类镜像作 为主机上的软
件舒层驱动程序而传送、并且在本地或广域连接中 一般要
守『司珞上的通信
,诸如TCP IP
这种方法由于要更改操作 系统或政变需 要保护自 复合 =l二
机平台 .比较适合于开放原码的 I inux操作系统
3、卷 (或块 )级复制
巷(或块 )级复制可以存 主机或仔储 于系统 现 与数据
库复制 和文件系统复制不 同的是 .这神抟术可以复制逻辑卷
或 在某些情况下复制物理 卷,卷复制支持昕 何文件系统和 任
何卷管理器配置的任何未加工数据 卷复制也可 以用于连接
数据 唪复制 和文件系统复制 ,以确保I1:化数据 或特定 的 丈
件 系统指定 的数据复制到远 程站点 ,m }j昕 仃十fj关的数据 也
复制到远程站点 (见图b)
利用存睹子 系统统 一远 镜像』 件将有利 于跨 台撩
作 ·的俘碚子 系统可以用柬从服秀 }机的 场 f=‘提 供
2004年第2O卷第4期
远程双重拷 贝,把原主机和复原主机从冗 长的 1 ()开销 中解
脱出来 ,并可以削碱等待时间。大多数执行过程都能利用原位
置和副位置的闲置资源以加速程序的运转 由此产生的远程
镜像吞吐量远远大于数据库复制和文件系统复制
II()Su1) ysten1}一 z———】II()St r1) sten1
(二二 p f I⋯l (二二 l
— k』 .J L— }_I
图8 存储子系统的远程镜像
由于大量数据的远程复制.很容易引起网络拥塞。目前广
泛采用的是 只传送 修改 的部 分 (即修 改的块的信 息)到 目的
NAS服务器,基于 I inux的NAS服务器用_一个内核模块记 录
文件 系统修改的信 息,然后 由另外一个应用程序把这些信息
传送到目的主机。原主机和目的主机之间的逻辑分区不需完
全相吲。
这种块级复制方案 也应用于S人N。另外由于 N人S和SAN
的应用趋向于融合 ,所以在此作为第 三种方案予 以介绍。
五 、总结
远程刷步复制能保证主站点和副站点 间备份数据 的完全
一 致,但受网络带宽的影响,适用于短距离的复制;异步复制
适用 于长距离、对数据要求不是很严格的复制。异步复制关键
是要确保复制的站点之间数据的一致性,本文中探讨了异步
复制时实现数据 一致性的一些方法。最后介绍丁应用 比较广
泛的三种远程镜像实现方案。
在实际应用中 ,常常结合两种技术进行远程复制 。在数据
复制 的同时,还需要管理软件对数据复制状况进行动态监测。
远程动态监测软件在主机/应用发生故障时,会马上监测到,
将故 障情况 向管理 员报警,然后根据策略 自动或手工快速 地
将应用进行切换.确保复制数据的正常进干丁
参考资料
1]MVD sync技术资料.[EB/()I ].http: /WWW.Iql'~,(1.corn/
M VD⋯一sync.htm
『2 Navid Alaghband,Richard (Ⅲ 、. 1. p r()M irror for Net—
Forc : Data replication and disaster re(、()、,ery archite(’一
ture.[EI~/OI .http://www.pr()(’Olq1. )Iql/.200 l
3j SUN.Sun St(wEdge Network Data Replicator Software
I )osts Data Center Resiii(·nee.[EBA)I J.http://www.
1、I1n.“)n1.,White paper.2OO3
(收稿 日期 :2()(/3年 5月 9日)
维普资讯 http://www.cqvip.com