聪明文档网

聪明文档网

最新最全的文档下载
当前位置: 首页> 正在进行安全检测...

正在进行安全检测...

时间:2023-11-19 20:27:48    下载该word文档
存储升级整合与迁移方案规划建议书
-2-
目录1.方案总体规划.....................................................................................................................................41.1存储现状及问题...........................................................................................................................42.方案架构和选型分析.........................................................................................................................62.1高端存储平台选型论证...............................................................................................................62.2整体方案及拓扑结构.................................................................................................................102.3本次推荐的VSP及原有USP配置及容量规划......................................................................112.3.1现有USP硬件配置及升级后配置情况............................................................................112.3.2现有USP软件配置及升级后配置情况............................................................................112.3.3新购VSP硬件配置情况....................................................................................................112.3.4新购VSP软件配置情况....................................................................................................123.数据迁移及服务...............................................................................................................................133.1数据迁移概述.............................................................................................................................133.1.1当前系统架构.....................................................................................................................133.1.2存储迁移架构.....................................................................................................................133.1.3TrueCopy项目实施工作表.................................................................................................143.1.4HUR项目实施工作表........................................................................................................153.1.5ShadowImage项目实施工作表..........................................................................................174.项目灾难备份演练、切换策略.......................................................................................................194.1灾难备份演练策略.....................................................................................................................194.2灾难备份演练概述.....................................................................................................................194.2.1灾难备份演练的目的.........................................................................................................194.2.2灾难备份演练的方法.........................................................................................................194.3灾难备份切换策略.....................................................................................................................214.3.1灾难备份切换概述.............................................................................................................214.3.2灾难备份切换策略.............................................................................................................214.3.3灾难切换及完整地意义的灾难恢复.................................................................................214.3.4灾难备份系统在技术层面可能存在的恢复缺陷.............................................................224.3.5关键业务系统灾难恢复方案.............................................................................................225.方案总结与介绍...............................................................................................................................245.1HDS存储方案特点.....................................................................................................................245.2HDSVSP高端存储指标和关键技术.........................................................................................265.2.1存储虚拟化功能.................................................................................................................285.2.2存储逻辑分区技术.............................................................................................................295.2.3通用复制(UR)软件技术...............................................................................................305.3HDSVSP高端存储指标.............................................................................................................32-3-
1.方案总体规划1.1存储现状及问题华泰保险目前生产系统采用1HDSUSP,序列号23837,主要配置如下:前端口:16x4GbpsCacheMemory40GBShareMemory6GBHDD80x146GB/10K磁盘PPResourceManagerShadowImage6TBRAID组划分以及LDEV的使用如下表:RAIDRaid格式Raid1+0(2D+2DRaid5(3D+1PRaid1+0(2D+2DRaid1+0(2D+2DRaid1+0(2D+2DRaid1+0(2D+2DRaid1+0(2D+2DRaid5(7D+1PRaid5(7D+1PRaid5(7D+1PRaid1+0(2D+2DRaid1+0(2D+2DRaid1+0(2D+2DRaid5(7D+1PRaid1+0(2D+2DRaid5(3D+1PRaid1+0(2D+2DRaid1+0(2D+2DRaid1+0(2D+2DRaid1+0(2D+2DRaid1+0(2D+2D1-11-21-31-41-51-61-71-81-91-101-111-121-131-142-12-22-32-42-52-62-7133120.312MB/272630400Block133120.312MB/272630400Block133120.312MB/272630400Block133120.312MB/272630400Block133120.312MB/272630400Block133120.312MB/272630400Block133120.312MB/272630400Block133120.312MB/272630400Block133120.312MB/272630400Block133120.312MB/272630400Block133120.312MB/272630400Block133120.312MB/272630400Block133120.312MB/272630400Block133120.312MB/272630400Block133120.312MB/272630400Block133120.312MB/272630400Block133120.312MB/272630400Block133120.312MB/272630400Block133120.312MB/272630400Block133120.312MB/272630400Block133120.312MB/272630400BlockLDEV规划00:0000:0101:0020:2001:0101:0201:0300:0200:0300:0400:0500:0600:0700:0800:0900:0a00:0b02:0002:0102:0202:0302:0402:0502:0602:0702:0802:0902:0a02:0b02:0c02:0d02:0e02:0f02:1002:1102:1202:1302:1402:1502:1602:1705:0005:0305:0605:0905:0105:0405:0705:0a05:0205:0505:0805:0b06:0006:0106:0206:0306:0406:0506:0606:070603:0003:0104:0004:0104:0204:0303:0203:0303:0403:0503:0603:0703:0803:0903:0a03:0b-4-
现有USP在数据吞吐高峰时已经成为瓶颈,无法满足今后华泰保险业务的迅猛增长,同时容量上按每年增加500GB计算,也很快将达到现有USP量上限,所以更换现有存储成为当务之急。-5-
2.方案架构和选型分析通过需求分析,华泰保险的集中存储系统建设需要采用高起点的先进技术来架构,因此以下二个重要环节我们需要重点论证:新存储平台整体上采用什么样的数据存储系统架构;战略平台测试整体系统未来如何整合为一个先进的集中存储平台这些重点环节将决定整个存储系统的建设成败,同时对系统的长远发展起着决定性作用,因此以下将详细论述。2.1高端存储平台选型论证磁盘阵列即存储是新系统数据整合和建设的基础,100%高可用的存储设备将保证系统的稳定运行和平滑扩展,从结构上分析,总体上有二种选型标准:对战略平台的测试业务从长远整合与发展的角度采用一台高端存储建立统一的存储平台,以高端存储的100%高可靠、高性能和高可扩展性来支持众多业务数据吞吐,同时可通过逻辑分区的方法,建立各个业务的虚拟存储分区;存储选型非常关键,本项目建议采用多控制器高性能的VSP高端存储,一方面利用其多控制器高端架构和性能来解决业务系大数据量访问的承载,建立统一存储平台,保证将来系统数据容量扩展可以在一个存储池内完成,另一方面是高端存储的高可靠性所带来的数据100%可用性是当前业务所要求的:高端架构支撑的高性能:华泰保险的核心应用,需要保证实时性能响应,这就要求强大的存储阵列的数据吞吐能力。而决定存储吞吐能力的最重要环节就是它的体系架构,存储发展经过了简单串联磁盘-中端双控制器阵列-高端多控制器阵列-三维多控制器阵列的不同阶段,本次选型的VSP采用当前最为先进的三维多控制器架构,见下图:-6-
总之,从根本讲磁盘阵列技术主要差异点在于体系结构,体系结构的差异性,尤其是中端存储和高端存储的差异性是磁盘阵列档次划分的主要参考指标。通过比较可以看到,VSP在采用多控制器的高端架构基础上,还能够横向扩展多控制器单元,达到了更高的性能吞吐能力,在各项评测中领先于各档次最高端阵列,VSP每秒可处理交易(IOPS)达到400万,带宽达到192GB,更适合本次系统当前和未来发展中大数据量吞吐对性能的要求。平滑扩展能力:测试系统数据在初始数据量的基础上将不断膨胀,访问量也将不断提升,这就需要本次配备的设备具有全方位的扩展能力。当前市场上很多阵列采用不可扩充的双控制器固化结构,只能扩展一定的硬盘容量而无法提升性能,因此IOPS只能达到30-70万左右,并发带宽一般4-16GB硬盘也只能扩展到300-400块。VSP的三维多控制器架构使得扩展能力大大超过了当前的各种阵列,比如控制器可以在基本的一对控制板基础上扩展到16对,在线提升性能。因此IOPS以达到400万左右,并发带宽192GB,硬盘能扩展到2048块,容量扩展为24TB,无论是性能扩展还是容量扩展都是一般阵列的十倍以上。如果选用了VSP,华泰保险的整体数据存储可以在一个统一存储平台上平滑扩展,充分保证了系统-7-
未来多年的持续发展。数据高可靠性:数据100%可靠是华泰保险系统持续运行发展的关键。从本质看大多数存储阵列都通过全冗余技术来保证设备和数据的可靠可用性,但是都无法达到100%据高可用,因为大部分阵列都是双控制器结构,1台控制器内部的部件故障时,这个控制器会完全失效,数据访问需要切换,在失去50%的性能前提下,另一个P570控制器完全成为单点,况且控制器切换也不是100%能够成功的,这对核心存储的可靠运行产生了重大影响。在国内金融、电信、政府很多用户的关键业务都出现过阵列宕机和业务中断也主要出于以上问题。HDSVSP区别于一般阵列的双控制器而采用多冗余控制,是多对一的冗余,且部件故障后无需切换,因为本来就是并行访问的,具有更大的可靠性,作为最大的独立第三方存储厂商,HDS在设备可靠性上确实有更好的口碑。更重要的是HDS公司承诺VSP存储100%高可用性,它意味设备在任何情况下都能保证业务连续运行,甚至在设备升级和故障维护时。业界目前只有HDS存储设备保持着0宕机和“0”数据丢失的记录,也只有HDS公司提出存储产品可以提供100%的可用性承诺,即如果发生宕机和数据丢失,HDS将对用户进行赔偿,这对所有用户数据的可靠性保证提供了可参考的依据,毕竟其它厂商的存储设备都出现过导致业务中断的问题。数据存储整合能力:当前几乎所有存储阵列都是单独使用的孤立设备,只能通过内部配置的硬盘为某类业务提供数据承载,当用户环境有多台这样的存储阵列,IT系统将变得复杂,数据管理也非常困难:一方面这些阵列本身受双控制器无法扩展性能的影响,承载现有业务数据已不堪重负,将来更难实现统一存储平台扩展,当业务量膨胀或业务种类增加时,还需要增加独立的其它阵列,再次形成很多信息孤岛,互相之间无法共享资源,维护复杂,甚至可能需要更换和频繁数据迁移,这与先进的统一信息分级管理、大集中整合的理念是背道而驰的。随着华泰保险业务系统的发展,需要改变这样数据孤岛式架构,实现统一存储平台。HDSVSP可以建立统一存储平台,VSP具有三维多控制器架构,可以-8-
从一个基本配置实现在线10倍以上的性能和容量的提升,这就为华泰保险的长远业务发展打下坚实数据基础,平滑升级、没有设备更换和数据迁移的风险。同时VSP具有独特的基于控制器的存储虚拟化技术,VSP通过光纤线连接就可以挂接其它异构厂商的各个品牌和档次存储阵列,形成统一存储虚拟池,这个虚拟池内,所有的数据空间都由VSP统一管理、分配和使用,而华泰保险现有的一些阵列和将来扩展的阵列都可以融合到这个虚拟存储池中,实际建立了华泰保险的统一“云”存储池。而且存储池内部的不同阵列可以根据业务要求在统一存储平台内实现自然分级,比如原有的一些阵列可以做为二级备份存储,虚拟化环境下,与核心存储VSP形成统一后的分级管理。另外VSP还特有存储分区功能,它可以在各种业务数据集中存储后,解决很多应用对存储前端主机口、缓存、后端磁盘RAID的资源抢占问题,即可以将VSP划分为核心分区、一般业务区、备份区等4个以上存储逻辑分区,每个分区的端口、缓存、磁盘逻辑隔离,保证各应用的QOS,同时可随时动态调整,即在线情况下针对多个分区调配缓存、端口等重要资源。总之,相比其它阵列物理隔离、无法数据融合和分级管理的方案,VSP为华泰保险的系统发展奠定了统一存储的基础。性能价格比:VSP做为高端架构的存储阵列还具有性能价格比的优势,因为VSP是具有伸缩性能的3D扩展模式,可以从一个很基本的配置扩展到非常高性能和大容量的配置。投入上与一般阵列比,如果磁盘容量和数据容量相同,VSP阵列比一般阵列在同等配置方案情况下性能提高至少2倍以上,扩展后可以提高10倍。长远容灾能力:基于存储远程数据复制的容灾建设是当前各个数据中心普遍采用的技术,列容灾重点需要解决数据一致性和最少数据丢失的问题,VSP高端存储产品的容灾复制功能在此方面都具备完善的设计,比如数据一致性通过时间戳、顺序号解决,保证容灾数据是可用的,而实时的容灾数据传送也保证了最少数据丢失,RPO可控制在秒级甚至“0”数据。很多其它阵列虽然也有容灾复制的功能,但其技术设计还无法达到更先进的水平,远程容灾时的一般RPO只能控制在分钟级。-9-
就意味着丢失更多的数据,需要更多甚至几倍的系统灾难恢复时间。同时VSP具备建设多点三数据中心的能力,即未来可以通过三台VSP部署在华泰保险的生产中心、同城容灾中心、异地容灾中心,就可以建设最高数据保护能力的三数据中心,三个中心构成闭环数据连接,而这样的能力是其它阵列所不具备的。2.2整体方案及拓扑结构首先我们建议用新采购的HDSVSP高端存储替换现有USP盘阵,通过HDSTC同步软件进行数据迁移,将现有USP上的数据完全复制到新购的VSP中,同时待VSP测试上线后,将原有USP迁移到上海灾备中心,与现有VSP通过HDSHUR程容灾软件进行容灾,保证两个数据中心的数据一致性,考虑到现有USP容量有限,我们建议本次采购对USP进行容量升级,新增加21300GB磁盘,方案架构拓扑图如下:-10-
泰保数据容灾拓扑泰保LAN京生中心泰保上海异LAN地灾中心SANSANABHURHDSVSP原有HDSUSP2.3本次推荐的VSP及原有USP配置及容量规划2.3.1现有USP硬件配置及升级后配置情况现有USP按照现有磁盘RAID划分实际可用容量为9.6TB左右如果按照7D+1P来计算容量如下:80146GB磁盘做成107+1Raid5可用容量为9.03TB左右20300GB磁盘做成27+1Raid5,一组3+1Raid5可用容量为4.45TB左右合计13.48TBUSP我们推荐今后作为灾难备份的存储使用,所以我们按照7D+1P的方式计算,这样可以最大化USP的现有容量。同时考虑到今后数据量的不断增长,-11-
建议本次采购再多配置21300GB磁盘。2.3.2现有USP软件配置及升级后配置情况现有USP软件包括8TBShadowimage镜像软件,本次暂不做升级,新增加了8TBHUR远程容灾软件许可.2.3.3新购VSP硬件配置情况本次我们推荐的VSP配置具体为,配置100300GB10000RpmSAS磁盘,其中96块磁盘为数据磁盘,4块为全局热备磁盘,168Gb/sFC前端端口,128GBCache新的VSP容量按照14TB可用容量计算如下:32300GB磁盘做成47+1Raid5可用容量为7.33TB左右56300GB磁盘做成142+2Raid10可用容量为7.31TB左右同时提供一组7+1Raid5作为今后远程灾备的日志卷使用合计14.64TB2.3.4新购VSP软件配置情况配置10TBShadowimage镜像软件许可,10TBHUR远程容灾软件许可-12-
3.数据迁移及服务3.1数据迁移概述3.1.1当前系统架构事实上在信息爆炸的今天,数据迁移已经成为一件常态事件,几乎所有客户都必须经常面对这样的需求,数据迁移本身的技术已经非常成熟,关键在于实施过程的组织管理,确保数据迁移顺利进行。作为第三方独立存储厂商,HDS公司从销售第一台独立存储设备就开始了数据迁移的实践过程,HDS公司在国内拥有数千个安装客户,多数客户都经历了数据迁移的过程,在实施中HDS团队积累了大量实践经验,尤其是HDS独特的虚拟化技术为异构存储在线数据迁移提供了强大技术保障。如果华泰保险最后选择HDS产品解决方案,HDS公司实施团队有信心、有能力和客户一道成功完成数据迁移工作。3.1.2存储迁移架构华泰保险的数据迁移需要保证系统的平滑过渡,因此方案迁移架构上建议采用VSPTureCopy软件,通过底层阵列卷复制方式进行迁移,迁移方案需要以最短的停机时间来完成。规划设计按照以下总体步骤来完成:1.VSP安装VSPraid实施,shadowimage实施新购VSP与原USP通过turecopy做数据复制,可采用停机最大速2.本地数据迁移率拷贝,也可通过不停机限速拷贝。3.本地测试新购VSP与新IBM主机以及ORACLE10G测试新购VSPUSP做数据同步更新,采用新VSP+IBM主机新系4.VSP上线统上线5.USP安装USPraid实施,shawimage实施6.本地磁盘主机复制VSP上线后,与USP在本地机房实现turecopy做数据复制。复关系建立制完成后,实现HUR同步设置7.USP下电USP下电,包装,运输8.上海容灾中心建立USP上电,测试,并与VSP恢复HUR同步关系-13-
3.1.3TrueCopy项目实施工作表项目编号11.11.21.31.41.51.61.71.81.9调研、准备阶段确认生产中心具体地址确认生产中心存储型号及加电状态;若加电Ready,则需获得OfflineSVP配置信息确认容灾中心具体地址确认容灾中心存储型号及加电状态;若加电Ready,则需获得OfflineSVP配置信息确认用户需要实施容灾的应用,尽可能细化到LUN一级,并获得用户Mail确认确认生产中心与容灾中心已购的TCLicense容量确认生产中心与容灾中心的连接方式,并明确责任人确认生产中心与容灾中心的CCI服务器以及连接方式,并明确责任人确认存储微码版本,并从微码的ECN种确认本次实施CCI软件的版本工作内容1.10强烈建议:在调试、实施阶段,从生产中心能登录容灾中心的存储、SAN交换机22.12.22.32.42.52.62.72.833.13.23.33.43.53.63.73.83.9规划、设计阶段明确生产中心P-Vol、一致性组的规划与设计明确容灾中心S-Vol的规划与设计明确生产中心存储容灾端口的规划与设计明确容灾中心存储容灾端口的规划与设计明确容灾链路的连接TopologySANSwitchHDS下的单,则完成Switch的规划与设计明确CCI服务器的配置设计:包括:IP/UDP/Dev_Group/Dev_Name/MU#等规则明确生产中心的InstanceA;而容灾中心的InstanceB,且AB不同实施前的DoubleCheck阶段确认生产中心存储运行正常,并通过生产中心OfflineSVP确认存储是按照设计实施的确认容灾中心存储运行正常,并通过生产中心OfflineSVP确认存储是按照设计实施的确认生产中心CCI服务器能识别到生产存储的CMD确认容灾中心CCI服务器能识别到容灾存储的CMD确认生产中心CCI服务器与容灾中心CCI服务器TCP/IP能正常通讯确认在生产中心能远程登录容灾中心的存储、SANSwitch确认生产中心存储容灾端口--SANSwitch--DWDM之间的光纤已敷设完毕确认容灾中心存储容灾端口--SANSwitch--DWDM之间的光纤已敷设完毕若通过DWDM完成容灾,确认DWDM设备之间的光纤已连接正常3.10若用户计划做容灾数据验证,确认容灾中心的主机系统已经安装完毕,且已连接至容灾存储44.14.2现场实施阶段为安全期间,实施TC前通过ExportTools搜集一天的性能数据以备今后分析之用现场确认生产中心P-Vol与容灾中心S-VolBlock一级的“一一对应”-14-
4.34.44.54.64.74.84.94.10按照设计,在生产中心与容灾中心检查和设置TC实施所需要的存储系统的Mode在生产中心与容灾中心加载实施TC所需要的License把生产中心与容灾中心存储的容灾发起端口属性改成InitiatorPort把生产中心与容灾中心存储的容灾接收端口属性改成RCUTargetPort按照设计,创建生产中心与容灾中心容灾端口的ZoneLzone,并激活之按照设计,创建生产中心与容灾中心的LogicalPath在生产中心CCI服务器上安装CCI软件,并完成horcm.conf的配置在生产中心CCI服务器上启动InstanceA,且Pairdisplay加“-l”参数,显示生产中心信息正4.11在容灾中心CCI服务器上安装CCI软件,并完成horcm.conf的配置4.12在容灾中心CCI服务器上启动InstanceB,且Pairdisplay加“-l”参数,显示容灾中心信息正4.13确认当前只登录到生产中心的CCI服务器上4.14确认通过pairdisplay加“-l”参数显示的都是生产中心信息4.15在当前窗口键入:paircreate-IHA-gdev_group_name-vl-fgnever-c84.16在当前窗口键入:pairdisplay-IHA-gdev_group_name-fxcm,看到正在复制中4.17若干时间后,在当前窗口键入:pairdisplay-IHA-gdev_group_name-fxcm,确认复制完毕4.18为安全期间,实施TC后通过ExportTools搜集一天的性能数据以备今后分析之用55.15.25.35.466.16.2现场测试阶段确认pairdisplay/pairsplit/pairresync三大核心命令能正常操作通过“pairsplit-IHA-gdev_group_name-rw”命令,能让S-Vol可被主机使用再发出“pairresync”命令前,确认S-Vol在主机层面上处于umount状态按照用户需求将CCI命令编写成运行脚本,通过测试后再运行现场培训与文档交接将现场环境给用户做介绍,并简单介绍维护命令的操作提交设计文档、配置文档和维护文档3.1.4HUR项目实施工作表项目编号11.11.21.31.41.51.61.71.81.9调研、准备阶段确认生产中心具体地址确认生产中心存储型号及加电状态;若加电Ready,则需获得OfflineSVP配置信息确认容灾中心具体地址确认容灾中心存储型号及加电状态;若加电Ready,则需获得OfflineSVP配置信息确认用户需要实施容灾的应用,尽可能细化到LUN一级,并获得用户Mail确认确认生产中心与容灾中心已购的HURLicense容量确认生产中心与容灾中心的连接方式,并明确责任人确认生产中心与容灾中心的CCI服务器以及连接方式,并明确责任人确认存储微码版本,并从微码的ECN种确认本次实施CCI软件的版本工作内容-15-
1.10强烈建议:在调试、实施阶段,从生产中心能登录容灾中心的存储、SAN交换机以及SANRouter22.12.22.32.42.52.62.72.833.13.23.33.43.53.63.73.83.9规划、设计阶段明确生产中心P-VolJNL卷和一致性组的规划与设计明确容灾中心S-VolJNL卷和一致性组的规划与设计明确生产中心存储容灾端口的规划与设计明确容灾中心存储容灾端口的规划与设计明确容灾链路的连接TopologySANSwitchSANRouterHDS下的单,则完成Switch/Router的规划与设计明确CCI服务器的配置设计:包括:IP/UDP/Dev_Group/Dev_Name/MU#等规则明确生产中心的InstanceA;而容灾中心的InstanceB,且AB不同实施前的DoubleCheck阶段确认生产中心存储运行正常,并通过生产中心OfflineSVP确认存储是按照设计实施的确认容灾中心存储运行正常,并通过生产中心OfflineSVP确认存储是按照设计实施的确认生产中心CCI服务器能识别到生产存储的CMD确认容灾中心CCI服务器能识别到容灾存储的CMD确认生产中心CCI服务器与容灾中心CCI服务器TCP/IP能正常通讯确认在生产中心能远程登录容灾中心的存储、SANSwitchSANRouter确认生产中心存储容灾端口--SANSwitch--SwitchRouter之间的光纤已敷设完毕确认容灾中心存储容灾端口--SANSwitch--SwitchRouter之间的光纤已敷设完毕若通过FCOverIP完成容灾,确认SANRouter之间的TCP/IP已能正常通讯3.10若通过DWDM完成容灾,确认DWDM设备之间的光纤已连接正常3.11若用户计划做容灾数据验证,确认容灾中心的主机系统已经安装完毕,且已连接至容灾存储44.14.24.34.44.54.64.74.84.9现场实施阶段为安全期间,实施HUR前通过ExportTools搜集一天的性能数据以备今后分析之用现场确认生产中心P-Vol与容灾中心S-VolBlock一级的“一一对应”按照设计,在生产中心与容灾中心检查和设置HUR实施所需要的存储系统的Mode在生产中心与容灾中心加载实施HUR所需要的License按照设计,在生产中心存储上创建JNLGroupJNLVol,并按照设计更改JNLGroup属性按照设计,在容灾中心存储上创建JNLGroupJNLVol,并按照设计更改JNLGroup属性把生产中心与容灾中心存储的容灾发起端口属性改成InitiatorPort把生产中心与容灾中心存储的容灾接收端口属性改成RCUTargetPort按照设计,创建生产中心与容灾中心容灾端口的ZoneLzone,并激活之4.10按照设计,创建生产中心与容灾中心的LogicalPath4.11在生产中心CCI服务器上安装CCI软件,并完成horcm.conf的配置4.12在生产中心CCI服务器上启动InstanceA,且Pairdisplay加“-l”参数,显示生产中心信息正4.13在容灾中心CCI服务器上安装CCI软件,并完成horcm.conf的配置4.14在容灾中心CCI服务器上启动InstanceB,且Pairdisplay加“-l”参数,显示容灾中心信息正4.15确认当前只登录到生产中心的CCI服务器上4.16确认通过pairdisplay加“-l”参数显示的都是生产中心信息-16-
4.17在当前窗口键入:paircreate-IHA-gdev_group_name-vl-fasync-jpX-jsY-c84.18在当前窗口键入:pairdisplay-IHA-gdev_group_name-fxcm,看到正在复制中4.19若干时间后,在当前窗口键入:pairdisplay-IHA-gdev_group_name-fxcm,确认复制完毕4.20为安全期间,实施HUR后通过ExportTools搜集一天的性能数据以备今后分析之用55.15.25.35.466.16.2现场测试阶段确认pairdisplay/pairsplit/pairresync三大核心命令能正常操作通过“pairsplit-IHA-gdev_group_name-rw”命令,能让S-Vol可被主机使用再发出“pairresync”命令前,确认S-Vol在主机层面上处于umount状态按照用户需求将CCI命令编写成运行脚本,通过测试后再运行现场培训与文档交接将现场环境给用户做介绍,并简单介绍维护命令的操作提交设计文档、配置文档和维护文档3.1.5ShadowImage项目实施工作表项目编号11.11.21.31.41.51.622.12.22.32.42.533.13.23.344.14.24.34.44.5调研、准备阶段确认实施具体地址确认存储型号及加电状态;若加电Ready,则需获得OfflineSVP配置信息确认用户需要实施SI的应用,尽可能细化到LUN一级,并获得用户Mail确认确认已购的SILicense容量,注意LicenseP+S卷容量的和确认的CCI服务器以及连接方式,并明确责任人确认存储微码版本,并从微码的ECN种确认本次实施CCI软件的版本规划、设计阶段明确P-VolS-Vol和一致性组的规划与设计明确P-Vol端口的规划与设计明确S-Vol端口的规划与设计明确CCI服务器的配置设计:包括:IP/UDP/Dev_Group/Dev_Name/MU#等规则,注意不同层次的MU#区别明确P-VolInstanceA;而S-VolInstanceB,且AB不同实施前的DoubleCheck阶段确认存储运行正常,并通过OfflineSVP确认存储是按照设计实施的确认CCI服务器能识别到存储的CMD确认License足够现场实施阶段为安全期间,实施SI前通过ExportTools搜集一天的性能数据以备今后分析之用现场确认P-VolS-VolBlock一级的“一一对应”按照设计,检查和设置SI实施所需要的存储系统的Mode加载实施SI所需要的LicenseCCI服务器上安装CCI软件,并完成horcm.conf的配置工作内容-17-
4.64.74.84.9CCI服务器上启动InstanceA,且Pairdisplay加“-l”参数,显示信息正常CCI服务器上启动InstanceB,且Pairdisplay加“-l”参数,显示信息正常在当前窗口键入:paircreate-IHA-gdev_group_name-vl-fqnormal-mgrp-c8在当前窗口键入:pairdisplay-IHA-gdev_group_name-fxcm,看到正在复制中4.10若干时间后,在当前窗口键入:pairdisplay-IHA-gdev_group_name-fxcm,确认复制完毕4.11为安全期间,实施SI后通过ExportTools搜集一天的性能数据以备今后分析之用55.15.25.35.466.16.2现场测试阶段确认pairdisplay/pairsplit/pairresync三大核心命令能正常操作通过“pairsplit-IHA-gdev_group_name”命令,能让S-Vol可被主机使用再发出“pairresync”命令前,确认S-Vol在主机层面上处于umount状态按照用户需求将CCI命令编写成运行脚本,通过测试后再运行现场培训与文档交接将现场环境给用户做介绍,并简单介绍维护命令的操作提交设计文档、配置文档和维护文档-18-
4.项目灾难备份演练、切换策略4.1灾难备份演练策略4.2灾难备份演练概述灾难备份演练是检验灾难备份中心、灾难备份系统、灾备组织以及灾难恢复流程是否能满足企业灾难恢复的要求,同时可以熟练和提高组织灾难恢复队伍的技能和技巧,发现现有系统、配置、流程的不足,确保在需要灾难恢复情况下,业务系统能够实现预期的灾难恢复目标。4.2.1灾难备份演练的目的灾备演练目的如下:检验灾难备份系统有效性;检验灾难恢复预案是否满足灾难恢复的要求;确认灾难恢复水平是否满足灾难恢复目标(RTORPO)的要求;确认灾难备份系统的处理能力符合业务接管的要求;发现现有灾备系统、系统配置、流程的不足之处;提高恢复团队的恢复技能和相应速度。通过一次近似真实的灾备演练,确保在需要灾难恢复时,业务系统能够按照预期要求切换到灾备中心。4.2.2灾难备份演练的方法参考HDS的灾难演练方法论,我们按如下顺序确定本次灾难演练主要方式和内容:1.确定演练策略确定演练目标及成功标准;确定演练方式;确定演练范围;演练的灾难场景;演练频率;后勤保障计划;-19-
2.建立演练场景建立且也可能发生的灾难事件及与企业相关的突发事件的大致的演练场景和演练条件;训练团队成员进入演练角色,抛开常规的工作方式,以灾难情况下的要求进行决断;演练开放式的通信机制,包括记录及文档化应急操作中心的要求。3.建立演练评估标准4.建立演练时间表制定改进的时间表设定实际的时间范围分配合适的实际资源5.选择演练方法功能演练桌面演练模拟演练全面演练6.定义演练目标明确定义演练的目标与范围目标不能给机构带来风险简述参与者的职责,确保他们了解各自的角色7.准备演练控制计划与报告建立实用的、符合机构的演练场景定义演练的前提,并描述限制条件确定实施演练所需的资源确定演练判定者(裁判)提供演练所需的物品清单,并详述演练环境提供一份突发事件时间表提供一个备选计划,确保从突发事件的状况下取得有效的演练价值-20-
4.3灾难备份切换策略4.3.1灾难备份切换概述灾难切换主要指灾难发生时,鉴于生产中心不可用,由企业决策并发起的灾难备份系统的启用过程。在此过程执行成功后,业务系统完成从生产中心向灾备中心运行的切换。在此切换过程中,按照预先制定的灾难恢复流程进行系统恢复,然后进入日常业务在灾难备份中心重续运行的工作。4.3.2灾难备份切换策略当灾难发生后,是否切换到灾备中心需要经过一系列复杂的决策过程,该系列工作项目由灾难备份领导小组执行。灾难备份领导小组组长具有最终的职责确认所有必须的工作项目均已完成。进行相关损害评估结束后,评估人员应该形成损害评估报告提交给灾难恢复领导决策小组。损害评估的结果相当重要,是领导小组进行灾难研判和决策是否进行灾难宣告的重要依据。损害评估过程可以结合如下表格进行:务系统TOR组到达现场所间总计时间需时间时间布灾难否需要宣表中,时间总计=灾难发生至今时间+灾难恢复小组抵达现场所需时间+恢复所需时间。当"时间总计"大于该业务的RTO时,应该宣布灾难状态,启动灾难恢复流程。如果该时间仍未达到RTO,则继续监控灾难发展状态,并记录下最迟宣布灾难时间,作为下一次评估前的依据。4.3.3灾难切换及完整地意义的灾难恢复从业务连续运行的角度出发,灾难切换包含业务层面的恢复和IT系统的灾难恢复两大部分。IT系统的灾难恢复主要完成灾难备份系统的启用和接管、支持业务运行的-21-
工作。而业务操作层面的恢复则从更广的层面关心银行业务在灾难发生时的持续运行,从而降低对客户的影响,控制由于灾难带来的风险,最大限度地保障银行在灾难中减少损失。尤其是在IT系统切换过程中,技术手段自身存在无法克服的问题时(切换需要一段时间,存在业务数据丢失),业务操作手段可以作为弥补(柜台应急支付,通过凭证补录丢失的数据)通过业务和IT两个层面的灾难恢复,可以达到最佳的灾难恢复效果。因此,从业务连续性的角度出发,既要做好针对灾备中心和灾备系统的灾难恢复流程,又要针对业务恢复,建立指导业务部门和相关单位统一协调、应对灾难事件(本文重点讨论数据中心灾难)的操作流程。4.3.4灾难备份系统在技术层面可能存在的恢复缺陷灾难发生前后,银行业务将面临业务中断运行的风险和数据丢失的风险。些情况破坏了银行业务的连续运行,带来巨大的经营风险,通过灾备的实施,IT系统的灾难恢复角度出发,解决了核心IT系统恢复的问题,但是由于受到技术手段和恢复范围的限制,仍将存在以下问题:无法避免数据丢失:RPO范围内的数据丢失;不能立即恢复业务:RTO范围内灾备系统不能完成启动;部分业务不能恢复:该部分业务不在灾备恢复的业务范围内;4.3.5关键业务系统灾难恢复方案在灾难发生时刻,客户整体的有序响应和协同工作是非常重要的。在意外事件发生后,对意外事件第一时间的反应处理,包括灾难预警处理流程、人员疏散计划,损害评估流程、事件通报流程以及灾难宣告流程。在灾难发生后,现场人员应根据现场状况将损失、修复、抢救情况及时反映给指挥小组;指挥小组根据灾难的定义“在特定时间内导致关键业务无法正常运作的事件”对照RTO进行评估,以决定是否宣布灾难状态及启动相应灾难恢复流程。该评估过程在灾难发生后应该定时进行,以应对不断变化的灾难状态。下是概要的灾难恢复流程:核心业务系统恢复:因为核心业务系统的数据实现了数据实时数据备份,生产系统的数据和目标更新将通过HDS的实时更新写入备份系统磁盘中,一旦灾难发生时,生产系统与备份系统的高速数据链路中断,则备份系统经过进行当天交易的补漏、数据验证和系统测试等一系列预先制订的灾难恢复预案,就可立即恢复核心业务数据处理。外围业务系统恢复:在灾难备份系统的日常运行中,服务器等系统均不需要启动运行;当灾难发生时,使用这些已经安装了最新软件版本的服-22-

免费下载 Word文档免费下载: 正在进行安全检测...

  • 29.8

    ¥45 每天只需1.0元
    1个月 推荐
  • 9.9

    ¥15
    1天
  • 59.8

    ¥90
    3个月

选择支付方式

  • 微信付款
郑重提醒:支付后,系统自动为您完成注册

请使用微信扫码支付(元)

订单号:
支付后,系统自动为您完成注册
遇到问题请联系 在线客服

常用手机号:
用于找回密码
图片验证码:
看不清?点击更换
短信验证码:
新密码:
 
绑定后可用手机号登录
请不要关闭本页面,支付完成后请点击【支付完成】按钮
遇到问题请联系 在线客服