EMCCentera内容寻址存储解决方案介绍.doc

XXX全国医疗信息化联盟,为全国医疗信息化人员提供最全面的资料平台EMCCentera内容寻址存储解决方案目录第一章:前言3第二章:介绍4产品介绍4使用Centera4C-ClipTM功能5Centera结构6API介绍9API基本功能10容灾技术12综述12正常操作(normaloperation)13修复(repairandrecovery)13恢复(restore)14容灾方案的设计需考虑的因素15第一章:前言根据Global2000最近的一份调查显示,今后增长最快的数据是一种叫做“固定内容”的数据。固定内容包括了任何形式的数字化信息,如文档、电子邮件、影像、Video/Audio流体、_光片、CAD图纸等。这种快速增长的数据要求有一个切实可行的存储来实现安全的、在线的、几十年的数据存放即内容寻址存储(CAS:ContentAddressedStorage)。不象传统的通过一个具体的物理地址和文件名来存取数据,CAS设备使用一个内容地址来存放和读取此内容对象。因为一个内容数据通常其大小是没有任何上限的,因此CAS设备需要具有极强的可扩展能力,甚至到PB级(1PB=1024TB),但同时要保障秒级的寻址性能。基于BLOCK(块)和文件(FILE)存取的传统的磁盘存储系统,非常适合于那种TB级的、交易型的或整合型的应用环境。但是在今天,我们的管理层需要一个可以在线保存大量固定内容数据系统,这个系统可以通过网络的方式来实现数据的存取。EMC的Centera,是一个基于内容寻址的存储解决方案。它的CentraStar软件,和模块化的磁盘组件一起,共同实现了对应用和用户透明的物理资源的管理。业界的一些内容管理(ContentManagement)应用可方便地通过Centera所提供的API接口来实现对内容数据的管理。第二章:介绍EMC的Centera提供给用户许多独特的价值:!容易管理:Centera技术简化了对几百TB甚至PB的内容数据的管理工作。它无需进行任何RAID的选择,无需进行LUN的配置,无需进行文件系统的管理。用户的应用从传统的提出要求到简单地利用其功能。!数据安全任何呈现给系统的对象,保存在一个不可更改的和需授权的地方。这对用户的应用完全透明。!有效的复制Centera使用一个唯一的基于内容的地址,来确保无论此数据被存入了多少次,它在系统中仅存在一份(和另一份复制数据以保障数据的安全性)。这可有效地减少由于数据的重复存放而造成的整体费用增高。!灵活的扩展能力基于独立节点冗余阵列(RAIN:RedundantArrayofIndependentNodes)的Centera可以无需重新配置而进行从TB级到PB级的扩容。!容易安装和升级Centera可在一个小时之内进行在线的系统安装和升级,非常迅速。产品介绍使用CenteraCentera介绍了一个新的数据处理技术,即内容寻址。当存放一个固定内容数据到Centera时,应用将获得跟此内容数据对应的唯一密钥(claimcheck)。当需要读取此数据对象时,应用可简单地发送它的密钥(claimcheck)给Centera。Centera接收到此密钥后,就可把对应的数据对象返回应用。以下图示说明了Centera存放数据对象,亦称之为BLOB(二进制大对象)的详细流程:

1、应用写入一个数据给CenteraAPI,API计算出一个128位的用户文件内容地址CA,同时产生一些必要的其它数据Metadata,如文件名、生成日期等。

2、Centera存放此BLOB,同时产生一个镜像拷贝。

3、CA和Metadata插入一个_ML文件,组成一个C-Clip描述文件(CDF)。说明:C-Clip是CDF和内容对象的联合体。

4、当两份BLOB和两份CDF都被安全地存放在Centera后,C-ClipCA将被返回给应用。

5、当将来需要使用此对象数据时,应用仅需把此C-ClipCA发送到API,就将从Centera获得此数据,而无需任何其它的目录、文件名、URL地址等。C-ClipTM功能C-ClipCA实际上就是存放对象(如用户文件BLOB)的授权指纹。只要是所存的对象有1个Bit被改变,用户应用都将通过API获得一个包含新内容地址的CDF。原来的数据对象仍然使用原有的内容地址和CDF。这种WORM(写一次,读多次)的结构是任何其它文件系统所不能提供的。另一个好处就是,如果多个用户存放同一个对象数据时,只有一份数据(加上镜像保护数据)将被存放,用户都将获得一个唯一的C-ClipCA指向同一个对象,而不会被存放多份。这对于节省存储空间非常有用,可用于诸如保存EMAIL附件的一些应用中。这种C-Clip方式,使用应用开发者、用户和存储管理者不需要考虑这些数据的物理存放地址,及逻辑路径。而C-ClipCA是数据的唯一的、全局的、可在任一地点进行存取的标志。因为Centera使用了一个与物理地址无关的数据存放技术,因此所导致的结果是数据的移动非常简单,可利用此特点进行容灾保护。当一个数据对象被存放在本地时,可同步地、自动地通过WAN复制到异地。这可通过Centera的软件功能实现,在实施时同时配置好本地的和异地的Centera即可。当本地发生灾难,需要重建数据时,异地的Centera可根据需要当成本地的Centera使用。同时,这种数据复制是可以双向的。用户使用Centera时,是通过基于内容的软件应用(例如ContentManagement应用)实现。此内容管理软件通过Centera强大的API功能访问Centera。Centera结构Centera是一个“无单点故障”的结构,它具有极强的可扩展性和非中断实施能力。Centera由冗余阵列独立节点(RAIN)组成,可安装在一个或多个19机架上。一个独立的机架可安装

16、24或32个独立节点,对应地提供

4.2TB、

7.2TB或

9.6TB被镜像保护后的可用容量。每个节点包含有一个CPU,600GB物理容量,同时通过一个自带的局域网(PrivateLAN)连接到同族(cluster)中的其它节点。每个节点可操作在如下二种模式:1)存储节点(StorageNode):用于长期存放BLOB和CDF2)前端节点(Front-EndNode):用于连接应用服务器和存储节点吞吐量性能由安装时配置了多少个前端节点来决定。每一个前端节点通过一条100MB的以太网线连接到应用服务器。提供的Centera可以通过多条网线连接到应用服务器。应用服务器完全可享受由Centera所提供的灵活扩展能力和高可用性。需注意的是,前端节点并不提供长期的数据存放,存储容量的计算由存储节点来决定。例如,一个32节点的Centera,若配置4个节点为前端节点,28个节点为存储节点时,则可用的容量为:28_600GB/2=

8.4TB。这种结构使得Centera具有容量和性能的极佳可扩展能力。容量扩展可通过一次加入

2.4TB可用容量的节点(即8个存储节点)实现。同时,通过前端节点的扩展,可满足性能的要求。这种结构最大的好处是,扩展非常简单,无需增加时间,无需复杂的管理。这种结构使得一个管理员就可以轻松管理几百TB或PB的数据。多个Centera机架可以组合成一个单独的族(cluster),提供154TB的可用容量。Centera通过多条TCPIPLAN端口连接多台Windows或Uni_应用服务器。如果154TB还不够时,用户端应用API可以同时涉及几个族(cluster),如下图所示,以达到PB级的容量。实施时非常简单,就是简单地把新的族连接到应用服务器的LAN即可。Centera的API已设计成可处理多个族的并行结构。Centera机架可由二路不同的外部电源供电,以提高可用性。同时,可保证保存在Centera中的镜像数据由不同的外部电源供电。如果外部电源A掉电后,存放在另一个节点的数据可由外部电源B(未掉电)继续访问。注意,当二个外部电源中的一个掉电后,Centera则处于一个“只读”状态,这是因为此时新写入的数据不能进行镜像复制的原因。因此,对于高可用性要求的用户来说,采用一个UPS进行电源保护,可保障数据的连续可用。Centera本身具备许多的管理功能,使得用户无需对它进行更复杂的管理,因此可大大降低整体运行成本。例如Centera本身具备有自我管理功能、动态扩展能力、自治愈能力。当一个新的存储单元加入到一个族(cluster)中,通电后,Centera就可自动地“自动发现”,同时把此新存储单元加入到此族中。利用Centera的操作软件:CentraStarTM,当一个磁盘故障时,受这个故障磁盘影响的所有对象数据将由另外的可用磁盘自动重建。在一个硬件故障的事件中,用户数据可保障任何时候都可用,无需进行任何停机或恢复的动作。另外,数据的一致检查都是在后台进行,它连续计算所有对象的内容地址,并与原来存储在CDF中的内容地址进行比较。同样地,镜像的对象同样进行类似的确认。Centera的安全模式设计是基于C-Clips固有的特性的,是一个集成的技术。基本的存取控制就是,如果你不知道BLOB的C-ClipCA,则无法访问Centera中的此数据对象。管理Centera的操作是非常简单易行,具有长期的生命周期。Centera软件CentraStar,可进行对存储数据的写入、读取和智能的网络认识。它提供Centera强大的功能,如自我管理、自我配置、自我治愈、非中断维护和升级、和内容复制功能。另外决定和指定每一个存入对象唯一地址的软件技术同时也是CentraStar的一部分。Centera的内容寻址特性使得可简便地扩展容量,同时也使得存放的对象可方便地在用户的内容构架中进行移动。这个内容地址,数据对象的唯一标志,确保所需信息的授权,因此无论在何时何地都可访问此对象。存取对象时不要求任何对存储环境,或对象存放物理地址的知识。而这些关系是由CentraStar操作环境来维护的。系统管理员无需担心对卷和文件系统结构的维护。系统管理员需要做的是监控Centera的容量和对象存放/读取的性能(MBps)。系统管理员从任何一台通过LAN连接到Centera前端节点的WindowsPC或UNI_工作站,用一个简单的CLI,通过SecureShell(ssh)来远程管理Centera。这个CLI同时允许系统管理员用来改变任何跟节点有关的信息,如Centera的公共IP地址和子网,及用户联系名字和EMAIL地址等。如前面所述,在需要增加容量时,若在同一个机架中有空的位置,则简单地安装新的存储节点即可;若是需要增加另一个机架,则通过2个千兆以太网LAN连接此两个机架即可,是真正的“即插即用”设计。API介绍如前所述,应用服务器存取Centera时是通过API来实现的。而一个CDF是所需数据对象的_ML描述文件,它不但包含了指向此数据对象的地址指针,还包含有系统产生的其它数据,如系统名、定位、产生者、项目名等。一个基于内容的应用将使用一个数据库来管理此对象的“所有者”、影像、文件等信息。这个数据库将按分类号或记录号来索引,也包含有指向数据对象的域。

预览已结束,下载原文档直接使用
查看全文
若对以上有内容有疑问请反馈或举报举报
声明:
您购买的是此内容的word文档,付费前可通过免费阅读辨别合同。非质量问题不退款,如需帮助可咨询客服【客服微信】