[论文关键词]RAID 模式 应用 功能
[论文摘要]随着计算机技术的发展,使存储数据的技术手段也发生很大变化。存储信息并且防止信息丢失就成为了一个首要问题。利用RAID技术可以把数据分布到多个硬盘上,从而取得更好的稳定性和性能。
一、引言
随着计算机技术的快速发展和计算机应用的不断深入,计算机已经逐渐介入了我们的生活的方方面面,同时各个方面对计算机技术提出了更高的要求,为了适应人们的需要,计算机技术不断的在各个方面变革着。Internet的普及更加剧了信息的几何化增长,于是存储信息并且防止信息丢失就成为了一个首要问题。当然用于存储信息数据的设备就是关键了:比如对于一个大型的网站来说,因为存储设备的故障导致网站的片刻的瘫痪,也可能带来巨大的损失。那么,如何解决这一问题呢?很显然单靠用多个硬盘简单的备份不能从根本上解决问题。这时一种叫做独立冗余磁盘阵列(RAID)的技术就应运而生了,这种技术可以把数据分布到多个硬盘上,从而取得更好的稳定性和性能。
二、RAID技术
(一)RAID技术简介。RAID就是一种由多块廉价磁盘构成的冗余阵列,在操作系统下是作为一个独立的大型存储设备出现。RAID可以充分发挥出多块硬盘的优势,可以提升硬盘速度,增大容量,提供容错功能够确保数据安全性,易于管理的优点,在任何一块硬盘出现问题的情况下都可以继续工作,不会受到损坏硬盘的影响。
数据冗余的功能可以保证用户数据一旦发生损坏,就可利用冗余信息使损坏数据得以恢复,从而保障了用户数据的安全性。在用户看起来,组成的磁盘组就像是一个硬盘,用户可以对它进行分区,格式化等等。总之,对磁盘阵列的操作与单个硬盘一模一样。不同的是,磁盘阵列的存储性能要比单个硬盘高很多,而且可以提供数据冗余。
(二)RAID的几种模式。RAID的级别从RAID概念的提出到现在,已经发展了多个级别,有明确标准级别分别是0、1、2、3、4、5等。但是最常用的是0、1、3、5四个级别。其他还有6、7、10、30、50等。
1.RAID 0。RAID 0又称为Stripe或Striping,即Data Stripping数据分条技术,它代表了所有RAID级别中最高的存储性能。RAID 0是由多个硬盘并发协同工作完成数据的读写,数据被均匀分布在各个硬盘上,一般情况下,使用的硬盘越多,读写的速度越快。RAID0的特点是读写速度快,并且价格便宜;缺点是安全性相对较差,因为在RAID0中的一个硬盘出现故障时,整个阵列的数据将会丢失。RAID0是最快和最有效的磁盘阵列类型,但没有容错功能。因此,RAID 0不能应用于数据安全性要求高的场合。
2.RAID 1。RAID1称为磁盘镜像。原理是在两个硬盘之间建立完全的镜像,即所有数据会被同时存放到两个物理硬盘上,当一个磁盘出故障时,仍可从另一个硬盘中读取数据,因此安全性得到保障。但系统的成本大大提高,因为系统的实际有效硬盘空间仅为所有硬盘空间的一半。
3.RAID 3。RAID3是把数据分成多个“块”,按照一定的容错算法,存放在N+1个硬盘上,实际数据占用的有效空间为N个硬盘的空间总和,而第N+1个硬盘上存储的数据是校验容错信息,当这N+1个硬盘中的其中一个硬盘出现故障时,从其它N个硬盘中的数据也可以恢复原始数据,这样,仅使用这N个硬盘也可以带伤继续工作(如采集和回放素材),当更换一个新硬盘后,系统可以重新恢复完整的校验容错信息。由于在一个硬盘阵列中,多于一个硬盘同时出现故障率的几率很小,所以一般情况下,使用RAID3,安全性是可以得到保障的。与RAID0相比,RAID3在读写速度方面相对较慢。
4.RAID4。RAID4即带奇偶校验码的独立磁盘结构,RAID4和RAID3很像,它对数据的访问是按数据块进行的,也就是按磁盘进行的,每次是一个盘,RAID4的特点和RAID3也挺象,不过在失败恢复时,它的难度可要比RAID3大得多了,控制器的设计难度也要大许多,而且访问数据的效率不怎么好。
5.RAID5。RAID5把校验块分散到所有的数据盘中。RAID5使用了一种特殊的算法,可以计算出任何一个带区校验块的存放位置。这样就可以确保任何对校验块进行的读写操作都会在所有的RAID磁盘中进行均衡,从而消除了产生瓶颈的可能。RAID5的读出效率很高,写入效率一般,块式的集体访问效率不错。RAID5提高了系统可靠性,但对数据传输的并行性解决不好,而且控制器的设计也相当困难。
6.RAID 6。RAID6即带有两种分布存储的奇偶校验码的独立磁盘结构,它是对RAID5的扩展,主要是用于要求数据绝对不能出错的场合,使用了二种奇偶校验值,所以需要N+2个磁盘,同时对控制器的设计变得十分复杂,写入速度也不好,用于计算奇偶校验值和验证数据正确性所花费的时间比较多,造成了不必须的负载,很少人用。
7.RAID7。RAID7即优化的高速数据传送磁盘结构,它所有的I/O传送均是同步进行的,可以分别控制,这样提高了系统的并行性和系统访问数据的速度;每个磁盘都带有高速缓冲存储器,实时操作系统可以使用任何实时操作芯片,达到不同实时系统的需要。允许使用SNMP协议进行管理和监视,可以对校验区指定独立的传送信道以提高效率。可以连接多台主机,当多用户访问系统时,访问时间几乎接近于0。但如果系统断电,在高速缓冲存储器内的数据就会全部丢失,因此需要和UPS一起工作,RAID7系统成本很高。
8.RAID10。RAID10即高可靠性与高效磁盘结构它是一个带区结构加一个镜象结构,可以达到既高效又高速的目的。这种新结构的价格高,可扩充性不好。
9.RAID53。RAID7即高效数据传送磁盘结构,是RAID3和带区结构的统一,因此它速度比较快,也有容错功能。但价格十分高,不易于实现。
三、RAID级别的的选择
使用的容错算法和分块大小决定RAID使用的应用场合,在通常情况下,RAID3比较适合大文件类型且安全性要求较高的应用,如视频编辑、硬盘播出机、大型数据库等;而RAID5适合较小文件的应用,如文字、图片、小型数据库等。RAID级别的选择有三个主要因素:可用性(数据冗余)、性能和成本。
四、RAID技术的实现方法
RAID实现有两种方法,一种是用专门的控制新片来完成,控制芯片可以做成RAID卡的形式,也可以集成在主板上。另一种方法是用软件的方法来实现,比如WIN2000就含有软件RAID的功能。
总之,冗余磁盘阵列RAID技术,能够将有效数据和校验数据均匀分布在多个硬盘中并加入校验数据,当有硬盘损坏时,通过校验数据恢复损坏硬盘申的数据。在恢复过程中,不影响系统的服务。同时,RAID系统可以大幅度提高磁盘数据1/0(input/outpu志;输入输出)的性能。通过配置并使用RAID系统,可以最大限度地减少由于硬件损坏造成的系统故障和数据丢失。
参考文献:
[1]基于网络RAID结构的IP存储广域网性能研究 / 崔宝江着。
[2]二级网络条纹数据布局及其相关问题的研究/ 刘晓光。
[3]《网络技术精要建网管网500问》曾明/李建军等着 电子工业出版社2003. 11。