8.1数据存储概念
(1)熟练掌握数据与数据存储
1数据存储是根据不同的应用环境,通过采取合理、安全和有效的方式将数据
保存到某些介质上,并能保证有效的访问。包含两方面含义,一是数据临时或
长期驻留的物理介质,另一方面是保证数据完整、安全存放的方式或行为。
2数据存储要解决的问题是连接、存储和文件组织。存储依赖于存储介质和
存储设备。存储包括物理成分和逻辑成分。物理成分包络磁盘、固态盘、
磁带和磁带库等;逻辑成分包括磁盘阵列、镜像、卷管理、存储虚拟化等
(2)理解数据表示与存储器
1计算机系统的程序和数据都是用二进制的形式表示。通常使用一个具有
两种稳定状态,且在一定条件可以相互转换的物理器件表示0和1,这个
器件就是存储元件(可以是半导体器件的一个触发器,磁盘表面上的一个
磁性材料块或光盘表面的一个凹坑)。若干个存储元件组成一个存储单元。
一个存储单元可以存储一串二进制代码,称为一个存储字。这个二进制代码
的位数称为存储字长,通常为8位、16位或32位。一般对存储单元进行
编号,就是地址。
2若干个存储单元组成一个存储器,主要技术指标是存储容量、存储速度和
存储带宽。
存储容量指存放二进制代码的总位数:存储容量=存储单元数*存储字长
也可以用字节数来表示:存储容量=存储单元数*存储字长/8
存储速度由存储时间和存储周期表示。存储时间又称存储器的访问时间,
是指启动一次存储器操作到完成该操作所需要的全部时间(读出
时间和写入时间)。存储周期是指存储器进行连续两次独立的
存储操作所需要的最小时间间隔,通常存储周期大于存储时间。
存储带宽表示单位时间内存储器存取的信息量,单位为字/秒或字节/秒或
位/秒(bit/s),与存储周期密切相关。如存储周期为ns,
每个存储周期可访问16bit,则带宽为1/ns*16bit
=32Mbit/s
(3)熟练掌握存储器的分类
按存储介质分类:半导体、磁表面、光盘
按存储器在计算机中的作用分:主存储器、高速缓冲存储器、辅助存储器
按存取方式分:随机、顺序、直接
按读写功能分:只读、随机(读写)
按数据保持时间分:易失性、非易失性
(4)理解存储系统层次结构
(5)了解企业数据存储
1数据存储解决方案提供商,有EMC、NetApp、HDS、IBM、HP和华为。可为
用户提供存储设备和存储软件,提供完整的存储解决方案。
2企业对不同的数据采取不同的存储方式:在线存储(又称联机存储或工作级
存储,一般用磁盘和磁盘阵列)、离线存储(又称脱机存储或备份级存储,
多采用顺序访问的磁带和磁带库)和近线存储(不同数据使用在线存储和
离线存储方法,使用磁盘、磁带和光盘的混合)
3企业数据划分为四个等级:关键数据、重要数据、敏感数据、不重要数据
(6)理解数据存储的评价指标和非功能性需求
1评价指标:存储容量(存放二进制代码的总位数,通常用K、M、G、T、P
表示,设备类型不同,单位含义不同)
吞吐量(单位时间内在I/O流中传输的数据总量,如MB/S)
每秒I/O数(IOPS,单位时间内系统能处理的I/O请求数量,
随机读写频繁的应用IOPS是关键指标;顺序读写
频繁的应用,吞吐量是关键指标)
响应时间(多方面影响,如存储系统结构,请求的自身特性,
请求数据的物理位置,当前存储系统的繁忙程度等等)
2非功能性需求:可用性和可靠性、可管理性、可共享性、可扩展性、
自适应性
8.2数据存储设备
(1)熟练掌握磁盘的结构和工作原理
1硬盘HDD,除了包括磁性硬盘HDD外,还包括闪存颗粒的固态盘SDD
以及混合盘HHD2磁盘是使用坚硬的旋转盘为载基的非易失性存储设备,在平整的磁性表面
存储和检索数字数据,一般使用铝合金硬质盘面或新型的工程塑料、陶瓷、
玻璃作为基体,使用电镀工艺或溅射工艺在盘面上形成薄膜磁层。磁头
是实现读写的关键元件,通过磁电转换和电磁转换来说实现读写。
3磁盘包括机械部分(盘面、主轴(电机)、磁头(磁头臂)、音圈电机)和
电路部分(主控芯片(控制器)、电机驱动芯片、缓存芯片、数字信号处理
芯片、电源控制芯片、晶振、三极管、场效应管、贴片电阻电容单等等)
4磁盘的逻辑结构
盘面:每个磁盘的盘片有上下两个盘面,都能记录数据,从上到下顺序从0
开始编号,磁盘面和磁头号一一对应
磁道:磁盘在格式化时被划分为许多同心圆,一个圆圈就是一个磁道,编号
从外圈向内开始编号,最外侧编号为0
扇区:每个圆形磁道被划分为多段圆弧,每个圆弧叫做扇区。扇区一般从1
开始编号。扇区是最小的读写单位,最小可存储B的数据。
柱面:所有不同盘面上同一个位置的磁道构成一个圆柱形的轮廓。
因为磁盘外圈大内圈小,导致扇区面积不同,会浪费存储空间。
使用ZBR区位记录技术可使更多扇区放到外部磁道而获取更多存储空间
5低级格式化:将空白的磁盘划分出柱面和磁道及若干扇区,然后在扇区上
再划分出表示部分、间隔区和数据区。以扇区为单位就可以读写数据了。
6寻址:处理器查找数据存放地址的过程。
寻址方式:查找数据存放地址的规则,就是磁盘驱动器的主控芯片查找
扇区的规则。有两种:
早期的CHS编号规则(C为柱面、H为磁头、S代表扇区)
现在的LBA方式(逻辑块寻址,线性寻址方式,主机不再需要
知道磁盘的几何结构,只需知道有多少物理块,磁盘控制器
完成物理块和逻辑块的映射,将LBA地址转换为CHS地址)
7磁盘接口:磁盘与主机系统之间的连接部件,在磁盘缓存和主机内存
之间传输数据。接盘接口性能直接影响程序运行和系统性能。
分为:
IDE(电子集成驱动器,把磁盘控制器与盘体集成起来,发展了很多分支如ATA、UltraATA、DMA、UltraDMA等接口,用于家用产品)
SATA(串行高级技术附件,串行技术的ATA,用于家用产品)
SCSI(小型计算机系统接口,不同于IDE的接口,用于服务器)
SAS(串行连接SCSI,升级的SCSI使用串行技术,用于服务器)
FC(光纤通道,应用于网络系统)
8磁盘分区:把一整块磁盘根据需要,分成不同区域来存放数据,以加快
读写数据的时间和方便管理。磁盘分区时要选一个分区作为
活动分区,用以存放主引导系统。计算机加电后,主板上的
BIOS程序将启动活动分区上的主引导系统来加载操作系统。
分区后,还需对每个分区进行高级格式化(即通常的格式化,
又称逻辑格式化,在磁盘的所有数据区上写零,同时检测
一致性,标记不可读和坏的扇区)
9磁盘分区机制:
MBR:主引导记录,PC架构计算机的传统磁盘分区机制,用于绝大多数
使用BIOS引导的PC设备。存在于驱动器开始部分的一个特殊的
启动扇区,包含了已安装的操作系统的启动加载器和驱动器的
逻辑分区信息。分区分为主分区、扩展分区、逻辑分区三种类型。
主分区:也叫引导分区,可存放引导系统,磁盘必须有一个主分区,
是单独的,创建后可直接使用。活动分区就是处在活动
状态的主分区,一个磁盘可以有多个主分区,但只能有
一个活动分区。
扩展分区:主分区之外的剩余的磁盘空间。创建后的扩展分区不可
直接使用,要在上面再创建逻辑分区才能使用。
逻辑分区:相当于一块存储介质,创建后可使用。
MBR使用有限制,如主分区与扩展分区数据之和不超过4个,逻辑
分区没有限制,最大支持2.2TB的磁盘容量。
GPT:是可扩展固件接口EFI标准的一部分,用来替代BIOS中的MBR。
GPT分区表头中可自定义分区数量的最大值,突破了2.2T的限制,
最大支持18EB的分区,最多支持个磁盘分区。GPT在整个
磁盘上保存了分区和启动信息的多个副本,更为健壮和易恢复,
还提供了CRC校验码确保完整正确。GPT没有主分区、扩展分区和
逻辑分区的概念,所有分区都一样。
(2)熟练掌握固态盘的结构的工作原理
1固态盘SSD,早期固态盘采用高性能的DRAM,但易失性需要后备系统;
现固态盘采用闪存芯片作为存储介质,不加电时存储信息长达10年以上,不需要HDD的电机、盘面、磁头等机械部件。2固态盘的硬件主要是印制电路板PCB、SSD控制器(主控芯片)、缓存芯片、
Flash存储阵列、SSD接口等组成。SSD控制器是控制核心,其中的处理器
完成信号处理功能,缓存管理器负责读写数据的临时保存,多路复用器用于
控制读写操作对应到哪一块闪存芯片;RAM是随机存储器用于保存系统临时
信息如文件块的位置信息等;ROM是只读存储器用于保存闪存芯片的元数据
和控制程序等;闪存芯片封装是存储数据的最终载体,其容量和数量决定了
固态盘的总容量。
3目前市场上有两种非易失性闪存技术:NORFlash和NANDFlash,都是
用浮动门晶体管技术,具体就是浮动门场效应管NORFlash由Intel首先发明,用于擦除和编程操作较少而直接执行代码
尤其是纯代码存储的应用中,如PC机的BIOS固件、移动电话、硬盘驱动器的控制存储器等场合;NANDFlash由东芝公司发明,用于纯数据存储和文件存储,作为Smart-media卡、