集群存储简介
在集群里,一组独立的节点或主机可以像一个系统一样步调一致地工作。它们不仅可以共享公用的存储阵列或者SAN(存储区域网文件系统),也可以拥有只有一个命名空间的公用文件系统。
集群存储是将多台存储设备中的存储空间聚合成一个能够给应用服务器提供统一访问接口和管理界面的存储池,应用可以通过该访问接口透明地访问和利用所有存储设备上的磁盘,可以充分发挥存储设备的性能和磁盘利用率。数据将会按照一定的规则从多台存储设备上存储和读取,以获得更高的并发访问性能。
块存储;分布式存储;网络存储;文件存储;块设备;云存储;存储桶;对象存储;DAS;SAN
直接附加存储与服务器主机之间的连接通道通常采用SCSI连接,随着服务器CPU的处理能力越来越强,存储硬盘空间越来越大,阵列的硬盘数量越来越多,SCSI通道将会成为IO瓶颈;服务器主机SCSI ID资源有限,能够建立的SCSI通道连接有限。
直接附加存储依赖服务器主机操作系统进行数据的IO读写和存储维护管理, 数据备份和恢复要求占用服务器主机资源(包括CPU、系统IO等),数据流需要回流主机再到服务器连接着的 磁带机(库),数据备份通常占用服务器主机资源20-30%,因此许多企业用户的日常数据备份常常在深夜或业务系统不繁忙时进行,以免影响正常业务系统的运行。直接附加存储的数据量越大,备份和恢复的时间就越长,对服务器硬件的依赖性和影响就越大。
直接附加存储是指将存储设备通过SCSI接口直接连接到一台服务器上使用。DAS购置成本低,配置简单,使用过程和使用本机硬盘并无太大差别,对于服务器的要求仅仅是一个外接的SCSI口,因此对于小型企业很有吸引力。
直接附加存储是之后的存储技术的基石。
网络拓扑

说明: 直接附加存储,等同于存储设备通过数据线、光缆、SATA 直连主机
优点:
缺点:
network attached storage网络附加存储(NAS)是连接到计算机网络的文件级计算机数据存储服务器,其提供对异构客户端组的数据访问。NAS专门用于通过硬件,软件或配置提供文件。NAS系统是联网设备,包含一个或多个存储驱动器,通常安排在逻辑冗余存储容器或RAID中。网络附加存储消除了从网络上的其他服务器提供文件服务的责任。它们通常使用网络文件共享协议(如NFS,SMB或AFP)提供对文件的访问。
NAS网络存储知识:NAS实际是一种带有瘦服务器的存储设备。这个瘦服务器实际是一台网络文件服务器。NAS设备直接连接到TCP/IP网络上,网络服务器通过TCP/IP网络存取管理数据。NAS作为一种瘦服务器系统,易于安装和部署,管理使用也很方便。同时由于可以允许客户机不通过服务器直接在NAS中存取数据,因此对服务器来说可以减少系统开销。NAS为异构平台使用统一存储系统提供了解决方案。由于NAS只需要在一个基本的磁盘阵列柜外增加一套瘦服务器系统,对硬件要求很低,软件成本也不高,甚至可以使用免费的LINUX解决方案,成本只比直接附加存储略高。
网络拓扑

说明: 网络附加存储,通过网络在存储主机与使用主机之间传输数据
优点
缺点:
存储区域网络(Storage Area Network SAN),即通过特定的互连方式连接的若干台存储服务器组成一个单独的数据网络,提供企业级的数据存储服务。 SAN 是一种特殊的高速网络,连接网络服务器和诸如大磁盘阵列或备份磁带库的存储设备,SAN 置于 LAN 之下,而不涉及 LAN。利用 SAN,不仅可以提供大容量的存储数据,而且地域上可以分散,并缓解了大量数据传输对于局域网的影响。SAN 的结构允许任何服务器连接到任何存储阵列,不管数据置放在哪里,服务器都可直接存取所需的数据。
SAN网络存储知识:SAN实际是一种专门为存储建立的独立于TCP/IP网络之外的专用网络。目前一般的SAN提供2Gb/S到4Gb/S的传输数率,同时SAN网络独立于数据网络存在,因此存取速度很快,另外SAN一般采用高端的RAID阵列,使SAN的性能在几种专业存储方案中傲视群雄。SAN由于其基础是一个专用网络,因此扩展性很强,不管是在一个SAN系统中增加一定的存储空间还是增加几台使用存储空间的服务器都非常方便。通过SAN接口的磁带机,SAN系统可以方 便高效的实现数据的集中备份。SAN作为一种新兴的存储方式,是未来存储技术的发展方向。
网络拓扑

iSCSI 客户机会发现标配两块网卡,主要是为了便于后期的利用,例如:聚合。
网络拓扑上的网络就分为了两个部分,一个是业务网络,一个是存储区域网络。
说明: 存储区域网络,将生产网络与存储网络进行隔离,有效增加各部效率,减轻网络设备压力,适合大并发业务。
优点
缺点


块存储;分布式存储;存储桶;对象存储;文件存储;云存储;块设备;网络存储。
常见设备

优点
缺点:
常见设备

Samba 是Linux 和 Windows共享,是跨平台的,但是属于是局域网技术。
FTP 是Linux 和 Windows共享,是跨平台的,可以应用于局域网和公网。
NFS 是只能用于 Linux 和 Unix 共享,可以应用于局域网和公网。
优点
缺点:
文件存储数据会被分为两部分:超级块,数据块。
超级块:存储的都是文件名,文件大小,属主属组,以及时间(访问时间,修改时间,改变时间)
数据块:存储的是文件的真实内容
常见设备

优点
缺点
对象存储则可以将数据的元数据信息单独存放到一台机器,然后将文件的真实数据内容存放到不同的机器。
访问对象存储的过程简述:
文件存储、网络存储 FTP、SAMBA、Apache、Nginx
对象存储、分布式存储、云存储 CEPH、MooseFS、RHCS、ClusterFS
块存储 ISCSI
结构描述: 块存储直连主机设备是最常见的存储方式,也是后边所有存储方式的基石。是标配,也是一般电脑和服务器使用最常见的方式。
结构拓扑

结构描述: 将块设备通过局域网络共享至其它使用主机节点,提升空间利用率,便于后期扩展。
结构拓扑


传统方式:应用程序 → SCSI或者光纤驱动 → 主机控制器 → 光纤或者SCSI母线 → Storage存储设备。(传输的长度有限)
网络存储方式:应用程序 → SCSI驱动 → iSCSI驱动(互联网) → TCP协议 → 网卡驱动 → 网卡适配器 → IP网络 → Storage存储设备。
结构描述: 将块设备通过局域网络共享至其它使用主机节点,提升空间利用率。并且将用户访问网络 与存储网络相隔离,利用提升存储效率以后后期维护扩展
结构拓扑


NFS:Network File System
结构描述: 利用共享服务将文件通过网络传输至使用设备,便于文件在多台机器之间的共享操作
结构拓扑

用的技术越简单,出现问题的几率就越小,出了问题的解决方法也比较简单。
MFS:MooseFS 驯鹿,RHCS:红帽集群套件,Ceph,GlusterFS。
结构描述: 利用分布式文件存储结构提升文件读写并发效率,并且将用户访问网络与存储网络相隔离, 利用提升存储效率以后后期维护扩展
结构拓扑

企业中是需要确定存储技术的选型和存储网络的选型,两者相结合。