Giter Club home page Giter Club logo

storage-basics's Introduction

storage-basics

terms:

  • DUDL: Data unavailable, data loss

Disk tech

PATA vs SATA

NVMe

Flash Memory

SSD

SCM

NVRAM

NVM

Persistent Memory

SSD Key VALUE store

Flash Memory

3D XPoint

Standard

  • SNIA
  • JEDEC

可计算存储

概念区分

作者:褚道长
链接:https://www.zhihu.com/question/48972075/answer/521468195
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

1. 物理接口M.2 , U.2 , AIC, NGFF 这些属于物理接口。像 M.2 可以是 SATA SSD 也可以是 NVMe(PCIe) SSD。金手指上有一个 SATA/PCIe 的选择信号,来区分两者。很多笔记本的M.2 接口也是同时支持两种类型的盘的。 M.2 , 主要用在 笔记本上,优点是体积小,缺点是散热不好。U.2,主要用在 数据中心或者一些企业级用户,对热插拔需求高的地方。优点热插拔,散热也不错。一般主要是pcie ssd(也有sas ssd),受限于接口,最多只能是 pcie 4laneAIC,企业,行业用户用的比较多。通常会支持pcie 4lane/8lane,带宽上限更高

2. 高速信号协议 SAS,SATA,PCIe 这三个是同一个层面上的,模拟串行高速接口。SAS 对扩容比较友好,也支持双控双活。接上SAS RAID 卡,一般在阵列上用的比较多。SATA 对热插拔很友好,早先台式机装机市场的 SSD基本上都是SATA的,现在的 机械硬盘也是SATA接口居多。但速率上最高只能到 6Gb/s,上限 550MB/s左右,现在已经慢慢被pcie取代。PCIe 支持速率更高,也离CPU最近。很多设备 如 网卡,显卡 也都走pcie接口,当然也有SSD。现在比较主流的是PCIe 3.0,8Gb/s 看起来好像也没比 SATA 高多少,但是 PCIe 支持多个LANE,每个LANE都是 8Gb/s,这样性能就倍数增加了。目前,SSD主流的是 PCIe 3.0x4 lane,性能可以做到 3500MB/s 左右。

3. 传输层协议SCSI,ATA,NVMe 都属于这一层。主要是定义命令集,数字逻辑层。SCSI 命令集 历史悠久,应用也很广泛。U盘,SAS 盘,还有手机上 UFS 之类很多设备都走的这个命令集。ATA 则只是跑在SATA 协议上NVMe 协议是有特意为 NAND 进行优化。相比于上面两者,效率更高。主要是跑在 PCIe 上的。当然,也有NVMe-MI,NVMe-of之类的。是个很好的传输层协议。

4. 总结M.2,U.2,AIC 是物理规格,像是 公路,铁路。PCIe,SATA,SAS 是 模拟高速接口,像是 县道,省道,高速这样。速率上限不同SCSI,ATA,NVMe 是传输层协议,命令集。就是跑在路上面的小车,只是有 跑车 和 面包车 之分。所以,如果要买SSD的话,不是只看 M.2就完事了 ,得分清了 是 SATA 的,还是 NVMe 的,看看主板支持的到底是哪种。否则,买回来的东西可能会用不了!原创手打,能力有限,欢迎大家指错。

半导体

压缩与硬件

RAID技术

  • 基本概念和手段:数据冗余(镜像,校验码),并发读写(条带化-stripe).
  • RAID 0 使用条带化, RAID 1使用镜像,RAID 5使用条带化和校验码,RAID 10是 RAID 1 + RAID 0, 镜像上的条带化。
  • https://www.thegeekstuff.com/2010/08/raid-levels-tutorial

开源存储技术

数据保护

  • 复制(replicate)
  • RAID
  • Erasure Coding.

数据保护参考

发展趋势的一些判断

  • 单个磁盘的容量越来越大,但是读写速度没有跟上磁盘容量的上涨,而RAID提出是针对当时的磁盘大小和读写速度的,所以,RAID技术在大磁盘时代,不一定完全适用,会出现一些瓶颈。所以有些新技术来解决这些问题。需要更多的数据支持,权威资料支持。

文件系统

分布式存储

一个大致的分类,不一定完全准确。

分布式文件系统

  • GFS, HDFS
  • GlusterFS, GPFS
  • Islion OneFS
  • 图片存储专用系统:Taobao File System, Facebook Haystack.

分布式对象存储

分布式块存储

  • Ceph, ScaleIO, vSAN

分布式键值存储

分布式数据库

  • MySQL Sharding
  • Microsoft SQL Azure
  • Google Spanner
  • Greenplum
  • Cassandra (P2P)

分布式文档数据库

  • CouchDB
  • MongoDB
  • Amazon DynamoDB. 既支持文档,又支持键值。

分布式表格系统 ?

  • Google Big Table, Google Megastore
  • Windows Azure Storage

专用分布式存储系统

  • 搜索:Elastic Search
  • 图(Graph): Neo4j

storage-basics's People

Contributors

jicahoo avatar

Stargazers

 avatar

Watchers

 avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.