表格存储(Tablestore)是阿里云自研的面向海量结构化数据存储的Serverless NoSQL多模型数据库,被广泛用于社交、物联网、人工智能、元数据和大数据等业务场景。提供兼容HBase的WideColumn模型、消息模型Timeline以及时空模型Timestream,可提供PB级存储、千万TPS以及毫秒级延迟的服务能力。
为什么选择表格存储
- 全托管
表格存储是一种全托管的结构化数据存储。使用表格存储您只需专注于业务研发,无需担心软硬件预置、配置、故障、集群扩展、安全等问题,在保证高服务可用性的同时,极大地减少了管理及运维成本。
- 模型丰富
表格存储支持多种数据模型,包括Wide column、Timeline、Timestream、Grid。
- Wide column模型:一款经典模型,目前绝大部分半结构化、结构化数据都存储在Wide column模型系统中。
- Timeline模型:表格存储自研模型,主要用于消息数据,适用于IM、Feed和物联网设备消息下推等消息系统中消息的存储和同步,目前已被广泛使用。
- Timestream模型:适用于时序数据、时空数据等核心数据场景。
- Grid模型:适用于科学大数据的存储和查询场景。
- 无缝扩展
表格存储通过数据分片和负载均衡技术,实现了存储无缝扩展。随着表数据量的不断增大,表格存储会进行数据分区的调整从而为该表配置更多的存储。表格存储可支持不少于10 PB数据存储量,单表可支持不少于1 PB数据存储量或1万亿条记录。
- 查询能力强
除了支持主键查询,表格存储还支持全局二级索引、多元索引。
- 全局二级索引:相当于给数据表提供了另外一种排序方式,即对查询条件预先设计了一种数据分布,可加快数据查询的效率。
- 多元索引:基于倒排索引和列式存储,支持多字段自由组合查询、模糊查询、地理位置查询、全文检索等,可解决大数据的复杂查询难题。
- 高可靠
表格存储将数据的多个备份存储在不同机架的不同机器上,并会在备份失效时进行快速恢复,提供99.99999999%(10个9)的可靠性。
- 数据强一致
表格存储保证数据写入强一致,并保证数据3副本均写入磁盘,且所有数据保持一致。写操作一旦返回成功,应用程序就能立即读到最新的数据。
- 高并发读写
表格存储支持千万级并发读写能力。
使用场景
- 元数据
用户存储海量的文档、媒体文件等数据的同时,对文件元数据的存储和分析不可或缺。此外,电商的订单、银行流水、运营商话费账单也需要存储及分析大量的元数据。表格存储单表支持PB级存储、千万QPS,以及多种索引方式(全局二级索引、全文索引、倒排索引以及时空索引),满足不同场景在线的不同的查询需求,可以帮助您轻松实现高效的元数据管理。
- 消息数据
表格存储自研的Timeline模型主要用于消息数据,能够抽象出支撑海量Topic的轻量级消息队列,可以存储大量社交信息,包括IM聊天,以及评论、跟帖和点赞等Feed流信息,接口简单易用。目前表格存储Timeline模型已被应用在众多IM系统中,例如支撑钉钉海量消息同步等。 此外,表格存储采用按量付费,能够以较低的成本满足访问波动明显、高并发、低延时的需求。
- 轨迹溯源
表格存储提供了面向轨迹类场景的Timestream模型,可提供PB级存储、千万TPS以及毫秒级延迟的服务能力、以及多种索引方式(全局二级索引、全文索引、倒排索引以及时空索引)。使用表格存储Timestream模型,您可以轻松管理、分析跑步、骑行、健走、外卖等轨迹数据。
- 科学大数据
多维网格数据是一种科学大数据,在地球科学领域(气象、海洋、地质、地形等)应用非常广泛,且数据规模也越来越大。相关的科学工作者有快速浏览数据的需求以及在线查询的需求,查询种类丰富、延迟要求高。表格存储是一款阿里云自研的分布式NoSQL服务,可以提供超大规模的存储容量,支撑超大规模的并发访问和低延迟的性能,可以轻松解决科学大数据的海量存储规模和查询性能问题。
- 互联网大数据
热点新闻及娱乐八卦可以在短短数分钟内,有数万计转发,数百万的阅读,如何能够实时的把握民情并作出对应的处理对很多企业来说都是至关重要的。此外,商品在各类电商平台的订单量,用户的购买评论也都对后续的消费者产生很大的影响。商家的产品设计者需要汇总统计和分析各类平台的数据做为依据,决定后续的产品发展,公司的公关和市场部门也需要根据舆情作出相应的及时处理。表格存储单表提供PB级存储、千万QPS,以及多种索引方式,可以帮助您轻松实现百亿级互联网舆情存储及分析。
- 物联网
表格存储单表提供PB级数据存储规模,无需分库分表,同时支持千万QPS,可以轻松满足IoT设备、监控系统等时序数据的存储需求,大数据分析SQL直读以及高效的增量流式读接口让数据轻松完成离线分析与实时流计算。