从“去IOE”的替代到开源创新,国产数据库的 2021 年

作者 | 马超 责编 | 屠敏
出品 | CSDN(ID:CSDNnews)
回看过去一年 , 国产数据库在不断刷新着国内外各大榜单之际 , 也在各自细分场景也都取得不俗进展 。 可以说2021年是国产数据库由跟随主流到转向引领时代的重要一年 , 也是国产数据库从默默耕耘开始结出丰硕的果实的一年 。
2021年 , 分布式数据库占领行业统治地位 , 整个行业逐渐从之前的单点到目前的分布式 , 并最终向云原生演进的趋势发展 , 而分歧在出现在技术路线选择上 , Share Everything还是Share Nothing是个问题 , 这一点也将在下文详细探讨 。
2021年 , 随着AI和物联网的快速发展 , 图数据库、隐私计算平台和时序数据库开始冲出传统SQL与NoSQL形成的包围圈 , 在各自应用领域大放异彩 。 图数据库在回答「给我朋友圈点赞的人还给哪条动态点赞最多」等多跳关联问题时 , 效率比传统数据库高得多;隐私计算已成为大数据交易所等新兴场景应用的关键技术支柱 , 凭借充分挖掘数据价值 , 使数据可用不可见等特性 , 隐私计算平台可以完成传统数据库难以实现的任务;时序数据库则多用于物联网领域 , 对于结构化的时序数据如电表、传感器等设备向云端回传等物联网类型数据的处理效率比传统数据库高得多 。
2022年 , 随着 数字化转型 的不断深入 , 像大数据交易、数字货币这样的新兴场应用还将不断涌现 , 在新生需求的催动下 , 数据库既要处理联机交易 , 又要对客户进行实时画像 , 甚至还要对于客户行为进行准实时分析 , 这就给各种细分类型的数据库都提供了上场的机会 , 只要针对用户痛点对症下药 , 国产数据库就能打破传统巨头的封锁 , 迎来自己的春天 。
从“去IOE”的替代到开源创新,国产数据库的 2021 年
文章图片

百家争鸣 , 国产数据库终迎爆发?
回顾数据库的发展 , 十几年前的数据库领域远没有现在这么纷繁复杂 , 当时关系型数据库几乎是这项领域的代名词 。
关系型数据库始于上世纪60年代 , 当时CPU刚刚进入集成电路时代 , 计算机算力、内存都较之前的晶体管时代有了大幅提升 , 不少企业也开始使用计算机进行数据管理 。 不过当时的计算机系统缺乏有效范式来描述复杂的数据关系 , 因此当时库管系统还一直处于非常简陋的雏形状态 。
直到1970年 , 关系数据库之父、IBM研究员E.F.Codd在《Communications of ACM》杂志上发表了一篇名为“A Relational Modelof Data for Large Shared Data Banks”的论文 , 这也成为了数据库历史上的奠基之作 。 后来ACM在1983 年把这篇论文列为创刊25年中最具里程碑意义的25篇论文之一 , 同时也开启了关系型数据库快速发展的时代大幕 。 从1960年到2006年近半个世纪的时间里 , 关系型数据库几乎成了数据库的唯一代名词 。
不过随着互联网的大规模推广 , 关系型数据库技术难以处理海量的大规模数据 。 其后 , 谷歌对大数据技术起到奠基性作用的三篇论文横空出世 , 数据库技术开始进入裂变发展时间 。

  • 没有统一的模型能应对所有数据处理场景 , 比如关系型数据库中的B+树模型 , 在写入方面所需要消耗的时间较长 , 因此在物联网这种需要极高写入性能的场景就不适用;
  • 时序数据库用的LSM树 , 又没有很好的查询性能 , 无法在日常交易场景中使用;
  • 解决多跳查询时 , 如针对“使用小米12芯片的手机还有哪些”问题 , 就需要先查询小米12使用的芯片类型 , 再查询使用该芯片的其它手机类型 , 这种场景下B+和LSM树都不合适 , 而使用图数据库使 用的图原生存储模型往往可以将这种查询的效率提升成百上千倍 。

    特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。