现在越来越多的开发者在说,关系型数据库正在慢慢被非关系型数据库取代,因为关系型数据库无法满足现代公司的需求:
大部分观点认为,关系型数据库无法扩展,不够敏捷;
对关系型数据库的一些批评有一定的道理,但是这些批评都是有特定的场景和上下文的,一个经历了各种软件的淬炼和打磨的技术,怎么可能被市场上的新进入者轻易超越和替换呢。
正如Rich Hickey 曾经说的过的话:
Programmers know the benefits of everything and the tradeoffs of nothing.
程序员只知道哪些东西的好处,却对权衡的不利的事情一无所知;
我们看到一些NoSQL数据库提供了惊人的性能测试结果,都在说这些NoSQL比关系型数据库更快、更好、更易扩展;但没人关注为什么NoSQL能达到这么优异的性能;
我们不应该问他们怎么做到的比关系型数据库更好,而应该问,NoSQL放弃了什么让非关系型数据库有如此的性能飞跃。
关系型数据库不是恐龙,不是笨拙的史前遗迹,注定要因不断变化的世界而灭绝。 他们是鲨鱼,是经过几百万年进化磨练成的顶级掠食者,一种能很好适应环境的完美生物,在今天和一万年前一样的高效。他们依然生存着是有原因的,他们依然在自己领域内拥有无可置疑的至高无上的地位。
关系型数据库的特点:
大多数关系型数据库有四个主要的特点,即ACID(Atomicity、Consistency、Isolation、Durability)特性:
原子性
保证事务中的任何系列操作都被视为一个操作单元,整个事务要么成功要么失败,不存在其他的中间异常状态。
一致性
无论是并发访问还是其他任何操作,得到的数据状态是一致的
隔离
主要是事务的隔离,一个事务看不到被其他事务修改的数据,
持久
保证一旦事务被提交,则将提交的状态持久化保存,无论系统是否出现崩?;虻缭垂收稀?/p>
最后,除了ACID这些关系型数据库核心的保证,围绕数据完整性,还有更多的一些特性集,例如外键、唯一约束、非空约束、检查约束等工具;将这些特性和事务相结合,可以对数据库里的数据执行可定制的逻辑处理。
所有的这些特性,都使得编写一个可靠的保持数据一致的系统变得异常简单;当然,对于如何正确的应用这些特性仍然存在很多挑战;如果我们能正确的使用这些工具,达到数据一致和数据隔离的效果将会简单易行。
NoSQL的取舍
NoSQL数据库(非关系型数据库)为了获得客观的性能,非关系型数据库通常也会围绕关系型数据库的这些特征进行权衡取舍;
为了便于传播,非关系型数据库也创造了一个缩略词,BASE(Basically Avaliable 、Soft State 、 Eventual Consistency):
基本可用
系统可以在牺牲一致性的情况下,保证系统的可用性,类似于经典的CAP理论;
弱事务
数据库不强制数据一致,由于是最终一致性,部分节点的值在没有交互的情况下,也可能会发生变化
最终一致性
当数据写入成功后,不保证数据库内所有的消费者读到数据都是立即一致的。由于数据需要在所有节点间进行复制,在这个复制期间发生的任何读取都有可能数据不一致。
NoSQL的优势
NoSQL数据库提供与大多数关系型数据库不同的特点,看下非关系型数据库宣扬的优势,以及为了达到这个优势做了哪些牺牲:
高写入性能
许多NoSQL数据库都有着令人难以置信的写入性能。关系型数据库也一直在优化写入速度,但是受限于持久性和一致性的硬性要求;放弃了持久化的要求,和事务的处理,非关系型数据库实现了巨大的性能飞跃。
高读取速度
很多NoSQL数据库同样拥有令人惊叹的读取性能。通常的做法是,数据库集群内,多个节点均可以进行读写,放弃了读写的一致性,使用最终一致性来满足数据的一致性要求。有些NoSQL数据库甚至放弃了多表关联查询,分组连接等复杂的查询语句,只支持简单的key 或key range 的查询,这当然也能大幅的提升查询的效率。
简单的水平分片
数据库分库分表一直是关系型数据库的一个痛点。NoSQL通过放弃一致性的检查,或是有选择的一致性检查(部分NoSQL数据库具有可调的一致性级别)来实现同时读取大量的不同节点上的分片数据,读写性能都有不错的提升。
简单的表结构更新
NoSQL数据库通过简单的表结构设计,使得数据库的更新操作变得更加容易高效;放弃了对表结构的严格限制,NoSQL能更方便快捷的更新我们的表信息,字段信息,这种简单甚至简陋的表结构,让我们的更新操作更简单。
更可靠、更可预测的性能
关系型数据库,可能会因为SQL语句的差异导致查询效率差一个数量级,很多SQL语句有缺陷的执行语句,更是让关系型数据库的性能惨不忍睹。许多NoSQL数据库极大的简化了数据访问,一致性hash等的引入也大大的让我们的读写性能可预见的随着节点的扩容而相应的性能和存储规模的提升。
关注缺点不止看收益
我们在做数据库选型时,还是要更多的关注数据本身的特点,是否存在复杂的符合查询和对一致性的强烈要求,上面我们也看到了NoSQL的优秀性能是对关系型数据库的部分特性的牺牲实现的,这些特性在一些场景下是你用NoSQL数据库无法解决的。
原文地址:
https://www.simplethread.com/relational-databases-arent-dinosaurs-theyre-sharks/