2015 年,因为工作岗位的变动,开始负责给集团招聘一些技术人员,出于对公司的负责,也为了更好的胜任技术经理的职位,在面试的这件事上,我做了大量的“功课”,首先我研究了几乎所...
构建倒排索引的几个主要步骤: 1 收集待建索引的文档2 对这些文档中的文本进行词条化3 对步骤2中的词条进行语言学预处理,得到此项4 根据词项对所有文档建立索引 重要概念 词...
??Google File System(简称GFS)是适用于大规模且可扩展的分布式文件系统,可以部署在廉价的商务服务器上,在保证系统可靠性和可用 性的同时,大大降低了系统的...
??存储和访问数百PB的数据是一个非常大的挑战,开源的RocksDB就是FaceBook开放的一种嵌入式、持久化存储、KV型且非常适用于fast storage的存储引擎。?...
Introduction ??很长一段时间,持久化数据存储都是使用磁盘。随着SSD的引入,我们现在有了新的持久化的存储介质,这种存储介质比传统的磁盘更快,也给人们提供了探索分...
??Simulation Cache(SimCache)可以帮助用户在模拟的内存容量而不是物理上实际占用内存下预测block cache的性能数据,比如:hit、miss。 ...
RocksDB Iterator ??RocksDB Iterator提供用户以有序的方式前向或者后向遍历DB,也可以seek 到DB的特定key上。为了做到这样,Itera...
??本文主要讲解了RocksDB中二阶段提交的实现。本文总结一下共有如下几个要点: Modification of the WAL format Extension of t...
Overview ??Repairer会在RocksDB出现宕机等严重问题时尽最大努力去恢复尽可能多的数据,但是,并不能保证恢复数据库到一个一致性的状态。 Usage ??C...