zookeeper是一个类似hdfs(Hadoop分布式文件系统或HDFS是基于Java的分布式文件系统,允许您在Hadoop集群中的多个节点上存储大量数据。因此,如果您安装Hadoop,您将HDFS作为底层存储系统来存储分布式环境中的数据,如果你有十台机器或十台电脑,每台机器上有1TB的硬盘。现在,HDFS表示,如果您将Hadoop作为平台安装在这十台机器上,您将获得HDFS作为存储服务。Hadoop分布式文件系统以这样的方式分发,即每台机器都有自己的存储空间来存储任何类型的数据。当您从Hadoop集群中的十台机器中的任何一台访问Hadoop分布式文件系统时,您会感觉到您已经登录到一台具有10 TB存储容量的大型机器(总计存储十台以上的机器)。这是什么意思?这意味着您可以存储一个10 TB的大文件,这个文件将分布在十台机器上(每个1 TB)。所以,它不限于每台机器的物理边界)的树形文件结构,zookeeper可以保证数据在集群之间的数据的事务性一致
配置文件
安装好zookeeper后要在conf文件夹中找到“zoo_sample.cfg”文件,你可以复制一份、也可以直接将它改名为zoo.cfg,因为ZooKeeper启动时,会默认加载“conf/zoo.cfg”作为配置文件,
tickTime:这个时间是作为 ZooKeeper服务器之间或客户端与服务器之间维持心跳的时间间隔,也就是每个 tickTime 时间就会发送一个心跳。单位为毫秒。
initLimit:集群中的follower服务器(F)与leader服务器(L)之间 初始连接 时能容忍的最多心跳数(tickTime的数量)。此配置表示,允许?follower?(相对于?leader?而言的“客户端”)连接并同步到??leader?的初始化连接时间,它以?tickTime?的倍数来表示。当超过设置倍数(syncLimit)的?tickTime?时间,则连接失败。总的时间长度就是 5*2000=10 秒。
dataDir:该配置项用于配置zookeeper快照日志和事务日志的存储地址。