位图
Redis除了之前介绍的5中数据类型之外,我们还可以使用另一种数据结构,位图
位图不是一个真实的数据类型,而是定义在字符串类型上的面向位的操作的集合。由于字符串类型是二进制安全的二进制大对象,并且最大长度是 512MB,适合于设置 2^32个不同的位
基本用法:
setbit:设置特定key对应的比特位的值。
getbit:获取特定key对应的比特位的值。
bitcount:统计给定key对应的字符串比特位为1的数量。
使用以上的命令我们不仅能够记录每天人员签到的情况,还可以使用bitcount来统计一定时间范围内某人的签到次数
适用场景:
位图最大的特点就是节省空间,例如我们需求是用户签到功能,bool类型的数据,签到了为1,没签为0,每一个用户365天,如果使用普通的key/value,每个用户要记录365条数据,而上亿用户的时候则需要很大的存储空间,而使用位图,一人365天就是365个位,46字节
HyperLoglog
在之前的统计页面访问的UV数量的案例中,提到可以使用set的方式,但是如果一个页面的统计量很大的时候,set就需要使用很大的空间,这时就可以使用一种新的命令HyperLoglog,它就是用于解决这种统计数据的问题的,但是响应的,它也有自己的缺点,就是统计的数量不是特别精准,可能是真实值的0.81%的误差,但是对于这种UV统计的场景来说,完全可以忽略
- pfadd:作用就是set集合中的sadd方法(HyperLoglog的发明人名叫Philippe Flajolet,所以操作是已pf开头的)
- pfcount:作用就是set集合中的scard的用法
- pfmerge:将多个pf值累加起来形成新的pf值
使用场景:进行访问页面的UV统计,或者多个页面访问量的聚合统计
注意:HyperLoglog需要占用12KB的空间,所以他不太适合单个用户数据的统计
Bloom Filter布隆过滤器
HyperLoglog通过使用pfadd,和pfcount可以进行数据的统计,但是如果要判断HyperLoglog中是否存在某个值得时候,他并没有提供pfcontains方法,如果一个新闻推荐系统,需要给用户推荐新闻时,需要过滤掉用户看过的新闻,如果使用数据库的exit,那么并发量大的时候数据库是扛不住的,如果使用reids的set,当用户数量很大的时候,set集合就会变的很大,这时我们可以使用Bloom Filter,他是专门用于处理这种去重的问题的。
概念
可以把他理解成为一个不怎么精确的set结构,当使用contains操作的时候,可能会出现误判(小小的误判,精确度还可以),当布隆过滤器判断某个值存在的时候,他有可能不存在,当其判断某个值不存在的时候他一定不存在,所以布隆过滤器能精确的判断上面新闻推送的场景
使用方式
- bfadd:添加一个元素
- bfmadd:添加多个元素
- bfexists:判断一个元素是否存在
- bfmexists:判断多个元素是否存在