分布式-技术专区-缓存系统问题分析


  分布式缓存对应于CPU的模型有如下的关系,我们知道,CPU跟内存的关系中间还有三级高速缓存L1,L2,L3.L1最靠近CPU内核,CPU在进行数据处理的时候一般是先把内存的数据复制到L1中进行处理,把处理结果恢复到内存中,所以多CPU多线程中会有数据复制不一致的问题.

  分布式缓存系统中,有着与之对应的关系(寄存器-本地内存,L1缓存-本地内存,L2缓存-本地内存,L3缓存-Redis分布式缓存,内存-数据库Mysql等).

  建立分布式缓存的3种方法:

  1、双读双写,一般写数据库,读缓存,缓存未命中,则读取数据库,再写入缓存。

  2、异步更新,只读写缓存,由异步的更新服务将数据库里的变更或者新增的数据更新到缓存中。

  3、串联模式,直接在缓存上进行读写操作,缓存作为代理,根据需要和配置与数据库进行读写操作。

缓存穿透:

  缓存穿透是指使用不存在的key进行大量的高并发查询,导致缓存无法命中,直接穿透到后端的数据库系统进行查询,使数据库压力过大,甚至压死数据库.解决办法:存储空值,过滤规则,不符合规则的访问,直接拒绝.

缓存击穿:

  缓存并发,当一个key过期时,访问这个key的请求量过大,穿透到数据库.解决办法:1,分布式锁,保证每个key同时只有一个线程去查询数据库,其他线程没有获得分布式锁的权限,只需要等待.对分布式锁的考验很大.2,本地锁,类比分布式锁,但可能会有不同节点的线程查询数据库.3,软过期,业务层处理.

缓存雪崩:

  缓存雪崩,缓存服务器重启或者大量缓存集中在某一个时间段内失效,给数据库造成瞬时压力.解决办法,对不同的数据使用不同的失效时间,对相同的数据,不同的请求使用不同的失效时间,过期时间采用固定时间+随机时间,有一个范围,就可以避免缓存雪崩.

缓存一致性:

  当数据时效性要求很高时,需要保证缓存中的数据与数据库中的保持一致,而且需要保证缓存节点和副本中的数据也保持一致,不能出现差异现象。这就比较依赖缓存的过期和更新策略。一般会在数据发生更改的时,主动更新缓存中的数据或者移除对应的缓存。

缓存颠簸问题:

  缓存的颠簸问题,有些地方可能被成为“缓存抖动”,可以看做是一种比“雪崩”更轻微的故障,但是也会在一段时间内对系统造成冲击和性能影响。一般是由于缓存节点故障导致。业内推荐的做法是通过一致性Hash算法来解决。

缓存无底洞问题:

  该问题由 facebook 的工作人员提出的, facebook 在 2010 年左右,memcached 节点就已经达3000 个,缓存数千 G 内容。他们发现了一个问题---memcached 连接频率,效率下降了,于是加 memcached 节点,添加了后,发现因为连接频率导致的问题,仍然存在,并没有好转,称之为”无底洞现象”。

相关