缓存策略优化

缓存介绍

  • 在高并发多用户的系统中常?;崾褂没捍胬刺嵘列葱阅?/li>
  • 常见的如memcached, redis, 内存缓存等

现象

  • 某产品上线后不久,服务报警,看日志发现有sql的timeout报错,具体表现为:
    • 页面许多逻辑超时、出错
    • db所在机器load较高,dba经查为大量相同的sql在反复执行

定位

  • 取应用服务的jstack

  • 参考我之前的blog,stack dump文件用stackAnalysis工具分析,发现有大量的线程在做同一个事情:

      40 threads at (state = RUNNABLE,
      locks_locked = [0x0000000725b33848, 0x0000000725b338f0, 0x0000000737ff37d0, 0x0000000737f88f08, 0x0000000737f817c8, 0x00000007fc8ba580, 0x0000000725d8e638, 0x0000000725d8e6e0, 0x0000000738274490, 0x0000000725b5f720, 0x0000000725b5f7c8, 0x00000007384c03f8, 0x00000007231683a8, 0x0000000723168450, 0x0000000731980608, 0x0000000725d27ab8, 0x0000000725d2fcd8, 0x00000007384b16c8, 0x0000000723221798, 0x00000007232299c0, 0x000000072efb1228, 0x00000007005b70c0, 0x00000007005aff10, 0x0000000738321660, 0x00000007318cb948, 0x00000007318c4780, 0x0000000737c7de70, 0x0000000725a02d30, 0x0000000725a02dd8, 0x00000007fc8f8b60, 0x00000007232918f8, 0x000000072329db00, 0x000000073186ee08, 0x0000000725b7b928, 0x0000000725b7bb98, 0x0000000738066408, 0x00000007230a6ef8, 0x00000007230a0160, 0x0000000738191a18, 0x0000000737f619e8, 0x0000000737f5a6d8, 0x00000007fc8b9518, 0x0000000725ba54d0, 0x0000000725ba5578, 0x0000000738239a40, 0x0000000725e885c0, 0x0000000725e810e8, 0x00000007b24ac378, 0x00000007230c47e8, 0x00000007230c4890, 0x0000000731907c58, 0x00000007005345a0, 0x000000070052d098, 0x0000000731a6d400, 0x00000007231879f8, 0x0000000723187aa0, 0x000000073846aa20, 0x00000007231e7128, 0x00000007231e71d0, 0x0000000731958f38, 0x00000007231b2500, 0x00000007231b25a8, 0x00000007fc8f8dc0, 0x0000000725e1af28, 0x0000000725e1afd0, 0x0000000738323388, 0x00000007319ad368, 0x00000007319a6588, 0x00000007384894f0, 0x00000007318b8af8, 0x00000007318b1ba8, 0x00000007380c9908, 0x0000000725c5e478, 0x0000000725c5e520, 0x0000000738256338, 0x00000007230c7cd0, 0x00000007230b9440, 0x000000072e8c7810, 0x0000000725dcd8d0, 0x0000000725dc66d8, 0x0000000732c2df18, 0x00000007232425a0, 0x0000000723242648, 0x0000000732c31da0, 0x0000000731a4fd78, 0x0000000731a4fe20, 0x0000000738139a10, 0x0000000725cda198, 0x0000000725cda240, 0x0000000738066638, 0x0000000702b936b8, 0x0000000702b929a0, 0x00000007384893f0, 0x00000007230f9150, 0x00000007230f91f8, 0x0000000738036fc8, 0x000000073198d218, 0x000000073198d2c0, 0x00000007384710c8, 0x00000007231b0bf0, 0x00000007231b0c98, 0x00000007fc8bdea8, 0x00000007318a5808, 0x000000073189e0c8, 0x0000000731870018, 0x0000000723279d10, 0x0000000723279db8, 0x0000000738471170, 0x000000072e8fabd8, 0x000000072e8f8af8, 0x0000000732c51a38, 0x00000007319c69a8, 0x00000007319b9238, 0x0000000737fd5758, 0x0000000725b0c488, 0x0000000725b0c530, 0x00000007381f44a0, 0x0000000731a095b8, 0x0000000731a09660, 0x0000000735cbb2b0]) :
      "http-bio-*-exec-*" daemon prio=* tid=******** nid=******** runnable [********]
         java.lang.Thread.State: RUNNABLE
              at java.net.SocketInputStream.socketRead0(Native Method)
              at java.net.SocketInputStream.read(SocketInputStream.java:129)
              at com.mysql.jdbc.util.ReadAheadInputStream.fill(ReadAheadInputStream.java:114)
              at com.mysql.jdbc.util.ReadAheadInputStream.readFromUnderlyingStreamIfNecessary(ReadAheadInputStream.java:161)
              at com.mysql.jdbc.util.ReadAheadInputStream.read(ReadAheadInputStream.java:189)
              - locked <********> (a com.mysql.jdbc.util.ReadAheadInputStream)
              at com.mysql.jdbc.MysqlIO.readFully(MysqlIO.java:3014)
              at com.mysql.jdbc.MysqlIO.reuseAndReadPacket(MysqlIO.java:3467)
              at com.mysql.jdbc.MysqlIO.reuseAndReadPacket(MysqlIO.java:3456)
              at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:3997)
              at com.mysql.jdbc.MysqlIO.sendCommand(MysqlIO.java:2468)
              at com.mysql.jdbc.MysqlIO.sqlQueryDirect(MysqlIO.java:2629)
              at com.mysql.jdbc.ConnectionImpl.execSQL(ConnectionImpl.java:2719)
              - locked <********> (a com.mysql.jdbc.JDBC4Connection)
              at com.mysql.jdbc.PreparedStatement.executeInternal(PreparedStatement.java:2155)
              - locked <********> (a com.mysql.jdbc.JDBC4Connection)
              at com.mysql.jdbc.PreparedStatement.execute(PreparedStatement.java:1379)
              - locked <********> (a com.mysql.jdbc.JDBC4Connection)
              at com.mchange.v2.c3p0.impl.NewProxyPreparedStatement.execute(NewProxyPreparedStatement.java:67)
              at org.apache.ibatis.executor.statement.PreparedStatementHandler.query(PreparedStatementHandler.java:56)
              at org.apache.ibatis.executor.statement.RoutingStatementHandler.query(RoutingStatementHandler.java:70)
              at org.apache.ibatis.executor.SimpleExecutor.doQuery(SimpleExecutor.java:57)
              at org.apache.ibatis.executor.BaseExecutor.queryFromDatabase(BaseExecutor.java:259)
              at org.apache.ibatis.executor.BaseExecutor.query(BaseExecutor.java:132)
              at org.apache.ibatis.executor.CachingExecutor.query(CachingExecutor.java:105)
              at org.apache.ibatis.executor.CachingExecutor.query(CachingExecutor.java:81)
              at org.apache.ibatis.session.defaults.DefaultSqlSession.selectList(DefaultSqlSession.java:104)
              at org.apache.ibatis.session.defaults.DefaultSqlSession.selectList(DefaultSqlSession.java:98)
              at sun.reflect.GeneratedMethodAccessor30.invoke(Unknown Source)
              at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
              at java.lang.reflect.Method.invoke(Method.java:597)
              at org.mybatis.spring.SqlSessionTemplate$SqlSessionInterceptor.invoke(SqlSessionTemplate.java:358)
              at com.sun.proxy.$Proxy18.selectList(Unknown Source)
              at org.mybatis.spring.SqlSessionTemplate.selectList(SqlSessionTemplate.java:198)
              at org.apache.ibatis.binding.MapperMethod.executeForMany(MapperMethod.java:114)
              at org.apache.ibatis.binding.MapperMethod.execute(MapperMethod.java:58)
              at org.apache.ibatis.binding.MapperProxy.invoke(MapperProxy.java:43)
              at com.sun.proxy.$Proxy46.selectAllValidActivityPush(Unknown Source)
              at com.xxxx.xxxx.module.inbox.InboxAgent.selectActivityPush(InboxAgent.java:612)
              at com.xxxx.xxxx.service.SystemMessageService.getActivityPushMessage(SystemMessageService.java:975)
              at com.xxxx.xxxx.service.login.logic.impl.LogicLoginServiceImpl.updateLoginUser(LogicLoginServiceImpl.java:438)
              at com.xxxx.xxxx.service.login.logic.impl.LogicLoginServiceImpl.updateLoginUser(LogicLoginServiceImpl.java:374)
              at com.xxxx.xxxx.web.controller.login.LoginController.login(LoginController.java:119)
    
  • 可以看到有40个线程在等待db的数据返回,结合堆栈,基本可以定位到有问题的代码逻辑了

分析

  • 仔细分析对应代码逻辑,可发现有如下的缓存策略:

      Object getObject() {
          o = getFromCache()
          if(o == null){
              o = getFromDb()
              if(o != null) {
                  setToCache(o)
              }
          }
          return o;
      }
    
  • 从上面看貌似没有问题,但仔细分析会发现当getFromDb()返回null即数据库中并不存在相关数据时,每一个线程都会去执行getFromDb()这个方法,每个请求都会穿透到db上

  • 当用户请求较大时,对数据库的压力会非常大【上面的stack仅为多台应用web中的一台】

解决思路

  • 当数据库中无数据时,可以在缓存中放一个无效的对象表明“数据为空,不需要到db中查询了”,如下:
    Object getObject() {
        o = getFromCache(key)
        if(o == null){
            o = getFromDb()
            if(o != null) {
                setToCache(key, o)
            }
            else {
                setToCache(key, invalidObject)
            }
        }
        return o == invalidObject ? null : o;
    }
  • 更进一步,上面的getFromDb()逻辑仍有可能会被多个线程同时操作,可以视业务场景而加上分布式锁的逻辑:

      Object getObject() {
          o = getFromCache(key)
          if(o == null){
              try {
                  if(cache.lock(key)) {
                      o = getFromDb()
                      if(o != null) {
                          setToCache(key, o)
                      }
                      else {
                          setToCache(key, invalidObject)
                      }
                  }
              } finally {
                  cache.unlock(key);
              }
          }
          return o == invalidObject ? null : o;
      }
    

思考及建议

  • 多线程思维:每一行代码都要考虑其会被多个线程高并发的执行
  • 抠门思维:每一行代码,尤其每一个网络操作(cache或db),都要考虑是否可以节省下来,或者将多个操作合并为一个操作
  • 批量思维:多个动作是否可以一次完成。举个例子:去菜市场买菜大家都会一次把五种菜全买回,而不是买一次菜去菜市场一次。coding为什么不也这样呢?
  • 每个逻辑都要谨慎思考,任何疏忽都可能会把线上搞死,服务宕机,造成严重后果
最后编辑于
?著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,029评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,238评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事?!?“怎么了?”我有些...
    开封第一讲书人阅读 159,576评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,214评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,324评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,392评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,416评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,196评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,631评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,919评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,090评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,767评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,410评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,090评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,328评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,952评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,979评论 2 351

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,644评论 18 139
  • 1、运行环境 主机IP 主机名 2、配置主机名(分别在五台机器上执行) hostname +主机名例如: h...
    献给记性不好的自己阅读 3,546评论 0 6
  • 背景 某应用1.0性能测试 服务强依赖于mysql, 许多接口都会请求mysql 对mysql的请求用Generi...
    AGIHunt阅读 19,983评论 1 3
  • 路过那里,可是我不喜欢! 尽管那里,篱院一角会爬满木香,春天会散发浓郁的芬芳!只三两米的距离,木香缠缠绕绕,挨挨挤...
    心若芷兰阅读 377评论 12 18
  • 在夜色下,有两条路,相互平行但很大差别。一条有圣洁柔和的光,光明梦幻,一条漆黑恐怖,阴森森的,只有路灯散...
    汐影小y阅读 158评论 0 2