mysql驱动
大家都知道,我们如果在java系统中去访问一个mysql数据库,必须得在系统的依赖中加入一个mysql驱动,有了这个mysql驱动才能跟mysql数据库建立连接,然后执行各种各样的sql语句。那么这个mysql驱动到底是个什么东西?我们先来看下面的一段gradle配置,这里的mysql-connector-java就是面向java语言的mysql驱动。
[group: 'mysql', name: 'mysql-connector-java', version: '5.1.46']
如果我们要访问数据库,必须得跟数据库建立一个网络连接,这个连接就是有mysql驱动来建立的,它会在底层跟数据库建立网络连接,有了网络连接,接着才能去发送请求给数据库服务器。当我们跟数据库之间有了网络连接之后,我们的java代码才能基于这个连接去执行各种各样的增删改查sql语句。我们看下图:
所以对于java语言开发的系统,mysql会提供java版本的mysql驱动,对于其它语言也是一样,mysql会提供相应的驱动。
应用系统数据库连接池的作用
现在假设我们用java开发了一个web系统,是部署在tomcat中的,那么tomcat本身肯定是有多个线程来并发的处理同时接收到的多个请求的。这个时候,多个线程都要去抢夺一个连接去访问数据库,那么效率肯定是低下的。我们看下面的图:
那么如果tomcat中的每个线程在每次访问数据库的时候,都基于mysql驱动去创建一个数据库连接,然后执行sql语句,执行完之后再销毁这个数据库连接,这样行不行呢?这样效率会非常低!因为每次建立一个数据库连接都是很耗时的,好不容易建好了连接,执行完了sql语句,就把数据库连接给销毁了,下一次再重新建立数据库连接,那肯定是效率很低下的。
所以,一般我们需要使用一个,也就是说在一个池子里维持多个数据库连接,让多个线程使用里面的不同的数据库连接去执行sql语句,然后执行完sql语句之后,不要销毁这个数据库连接,而是把连接放回池子里,后续还可以继续使用?;谡庋囊桓鍪菘饬映鼗?,就可以解决每个线程都使用一个数据库连接去执行sql语句的问题,而且还避免了数据库连接使用完之后就销毁的问题。
常见的数据库连接池有DBCP、C3P0、Druid等等,大家可以去搜索一下数据库连接池的使用例子和代码,这里就不再拓展。
mysql数据库连接池的作用
现在我们知道,任何一个系统都会有一个数据库连接池去访问数据库。现在我们把目光转移到mysql,假设有很多系统要与mysql数据库建立很多个连接,那么mysql也必然要维护与系统之间的多个连接,所以mysql架构体系中的第一个环节,就是连接池。我们看下图:
实际上mysql中的连接池就是维护了与系统之间的多个数据库连接。除此之外,系统每次跟mysql建立连接的时候,还会根据传递过来的账号和密码进行库表权限的验证
mysql的架构设计
假设我们的数据库服务器的连接池中的某个连接接收到了网络请求,假设就是一条sql语句,那么谁负责从这个连接中去监听网络请求?谁负责从网络连接里把请求数据读取出来?我们都知道网络连接必须得分配给一个线程去处理,由一个线程来监听请求以及读取请求数据,比如从网络连接中读取和解析出来一条我们的系统发送过去的sql语句。
当mysql内部的工作线程从一个网络连接中读取出来一个sql语句之后,mysql内部首先提供了一个组件,就是sql接口(sql interface),它是一套执行sql语句的接口,专门用于执行我们发送给mysql的那些增删改查的sql语句。因此mysql的工作线程接收到sql语句之后,就会转交给sql接口去执行,如下图:
我们来看一个问题,sql接口怎么执行sql语句呢?比如我们来举一个例子,现在我们有这么一个sql语句:
select id, name, age from user where id = 1
我们大家一看就知道这条sql语句是什么意思,但是mysql本身是一个系统,它没法直接理解这些sql语句,因此mysql需要一个查询解析器。其实所谓的sql解析,就是按照既定的sql语法,对我们按照sql语法规则编写的sql语句进行解析,然后理解这个sql语句要干什么事情。
当我们通过解析器理解了sql语句要干什么之后,接着会找查询优化器(optimizer)来选择一个最优的查询路径。它会针对你编写的几十行、几百行的复杂sql语句生成查询路径树,然后从里面选择一条最优的查询路径出来。我们一起来看看下面的图:
真正执行sql语句的时候,要不然是更新数据,要不然是查询数据,那么数据存放在哪里呢?数据库其实也是一个编程语言写出来的系统,启动之后也是一个进程,执行它里面的各种代码。所以对数据库而言,我们的数据要不然是放在内存里,要不然是放在磁盘文件里,没什么特殊的地方。现在假设我们的数据有的存放在内存里,有的存放在磁盘文件里,那么现在有个问题,我们现在怎么知道哪些数据在内存里?哪些数据在磁盘文件里?我们执行sql的时候是更新内存的数据,还是更新磁盘文件的数据?我们如果更新磁盘的数据,是先查询哪个磁盘文件,再更新哪个磁盘文件?是不是感觉一头雾水?所以这个时候就需要存储引擎了,存储引擎其实就是执行sql语句的,它会按照一定的步骤去查询内存缓存数据,更新磁盘数据,查询磁盘数据等等,执行诸如此类的一系列操作,如下图:
在mysql的架构设计中,sql接口、sql解析器、查询优化器其实都是通用的,它就是一套组件而已。但是存储引擎的话,mysql是支持各种各样的存储引擎的,比如我们常见的InnoDB、MyISAM、Memory等等。但是现在mysql一般都是使用InnoDB存储引擎的,关于存储引擎的原理我们后续介绍。
现在有个问题,是谁来调用存储引擎的接口呢?其实我们现在漏了一个执行器的概念,这个执行器会根据优化器的执行方案调用存储引擎的接口,按照一定的顺序和步骤执行sql语句的逻辑。我们来看下示意图:
本文结束。