Redis 服务器与客户端
服务器与客户端
前面的章节介绍了所有 Redis 的重要功能组件:数据结构、数据类型、事务、Lua 环境、事件处理、数据库、持久化,等等,但是我们还没有对 Redis 服务器本身做任何介绍。
不过,服务器本身并没有多少需要介绍的新东西,因为服务器除了维持服务器状态之外,最重要的就是将前面介绍过的各个功能模块组合起来,而这些功能模块在前面的章节里已经介绍过了,所以本章将焦点放在服务器的初始化过程,以及服务器对命令的处理过程上。
本章首先介绍服务器的初始化操作,观察一个 Redis 服务器从启动到可以接受客户端连接,需要经过什么步骤。
然后介绍客户端是如何连接到服务器的,而服务器又是如何维持多个客户端的不同状态的。
文章最后将介绍命令从发送到处理的整个过程,并列举了一个 SET
命令的执行过程作为例子。
初始化服务器
从启动 Redis 服务器,到服务器可以接受外来客户端的网络连接这段时间,Redis 需要执行一系列初始化操作。
整个初始化过程可以分为以下六个步骤:
- 初始化服务器全局状态。
- 载入配置文件。
- 创建 daemon 进程。
- 初始化服务器功能模块。
- 载入数据。
- 开始事件循环。
以下各个小节将介绍 Redis 服务器初始化的各个步骤。
1. 初始化服务器全局状态
redis.h/redisServer
结构记录了和服务器相关的所有数据,这个结构主要包含以下信息:
- 服务器中的所有数据库。
- 命令表:在执行命令时,根据字符来查找相应命令的实现函数。
- 事件状态。
- 服务器的网络连接信息:套接字地址、端口,以及套接字描述符。
- 所有已连接客户端的信息。
- Lua 脚本的运行环境及相关选项。
- 实现订阅与发布(pub/sub)功能所需的数据结构。
- 日志(log)和慢查询日志(slowlog)的选项和相关信息。
- 数据持久化(AOF 和 RDB)的配置和状态。
- 服务器配置选项:比如要创建多少个数据库,是否将服务器进程作为 daemon 进程来运行,最大连接多少个客户端,压缩结构(zip structure)的实体数量,等等。
- 统计信息:比如键有多少次命令、不命中,服务器的运行时间,内存占用,等等。
Note
为了简洁起见,上面只列出了单机情况下的 Redis 服务器信息,不包含 SENTINEL 、 MONITOR 、 CLUSTER 等功能的信息。
在这一步,程序创建一个 redisServer
结构的实例变量 server
用作服务器的全局状态,并将 server
的各个属性初始化为默认值。
当 server
变量的初始化完成之后,程序进入服务器初始化的下一步:读入配置文件。
2. 载入配置文件
在初始化服务器的上一步中,程序为 server
变量(也即是服务器状态)的各个属性设置了默认值,但这些默认值有时候并不是最合适的:
- 用户可能想使用 AOF 持久化,而不是默认的 RDB 持久化。
- 用户可能想用其他端口来运行 Redis ,以避免端口冲突。
- 用户可能不想使用默认的 16 个数据库,而是分配更多或更少数量的数据库。
- 用户可能想对默认的内存限制措施和回收策略做调整。
等等。
为了让使用者按自己的要求配置服务器,Redis 允许用户在运行服务器时,提供相应的配置文件(config file)或者显式的选项(option),Redis 在初始化完 server
变量之后,会读入配置文件和选项,然后根据这些配置来对 server
变量的属性值做相应的修改:
-
如果单纯执行
redis-server
命令,那么服务器以默认的配置来运行 Redis 。 -
另一方面, 如果给 Redis 服务器送入一个配置文件, 那么 Redis 将按配置文件的设置来更新服务器的状态。
比如说, 通过命令 redis-server /etc/my-redis.conf
, Redis 会根据 my-redis.conf
文件的内容来对服务器状态做相应的修改。
-
除此之外, 还可以显式地给服务器传入选项, 直接修改服务器配置。
举个例子, 通过命令 redis-server --port 10086
, 可以让 Redis 服务器端口变更为 10086
。
-
当然, 同时使用配置文件和显式选项也是可以的, 如果文件和选项有冲突的地方, 那么优先使用选项所指定的配置值。
举个例子, 如果运行命令 redis-server /etc/my-redis.conf --port 10086
, 并且 my-redis.conf
也指定了 port
选项, 那么服务器将优先使用 --port 10086
(实际上是选项指定的值覆盖了配置文件中的值)。
3. 创建 daemon 进程
Redis 默认以 daemon 进程的方式运行。
当服务器初始化进行到这一步时,程序将创建 daemon 进程来运行 Redis ,并创建相应的 pid 文件。
4. 初始化服务器功能模块
在这一步,初始化程序完成两件事:
- 为
server
变量的数据结构子属性分配内存。 - 初始化这些数据结构。
为数据结构分配内存,并初始化这些数据结构,等同于对相应的功能进行初始化。
比如说,当为订阅与发布所需的链表分配内存之后,订阅与发布功能就处于就绪状态,随时可以为 Redis 所用了。
在这一步,程序完成的主要动作如下:
- 初始化 Redis 进程的信号功能。
- 初始化日志功能。
- 初始化客户端功能。
- 初始化共享对象。
- 初始化事件功能。
- 初始化数据库。
- 初始化网络连接。
- 初始化订阅与发布功能。
- 初始化各个统计变量。
- 关联服务器常规操作(cron job)到时间事件,关联客户端应答处理器到文件事件。
- 如果 AOF 功能已打开,那么打开或创建 AOF 文件。
- 设置内存限制。
- 初始化 Lua 脚本环境。
- 初始化慢查询功能。
- 初始化后台操作线程。
完成这一步之后,服务器打印出 Redis 的 ASCII LOGO 、服务器版本等信息,表示所有功能模块已经就绪,可以等待被使用了:
_._
_.-``__ ''-._
_.-`` `. `_. ''-._ Redis 2.9.7 (7a47887b/1) 32 bit
.-`` .-```. ```\/ _.,_ ''-._
( ' , .-` | `, ) Running in stand alone mode
|`-._`-...-` __...-.``-._|'` _.-'| Port: 6379
| `-._ `._ / _.-' | PID: 6717
`-._ `-._ `-./ _.-' _.-'
|`-._`-._ `-.__.-' _.-'_.-'|
| `-._`-._ _.-'_.-' | http://redis.io
`-._ `-._`-.__.-'_.-' _.-'
|`-._`-._ `-.__.-' _.-'_.-'|
| `-._`-._ _.-'_.-' |
`-._ `-._`-.__.-'_.-' _.-'
`-._ `-.__.-' _.-'
`-._ _.-'
`-.__.-'
虽然所有功能已经就绪,但这时服务器的数据库还是一片空白,程序还需要将服务器上一次执行时记录的数据载入到当前服务器中,服务器的初始化才算真正完成。
5. 载入数据
在这一步,程序需要将持久化在 RDB 或者 AOF 文件里的数据,载入到服务器进程里面。
如果服务器有启用 AOF 功能的话,那么使用 AOF 文件来还原数据;否则,程序使用 RDB 文件来还原数据。
当执行完这一步时,服务器打印出一段载入完成信息:
[6717] 22 Feb 11:59:14.830 * DB loaded from disk: 0.068 seconds
6. 开始事件循环
到了这一步,服务器的初始化已经完成,程序打开事件循环,开始接受客户端连接。
以下是服务器在这一步打印的信息:
[6717] 22 Feb 11:59:14.830 * The server is now ready to accept connections on port 6379
以下是初始化完成之后,服务器状态和各个模块之间的关系图:
客户端连接到服务器
当 Redis 服务器完成初始化之后,它就准备好可以接受外来客户端的连接了。
当一个客户端通过套接字函数 connect
到服务器时,服务器执行以下步骤:
- 服务器通过文件事件无阻塞地
accept
客户端连接,并返回一个套接字描述符fd
。 - 服务器为
fd
创建一个对应的redis.h/redisClient
结构实例,并将该实例加入到服务器的已连接客户端的链表中。 - 服务器在事件处理器为该
fd
关联读文件事件。
完成这三步之后,服务器就可以等待客户端发来命令请求了。
Redis 以多路复用的方式来处理多个客户端,为了让多个客户端之间独立分开、不互相干扰,服务器为每个已连接客户端维持一个 redisClient
结构,从而单独保存该客户端的状态信息。
redisClient
结构主要包含以下信息:
- 套接字描述符。
- 客户端正在使用的数据库指针和数据库号码。
- 客户端的查询缓冲(query buffer)和回复缓存(reply buffer)。
- 一个指向命令函数的指针,以及字符串形式的命令、命令参数和命令个数,这些属性会在命令执行时使用。
- 客户端状态:记录了客户端是否处于 SLAVE 、 MONITOR 或者事务状态。
- 实现事务功能(比如 MULTI 和 WATCH )所需的数据结构。
- 实现阻塞功能(比如 BLPOP 和 BRPOPLPUSH )所需的数据结构。
- 实现订阅与发布功能(比如 PUBLISH 和 SUBSCRIBE )所需的数据结构。
- 统计数据和选项:客户端创建的时间,客户端和服务器最后交互的时间,缓存的大小,等等。
Note
为了简洁起见,上面列出的客户端结构信息不包含复制(replication)的相关属性。
命令的请求、处理和结果返回
当客户端连上服务器之后,客户端就可以向服务器发送命令请求了。
从客户端发送命令请求,到命令被服务器处理、并将结果返回客户端,整个过程有以下步骤:
- 客户端通过套接字向服务器传送命令协议数据。
- 服务器通过读事件来处理传入数据,并将数据保存在客户端对应
redisClient
结构的查询缓存中。 - 根据客户端查询缓存中的内容,程序从命令表中查找相应命令的实现函数。
- 程序执行命令的实现函数,修改服务器的全局状态
server
变量,并将命令的执行结果保存到客户端redisClient
结构的回复缓存中,然后为该客户端的fd
关联写事件。 - 当客户端
fd
的写事件就绪时,将回复缓存中的命令结果传回给客户端。至此,命令执行完毕。
命令请求实例: SET 的执行过程
为了更直观地理解命令执行的整个过程,我们用一个实际执行 SET 命令的例子来讲解命令执行的过程。
假设现在客户端 C1 是连接到服务器 S 的一个客户端,当用户执行命令 SET YEAR 2013
时,客户端调用写入函数,将协议内容 *3\r\n$3\r\nSET\r\n$4\r\nYEAR\r\n$4\r\n2013\r\n"
写入连接到服务器的套接字中。
当 S 的文件事件处理器执行时,它会察觉到 C1 所对应的读事件已经就绪,于是它将协议文本读入,并保存在查询缓存。
通过对查询缓存进行分析(parse),服务器在命令表中查找 SET
字符串所对应的命令实现函数,最终定位到 t_string.c/setCommand
函数,另外,两个命令参数 YEAR
和 2013
也会以字符串的形式保存在客户端结构中。
接着,程序将客户端、要执行的命令、命令参数等送入命令执行器:执行器调用 setCommand
函数,将数据库中 YEAR
键的值修改为 2013
,然后将命令的执行结果保存在客户端的回复缓存中,并为客户端 fd
关联写事件,用于将结果回写给客户端。
因为 YEAR
键的修改,其他和数据库命名空间相关程序,比如 AOF 、REPLICATION 还有事务安全性检查(是否修改了被 WATCH
监视的键?)也会被触发,当这些后续程序也执行完毕之后,命令执行器退出,服务器其他程序(比如时间事件处理器)继续运行。
当 C1 对应的写事件就绪时,程序就会将保存在客户端结构回复缓存中的数据回写给客户端,当客户端接收到数据之后,它就将结果打印出来,显示给用户看。
以上就是 SET YEAR 2013
命令执行的整个过程。
小结
- 服务器经过初始化之后,才能开始接受命令。
- 服务器初始化可以分为六个步骤:
- 初始化服务器全局状态。
- 载入配置文件。
- 创建 daemon 进程。
- 初始化服务器功能模块。
- 载入数据。
- 开始事件循环。
- 服务器为每个已连接的客户端维持一个客户端结构,这个结构保存了这个客户端的所有状态信息。
- 客户端向服务器发送命令,服务器接受命令然后将命令传给命令执行器,执行器执行给定命令的实现函数,执行完成之后,将结果保存在缓存,最后回传给客户端。