Redis-应用篇-⑥使用规范

holic-x...大约 10 分钟

Redis-应用篇-⑥使用规范

学习核心

Redis 使用规范

学习资料

Redis的使用规范小建议open in new window

Redis 使用规范

1.键值对使用规范

key 的命名规范：只有命名规范，才能提供可读性强、可维护性好的 key，方便日常管理；
value 的设计规范：包括避免 bigkey、选择高效序列化方法和压缩方法、使用整数对象共享池、数据类型选择；

一个 Redis 实例默认可以支持 16 个数据库，可以把不同的业务数据分散保存到不同的数据库中。但是在使用不同数据库时，客户端需要使用 SELECT 命令进行数据库切换，相当于增加了一个额外的操作。因此可以通过合理命名 key来减少这个操作。具体的做法是，把业务名作为前缀，然后用冒号分隔，再加上具体的业务数据名。这样一来，我们可以通过 key 的前缀区分不同的业务数据，就不用在多个数据库间来回切换了。

例如要统计网页的独立访客量，可以使用uv:page:1024代码设置 key，表示这个数据对应的业务是统计 unique visitor（独立访客量），而且对应的页面编号是 1024。

需注意：key 本身是字符串，底层的数据结构是 SDS。SDS 结构中会包含字符串长度、分配空间大小等元数据信息。从 Redis 3.2 版本开始，当 key 字符串的长度增加时，SDS 中的元数据也会占用更多内存空间。所以在设置 key 的名称时，要注意控制 key 的长度。否则，如果 key 很长的话，就会消耗较多内存空间，而且SDS 元数据也会额外消耗一定的内存空间。

为了减少 key 占用的内存空间，可以使用缩写：对于业务名或业务数据名，可以使用相应的英文单词的首字母表示，（比如 user 用 u 表示，message 用 m），或者是用缩写表示（例如 unique visitor 使用 uv）

value 的设计规范

（1）规避使用big key

Redis 是使用单线程读写数据，bigkey 的读写操作会阻塞线程，降低 Redis 的处理效率。在应用 Redis 时，关于 value 的设计规范，非常重要的一点就是避免 bigkey。bigkey 通常有两种情况。

情况一：键值对的值大小本身就很大，例如 value 为 1MB 的 String 类型数据。为了避免 String 类型的 bigkey，在业务层要尽量把 String 类型的数据大小控制在 10KB 以下
情况二：键值对的值是集合类型，集合元素个数非常多，例如包含 100 万个元素的 Hash 集合类型数据。为了避免集合类型的 bigkey，我给你的设计规范建议是，尽量把集合类型的元素个数控制在 1 万以下

当然，这些建议只是为了尽量避免 bigkey，如果无法完全规避则采用优化方案：

如果业务层的 String 类型数据确实很大，可以通过数据压缩来减小数据大小；
如果集合类型的元素的确很多，可以将一个大集合拆分成多个小集合来保存

此处需注意，Redis 的 4 种集合类型 List、Hash、Set 和 Sorted Set，在集合元素个数小于一定的阈值时，会使用内存紧凑型的底层数据结构进行保存，从而节省内存。例如，假设 Hash 集合的 hash-max-ziplist-entries 配置项是 1000，如果 Hash 集合元素个数不超过 1000，就会使用 ziplist 保存数据。紧凑型数据结构虽然可以节省内存，但是会在一定程度上导致数据的读写性能下降。所以，如果业务应用更加需要保持高性能访问，而不是节省内存的话，在不会导致 bigkey 的前提下，可以不用刻意控制集合元素个数

（2）使用高效序列化方法和压缩方法

Redis 中的字符串都是使用二进制安全的字节数组来保存的，所以可以把业务数据序列化成二进制数据写入到 Redis 中以节省内存

但是，不同的序列化方法，在序列化速度和数据序列化后的占用内存空间这两个方面，效果是不一样的。比如说，protostuff 和 kryo 这两种序列化方法，就要比 Java 内置的序列化方法（java-build-in-serializer）效率更高

此外，业务应用有时会使用字符串形式的 XML 和 JSON 格式保存数据。这样做的好处是，这两种格式的可读性好，便于调试，不同的开发语言都支持这两种格式的解析。

缺点在于，XML 和 JSON 格式的数据占用的内存空间比较大。为了避免数据占用过大的内存空间，建议使用压缩工具（例如 snappy 或 gzip），把数据压缩后再写入 Redis，这样就可以节省内存空间

（3）使用整数对象共享池

整数是常用的数据类型，Redis 内部维护了 0 到 9999 这 1 万个整数对象，并把这些整数作为一个共享池使用。

换句话说，如果一个键值对中有 0 到 9999 范围的整数，Redis 就不会为这个键值对专门创建整数对象了，而是会复用共享池中的整数对象。这样一来，即使大量键值对保存了 0 到 9999 范围内的整数，在 Redis 实例中，其实只保存了一份整数对象，可以节省内存空间。

基于这个特点，在满足业务数据需求的前提下，能用整数时就尽量用整数，这样可以节省实例内存。

不能用整数对象共享池的两种情况

情况1：如果 Redis 中设置了 maxmemory，而且启用了 LRU 策略（allkeys-lru 或 volatile-lru 策略），那么整数对象共享池就无法使用。这是因为，LRU 策略需要统计每个键值对的使用时间，如果不同的键值对都共享使用一个整数对象，LRU 策略就无法进行统计了。

情况2：如果集合类型数据采用 ziplist 编码，而集合元素是整数，这个时候，也不能使用共享池。因为 ziplist 使用了紧凑型内存结构，判断整数对象的共享情况效率低。

2.数据保存规范

【规范1】使用Redis保存热数据（充分利用Redis高性能的特性，将宝贵的内存资源主要用于服务热数据上）
【规范2】不同的业务数据分实例存储（避免单实例的内存使用量过大，也可以避免不同业务的操作相互干扰）
【规范3】数据保存需设置过期时间（根据业务使用数据的时长，设置数据的过期时间，避免写入Redis的数据持续占用内存资源而不使用）
【规范4】控制Redis实例的容量（控制Redis单实例大小，一般是2-6GB，进而RDB快照和主从集群数据同步时间，而不阻塞正常请求的处理）

3.命名使用规范

规范一：线上禁用部分命令

Redis 是单线程处理请求操作，如果执行一些涉及大量操作、耗时长的命令，就会严重阻塞主线程，导致其它请求无法得到正常处理，这类命令主要有 3 种

KEYS：按照键值对的 key 内容进行匹配，返回符合匹配条件的键值对，该命令需要对 Redis 的全局哈希表进行全表扫描，严重阻塞 Redis 主线程；
FLUSHALL：删除 Redis 实例上的所有数据，如果数据量很大，会严重阻塞 Redis 主线程；
FLUSHDB：删除当前数据库中的数据，如果数据量很大，同样会阻塞 Redis 主线程。

所以，在线上应用 Redis 时，就需要禁用这些命令。具体的做法是，管理员用 rename-command 命令在配置文件中对这些命令进行重命名，让客户端无法使用这些命令。还可以使用其它命令替代这 3 个命令

对于 KEYS 命令来说，可以用 SCAN 命令代替 KEYS 命令，分批返回符合条件的键值对，避免造成主线程阻塞；
对于 FLUSHALL、FLUSHDB 命令来说，可以加上 ASYNC 选项，让这两个命令使用后台线程异步删除数据，可以避免阻塞主线程。

规范二：慎用 MONITOR 命令

Redis 的 MONITOR 命令在执行后，会持续输出监测到的各个命令操作，所以，通常会用 MONITOR 命令返回的结果，检查命令的执行情况。

但是，MONITOR 命令会把监控到的内容持续写入输出缓冲区。如果线上命令的操作很多，输出缓冲区很快就会溢出了，这就会对 Redis 性能造成影响，甚至引起服务崩溃。

所以，除非十分需要监测某些命令的执行（例如，Redis 性能突然变慢，想查看下客户端执行了哪些命令），可以偶尔在短时间内使用下 MONITOR 命令，否则，建议不要使用 MONITOR 命令

规范三：慎用全量操作命令

对于集合类型的数据来说，如果想要获得集合中的所有元素，一般不建议使用全量操作的命令（例如 Hash 类型的 HGETALL、Set 类型的 SMEMBERS）。这些操作会对 Hash 和 Set 类型的底层数据结构进行全量扫描，如果集合类型数据较多的话，就会阻塞 Redis 主线程。如果想要获得集合类型的全量数据，可以参考以下建议：

【1】可以使用 SSCAN、HSCAN 命令分批返回集合中的数据，减少对主线程的阻塞
【2】可以化整为零，把一个大的 Hash 集合拆分成多个小的 Hash 集合。这个操作对应到业务层，就是对业务数据进行拆分，按照时间、地域、用户 ID 等属性把一个大集合的业务数据拆分成多个小集合数据。例如，当你统计用户的访问情况时，就可以按照天的粒度，把每天的数据作为一个 Hash 集合
【3】如果集合类型保存的是业务数据的多个属性，而每次查询时，也需要返回这些属性，则可以使用 String 类型，将这些属性序列化后保存，每次直接返回 String 数据就行，不用再对集合类型做全量扫描

Redis 使用规范总结

强制类别的规范：表示如果不按照规范内容来执行，就会给 Redis 的应用带来极大的负面影响，例如性能受损。
推荐类别的规范：这个规范的内容能有效提升性能、节省内存空间，或者是增加开发和运维的便捷性，可以直接应用到实践中
建议类别的规范：这类规范内容和实际业务应用相关，结合实践经历或经验给出的建议，需要结合自己的业务场景参考使用

昵称

邮箱

网址

按正序
按倒序
按热度

Redis-应用篇-⑥使用规范

预览: