首页 > 基础资料博客日记

分表路由：为什么大神都用 & (n-1)，而不用 % ？一次给你讲透

2026-01-05 15:00:02基础资料围观113次

本篇文章分享分表路由：为什么大神都用 & (n-1)，而不用 % ？一次给你讲透，对你有帮助的话记得收藏一下，看Java资料网收获更多编程知识

写在前面

"分库分表"大家都不陌生。当数据量激增时，我们习惯性地写下 userId % tableCount 来决定数据路由到哪张表。

这段代码逻辑正确、简单直观。但在对性能要求极高的底层中间件开发中，这真的是最优解吗？

如果我们翻开 JDK 1.8 的 HashMap 源码，会发现大神 Doug Lea 在计算数组下标时，刻意避开了 % 取模，而是使用了一行看起来更晦涩的 & (n - 1)。

今天，我们就把 HashMap 的这项底层“绝技”移植到业务系统的分表组件中，打造一个高性能、可扩展且具备防御性的路由工具。

一、从一次 Code Review 说起

最近在审查新版分表中间件的代码时，看到了一段非常标准的分表路由逻辑：

// ❌ 常见的写法
public String getTableName(int userId) {
    // 假设分32张表
    int tableIndex =  userId % 32; 
    return "t_order_" + tableIndex;
}

这段代码在功能上没有问题。但作为一个对底层细节有追求的工程师，我不禁想到了 HashMap 的实现。

打开 JDK 源码，在 HashMap.put 方法中，计算节点落槽位置的代码是这样的：

// HashMap源码片段
if ((p = tab[i = (n - 1) & hash]) == null) ...

Doug Lea 并没有使用直观的 hash % n，而是使用了与运算 &。

为什么？
根本原因在于 CPU 的指令执行效率：

位运算（&, |, ^, ~）：直接对应 CPU 底层指令，通常只需 1 个时钟周期。
取模运算（%）：涉及除法操作，在底层硬件实现上极其复杂，通常消耗 10-30 个时钟周期。

虽然在普通的业务逻辑中，几十个时钟周期的差异可以忽略不计。但在高频触发的基础设施层（如网关路由、分表中间件、缓存寻址），这种微小的性能差异在高并发下会被显著放大。

二、揭秘位运算的物理意义

HashMap 能用 & 替代 %，有一个强制性的前提条件：

数组长度（或分表数）必须是 2 的 n 次幂（2, 4, 8, 16, 32, 64...）

1. 数学原理

公式：
当 n = 2^k 时，X % n 等价于 X & (n - 1)

这个公式背后的逻辑，从二进制视角来看会非常清晰。

假设分表数 n = 8（即 2³）。
那么 n - 1 = 7。

8 的二进制：... 0000 1000
7 的二进制：... 0000 0111 （低三位全为1，高位全为0）

当我们计算 userId & 7 时，实际上是在进行位掩码（BitMask）操作。
因为 7 的高位全是 0，& 运算会将 userId 的所有高位清零，只完整保留最后三位。

而一个数值的低 k 位，恰恰就是它对 2^k 取模的余数。

userId (十进制)	userId (二进制)	& 0111 (掩码)	结果	% 8 结果
10	`... 0000 1010`	`0010`	2	2
15	`... 0000 1111`	`0111`	7	7
16	`... 0001 0000`	`0000`	0	0
17	`... 0001 0001`	`0001`	1	1

结论：只要分表数是 2 的幂，位运算本质上就是一次高效的低位截取。它能在硬件层面以最快的速度得到我们想要的结果。

三、实战：打造生产级路由工具

原理虽然简单，但要落地到生产环境，必须考虑工程化问题：如何防止后续维护者错误配置分表数？如何保证代码的健壮性？

这里我们推荐使用 防御性编程 + 枚举约束 的方式。

1. 定义分表策略枚举

我们通过枚举（Enum）将分表规则固定下来，并在枚举构造器中进行严格校验。

@Getter
@AllArgsConstructor
public enum TableStrategyEnum {
    /** 订单表：分32张 */
    ORDER("t_order_", 32),
    
    /** 支付流水表：分64张 */
    PAYMENT("t_pay_flow_", 64);

    private final String prefix;
    private final int count;
    
    // 构造时进行 Fail-Fast 检查
    // 如果配置的不是 2 的幂，应用启动时就会直接抛错，阻止由于配置失误导致的上线事故
    TableStrategyEnum(String prefix, int count) {
        if (count <= 0 || (count & (count - 1)) != 0) {
            throw new Error("配置错误：Strategy [" + prefix + "] 分表数必须是 2 的幂！");
        }
        this.prefix = prefix;
        this.count = count;
    }
}

2. 封装核心路由工具类

public class DivTableUtils {

    /**
     * 获取目标表名
     * @param bizId 业务主键（如 userId, orderId）
     * @param strategy 分表策略
     */
    public static String getTableName(int bizId, TableStrategyEnum strategy) {
        // 1. 基础校验
        if (bizId <= 0) {
            throw new IllegalArgumentException("业务ID必须为正整数");
        }
        
        // 2. 核心位运算逻辑
        // 因为枚举构造里已经保证了 count 是 2 的幂，这里可以安全使用位运算
        int index = bizId & (strategy.getCount() - 1);
        
        // 3. 拼接返回
        return strategy.getPrefix() + index;
    }
}

使用示例：

// 业务代码中调用，清晰且安全
String tableName = DivTableUtils.getTableName(user.getId(), TableStrategyEnum.ORDER);
// 输出：t_order_5

四、深度思考：为什么要强制 2 的幂？

肯定有人会问：

“我的业务规模刚好适合分 100 张表，为了用位运算强行改成 128 张，是不是这就叫过早优化？”

这个问题直击要害。
事实上，HashMap 以及我们推荐的分表策略，强制使用 2 的幂次方，性能提升只是表象，真正的核心价值在于——扩容的平滑性。

扩容时的 "Rehash" 魔法

通常分表扩容时，我们会将表数量翻倍（例如 16 -> 32）。
如果我们使用传统的 hash % n，当 n 变化时，几乎所有数据的路由结果都会发生改变，这意味着我们需要迁移绝大部分数据。

但如果我们遵循 2 的幂次方扩容：
从二进制角度看，n 从 16 (10000) 变为 32 (100000)，仅仅意味着位掩码多取了一位。

对于任何一个 ID，其路由结果只有两种可能：

保持不变：如果新增的那一位是 0。
平移固定量：如果新增的那一位是 1，新坐标 = 原坐标 + 原长度。

这就是 HashMap 扩容时 rehash 极其高效的秘密。反映到数据库分表扩容上，这意味着我们有一半的数据完全不需要移动，这一点对于海量数据的迁移至关重要。

五、结语：在比特世界里寻找优雅

计算机科学里有一句名言："Simple is Better"。

但"简单"往往有两个层次：
一个是无知的简单：随手写下 id % n，不管不顾。
一个是透彻的简单：理解了二进制的规律，用 id & (n-1) 驾驭复杂。

DivideTableUtils 这个小工具，虽然只有寥寥几行代码，却折射出了优秀架构设计的三个维度：

对原理的极致利用（位运算加速）。
对错误的零容忍（Fail-Fast 校验）。
对未来的深远规划（Rehash 扩容）。

可以预见的是，当你的业务流量洪峰到来时，那些藏在比特世界里的每一次优化，都将成为系统最坚实的护盾。

文章来源:https://www.cnblogs.com/xzqcsj/p/19442863
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系邮箱：jacktools123@163.com进行投诉反馈，一经查实，立即删除！

标签：

上一篇：Erupt 1.13.2 版本已发布，支持甘特图，MCP，开源通知模块
下一篇：10389_基于Springboot的物资管理系统

首页 > 基础资料博客日记

分表路由：为什么大神都用 & (n-1)，而不用 % ？一次给你讲透

一、从一次 Code Review 说起

二、揭秘位运算的物理意义

1. 数学原理

三、实战：打造生产级路由工具

1. 定义分表策略枚举

2. 封装核心路由工具类

四、深度思考：为什么要强制 2 的幂？

扩容时的 "Rehash" 魔法

五、结语：在比特世界里寻找优雅

相关文章

最新发布

点击排行

本站推荐

标签云

首页 > 基础资料 博客日记

分表路由：为什么大神都用 & (n-1)，而不用 % ？一次给你讲透

一、 从一次 Code Review 说起

二、 揭秘位运算的物理意义

1. 数学原理

三、 实战：打造生产级路由工具

1. 定义分表策略枚举

2. 封装核心路由工具类

四、 深度思考：为什么要强制 2 的幂？

扩容时的 "Rehash" 魔法

五、 结语：在比特世界里寻找优雅

相关文章

最新发布

点击排行

本站推荐

标签云

首页 > 基础资料博客日记

一、从一次 Code Review 说起

二、揭秘位运算的物理意义

三、实战：打造生产级路由工具

四、深度思考：为什么要强制 2 的幂？

五、结语：在比特世界里寻找优雅