校招C++20并发系列03-应对负载不均：动态分区器自适应分块实战

应对负载不均：动态分区器自适应分块实战

在上一期内容中，我们深入探讨了静态分区策略及其实现方式。无论是粗粒度还是细粒度的静态分配，其核心逻辑都是预先确定每个线程的工作范围。然而，这种“先验”的划分方式在面对数据分布不均或任务耗时差异巨大的场景时，往往会导致严重的负载失衡：部分线程因处理耗时长的任务而过载，而其他线程则早早空闲。

为了解决这一问题，我们需要引入**动态分区（Dynamic Partitioning）**机制。与静态方案不同，动态分区允许线程在运行过程中按需获取任务，从而实现对输入数据形态的自适应。本文将通过对比静态与动态方案的代码实现及性能表现，详细解析如何利用 std::atomic 构建高效的动态工作队列。

静态分区的局限性：最坏情况模拟

为了直观展示静态分区的缺陷，我们首先回顾上期代码中的极端场景。假设我们有 $2^{18}$ 个工作项，这些工作项对应四个均匀分布的区间（Bin 1-4），但它们的执行耗时差异巨大。

在之前的静态实现中，我们将工作项向量按特定顺序交错排列：先压入两个 Bin 1 的元素，接着是两个 Bin 2、Bin 3 和 Bin 4 的元素。这种排列方式人为制造了“最坏情况”：

线程 0 和 1：始终处理耗时极短的任务（1~25 微秒）。

线程 6 和 7：始终处理耗时最长的任务。

由于静态分区固定了线程步长（Stride）和起始索引，线程 6 和 7 必须串行处理完所有长耗时任务，导致整个并行程序的完成时间取决于最慢的那个线程。在这种配置下，即使采用细粒度静态分区，总耗时仍高达约 4.5 秒。这证明了静态策略无法适应不可预测的数据流模式。

动态分区原理：基于原子操作的自旋获取

动态分区的核心思想是“池化”任务。不再预先将任务分配给特定线程，而是将所有待处理的工作项放入一个共享容器中，并维护一个全局的原子计数器，用于追踪下一个可用的工作项索引。

核心机制

共享状态：使用 std::atomic<int> 类型的变量 next_index 初始化为 0，指向向量中尚未被领取的第一个元素。

原子获取：每个线程在执行循环时，不依赖固定的步长，而是反复调用 fetch_add 操作。该操作原子性地返回当前索引值并将计数器加 1。

边界检查：线程获取到索引后，需检查是否小于工作项总数（ $2^{18}$ ）。若超出范围，说明所有任务已被领取完毕，线程退出循环。

代码实现解析

以下是动态分区的关键代码片段，展示了线程如何从共享池中领取任务：

#include <vector>
#include <thread>
#include <atomic>
#include <chrono>
#include <iostream>

// 假设 work_items 已填充好，大小为 N = 2^18
std::vector<int> work_items; 
// 全局原子计数器，初始为 0
std::atomic<int> next_index{0};
const int total_tasks = work_items.size();

void worker_function() {
    int index;
    // 循环尝试获取下一个工作项
    while ((index = next_index.fetch_add(1)) < total_tasks) {
        // 根据索引获取具体的任务数据
        int task_duration = work_items[index];
        
        // 模拟任务执行：休眠相应微秒
        std::this_thread::sleep_for(std::chrono::microseconds(task_duration));
        
        // 此处可添加任务处理逻辑
    }
}

在此实现中，fetch_add(1) 确保了即使多个线程同时竞争，每个工作项也仅被处理一次。短耗时任务的线程在完成少量任务后会迅速再次进入循环领取新任务，而长耗时任务的线程虽然单次执行时间长，但由于不需要等待其他线程完成静态分配的区块，整体吞吐量得以提升。

性能对比与稳健性分析

我们将上述动态方案与之前的静态最坏情况方案进行编译对比。两者均使用相同的编译标志：-O3 优化、链接 libpthread 以及 C++20 标准。

基准测试结果

策略	数据分布特征	总耗时 (近似值)	备注
静态分区	交错排列（最坏情况）	~4.5 秒	线程负载严重不均
动态分区	交错排列（最坏情况）	~3.23 秒	负载自动平衡
动态分区	顺序排列（Bin 1-4 分组）	~3.26 秒	适应性强，性能稳定