C++子集和问题
无重复元素的情况
Question
给定一个正整数数组 nums
和一个目标正整数 target
,请找出所有可能的组合,使得组合中的元素和等于 target
。给定数组无重复元素,每个元素可以被选取多次。请以列表形式返回这些组合,列表中不应包含重复组合。
例如,输入集合
- 输入集合中的元素可以被无限次重复选取。
- 子集是不区分元素顺序的,比如
和 是同一个子集。
1. 参考全排列解法
类似于全排列问题,我们可以把子集的生成过程想象成一系列选择的结果,并在选择过程中实时更新“元素和”,当元素和等于 target
时,就将子集记录至结果列表。
而与全排列问题不同的是,本题集合中的元素可以被无限次选取,因此无须借助 selected
布尔列表来记录元素是否已被选择。我们可以对全排列代码进行小幅修改,初步得到解题代码。
subset_sum_i_naive.cpp
/* 回溯算法:子集和 I */
void backtrack(vector<int> &state, int target, int total, vector<int> &choices, vector<vector<int>> &res) {
// 子集和等于 target 时,记录解
if (total == target) {
res.push_back(state);
return;
}
// 遍历所有选择
for (size_t i = 0; i < choices.size(); i++) {
// 剪枝:若子集和超过 target ,则跳过该选择
if (total + choices[i] > target) {
continue;
}
// 尝试:做出选择,更新元素和 total
state.push_back(choices[i]);
// 进行下一轮选择
backtrack(state, target, total + choices[i], choices, res);
// 回退:撤销选择,恢复到之前的状态
state.pop_back();
}
}
/* 求解子集和 I(包含重复子集) */
vector<vector<int>> subsetSumINaive(vector<int> &nums, int target) {
vector<int> state; // 状态(子集)
int total = 0; // 子集和
vector<vector<int>> res; // 结果列表(子集列表)
backtrack(state, target, total, nums, res);
return res;
}
向以上代码输入数组
这是因为搜索过程是区分选择顺序的,然而子集不区分选择顺序。如图 13-10 所示,先选
图 13-10 子集搜索与越界剪枝
为了去除重复子集,一种直接的思路是对结果列表进行去重。但这个方法效率很低,有两方面原因。
- 当数组元素较多,尤其是当
target
较大时,搜索过程会产生大量的重复子集。 - 比较子集(数组)的异同非常耗时,需要先排序数组,再比较数组中每个元素的异同。
2. 重复子集剪枝
我们考虑在搜索过程中通过剪枝进行去重。观察图 13-11 ,重复子集是在以不同顺序选择数组元素时产生的,例如以下情况。
- 当第一轮和第二轮分别选择
和 时,会生成包含这两个元素的所有子集,记为 。 - 之后,当第一轮选择
时,则第二轮应该跳过 ,因为该选择产生的子集 和1.
中生成的子集完全重复。
在搜索中,每一层的选择都是从左到右被逐个尝试的,因此越靠右的分支被剪掉的越多。
- 前两轮选择
和 ,生成子集 。 - 前两轮选择
和 ,生成子集 。 - 若第一轮选择
,则第二轮应该跳过 和 ,因为子集 和 与第1.
和2.
步中描述的子集完全重复。
图 13-11 不同选择顺序导致的重复子集
总结来看,给定输入数组
3. 代码实现
为实现该剪枝,我们初始化变量 start
,用于指示遍历起点。当做出选择
除此之外,我们还对代码进行了以下两项优化。
- 在开启搜索前,先将数组
nums
排序。在遍历所有选择时,当子集和超过target
时直接结束循环,因为后边的元素更大,其子集和都一定会超过target
。 - 省去元素和变量
total
,通过在target
上执行减法来统计元素和,当target
等于 时记录解。subset_sum_i.cpp /* 回溯算法:子集和 I */ void backtrack(vector<int> &state, int target, vector<int> &choices, int start, vector<vector<int>> &res) { // 子集和等于 target 时,记录解 if (target == 0) { res.push_back(state); return; } // 遍历所有选择 // 剪枝二:从 start 开始遍历,避免生成重复子集 for (int i = start; i < choices.size(); i++) { // 剪枝一:若子集和超过 target ,则直接结束循环 // 这是因为数组已排序,后边元素更大,子集和一定超过 target if (target - choices[i] < 0) { break; } // 尝试:做出选择,更新 target, start state.push_back(choices[i]); // 进行下一轮选择 backtrack(state, target - choices[i], choices, i, res); // 回退:撤销选择,恢复到之前的状态 state.pop_back(); } } /* 求解子集和 I */ vector<vector<int>> subsetSumI(vector<int> &nums, int target) { vector<int> state; // 状态(子集) sort(nums.begin(), nums.end()); // 对 nums 进行排序 int start = 0; // 遍历起始点 vector<vector<int>> res; // 结果列表(子集列表) backtrack(state, target, nums, start, res); return res; }
如图 13-12 所示,为将数组
图 13-12 子集和 I 回溯过程
考虑重复元素的情况
Question
给定一个正整数数组 nums
和一个目标正整数 target
,请找出所有可能的组合,使得组合中的元素和等于 target
。给定数组可能包含重复元素,每个元素只可被选择一次。请以列表形式返回这些组合,列表中不应包含重复组合。
相比于上题,本题的输入数组可能包含重复元素,这引入了新的问题。例如,给定数组
造成这种重复的原因是相等元素在某轮中被多次选择。在图 13-13 中,第一轮共有三个选择,其中两个都为
图 13-13 相等元素导致的重复子集
1. 相等元素剪枝
为解决此问题,我们需要限制相等元素在每一轮中只被选择一次。实现方式比较巧妙:由于数组是已排序的,因此相等元素都是相邻的。这意味着在某轮选择中,若当前元素与其左边元素相等,则说明它已经被选择过,因此直接跳过当前元素。
与此同时,本题规定中的每个数组元素只能被选择一次。幸运的是,我们也可以利用变量 start
来满足该约束:当做出选择
2. 代码实现
subset_sum_ii.cpp
/* 回溯算法:子集和 II */
void backtrack(vector<int> &state, int target, vector<int> &choices, int start, vector<vector<int>> &res) {
// 子集和等于 target 时,记录解
if (target == 0) {
res.push_back(state);
return;
}
// 遍历所有选择
// 剪枝二:从 start 开始遍历,避免生成重复子集
// 剪枝三:从 start 开始遍历,避免重复选择同一元素
for (int i = start; i < choices.size(); i++) {
// 剪枝一:若子集和超过 target ,则直接结束循环
// 这是因为数组已排序,后边元素更大,子集和一定超过 target
if (target - choices[i] < 0) {
break;
}
// 剪枝四:如果该元素与左边元素相等,说明该搜索分支重复,直接跳过
if (i > start && choices[i] == choices[i - 1]) {
continue;
}
// 尝试:做出选择,更新 target, start
state.push_back(choices[i]);
// 进行下一轮选择
backtrack(state, target - choices[i], choices, i + 1, res);
// 回退:撤销选择,恢复到之前的状态
state.pop_back();
}
}
/* 求解子集和 II */
vector<vector<int>> subsetSumII(vector<int> &nums, int target) {
vector<int> state; // 状态(子集)
sort(nums.begin(), nums.end()); // 对 nums 进行排序
int start = 0; // 遍历起始点
vector<vector<int>> res; // 结果列表(子集列表)
backtrack(state, target, nums, start, res);
return res;
}
图 13-14 展示了数组
图 13-14 子集和 II 回溯过程