M1722.执行交换操作后的最小汉明距离
dsu, https://leetcode.cn/problems/minimize-hamming-distance-after-swap-operations/
给你两个整数数组 source 和 target ,长度都是 n 。还有一个数组 allowedSwaps ,其中每个 allowedSwaps[i] = [ai, bi] 表示你可以交换数组 source 中下标为 ai 和 bi(下标从 0 开始)的两个元素。注意,你可以按 任意顺序 多次 交换一对特定下标指向的元素。
相同长度的两个数组 source 和 target 间的 汉明距离 是元素不同的下标数量。形式上,其值等于满足 source[i] != target[i] (下标从 0 开始)的下标 i(0 <= i <= n-1)的数量。
在对数组 source 执行 任意 数量的交换操作后,返回 source 和 target 间的 最小汉明距离 。
示例 1:
输入:source = [1,2,3,4], target = [2,1,4,5], allowedSwaps = [[0,1],[2,3]]
输出:1
解释:source 可以按下述方式转换:
- 交换下标 0 和 1 指向的元素:source = [2,1,3,4]
- 交换下标 2 和 3 指向的元素:source = [2,1,4,3]
source 和 target 间的汉明距离是 1 ,二者有 1 处元素不同,在下标 3 。示例 2:
输入:source = [1,2,3,4], target = [1,3,2,4], allowedSwaps = []
输出:2
解释:不能对 source 执行交换操作。
source 和 target 间的汉明距离是 2 ,二者有 2 处元素不同,在下标 1 和下标 2 。示例 3:
输入:source = [5,1,2,4,3], target = [1,5,4,2,3], allowedSwaps = [[0,4],[4,2],[1,3],[1,4]]
输出:0提示:
n == source.length == target.length1 <= n <= 10^51 <= source[i], target[i] <= 10^50 <= allowedSwaps.length <= 10^5allowedSwaps[i].length == 20 <= ai, bi <= n - 1ai != bi
这道题的核心思路是利用并查集(Union-Find)来处理连通性问题。
解题思路
连通性分析: 如果下标
a和b可以交换,b和c也可以交换,那么下标a、b、c对应的元素可以任意排列。这意味着allowedSwaps实际上定义了一个图,图中每个连通分量(Connected Component)内的下标所对应的source元素,可以移动到该连通分量内的任何下标位置。问题转化: 为了使汉明距离最小,我们希望在每个连通分量内部,尽可能多地让
source[i]等于target[i]。 即:对于每一个连通分量,计算source在这些下标处的数值集合与target在这些下标处的数值集合的交集大小。算法步骤:
- 使用并查集将所有可以通过交换到达的下标分到不同的集合中。
- 遍历所有下标,按根节点(代表所属集合)将
source的值分类存储。 - 对于每个集合,统计
source中元素出现的频次,并尝试匹配该集合对应下标位置在target中的元素。 - 如果
target[i]在该集合的source元素池中,则匹配成功,汉明距离减 1。
Python 代码实现
from typing import List
from collections import Counter, defaultdict
class UnionFind:
def __init__(self, n):
self.parent = list(range(n))
def find(self, i):
if self.parent[i] == i:
return i
# 路径压缩
self.parent[i] = self.find(self.parent[i])
return self.parent[i]
def union(self, i, j):
root_i = self.find(i)
root_j = self.find(j)
if root_i != root_j:
self.parent[root_i] = root_j
class Solution:
def minimumHammingDistance(self, source: List[int], target: List[int], allowedSwaps: List[List[int]]) -> int:
n = len(source)
uf = UnionFind(n)
# 1. 将所有可交换的下标合并进同一个集合
for u, v in allowedSwaps:
uf.union(u, v)
# 2. 将同一集合(连通分量)的下标归类
# key 是并查集的根节点,value 是该集合包含的所有下标
groups = defaultdict(list)
for i in range(n):
root = uf.find(i)
groups[root].append(i)
res = 0
# 3. 对每个连通分量,计算无法匹配的元素个数
for indices in groups.values():
# 统计当前集合中 source 的元素频率
source_count = Counter()
for idx in indices:
source_count[source[idx]] += 1
# 遍历当前集合对应的 target 元素,寻找匹配
matches = 0
for idx in indices:
val = target[idx]
if source_count[val] > 0:
source_count[val] -= 1
matches += 1
# 该集合贡献的汉明距离 = 集合大小 - 匹配成功的数量
res += (len(indices) - matches)
return res复杂度分析
- 时间复杂度:
,其中 是数组长度, 是 allowedSwaps的长度,是阿克曼函数的反函数(近似常数)。 - 并查集操作:
。 - 分类和计数:遍历一次数组
,Counter 的操作平均也是 。
- 并查集操作:
- 空间复杂度:
。主要用于存储并查集的父节点数组、分组字典以及计数器。
总结
这道题的关键在于意识到:可无限次交换意味着连通分量内的元素可以按需重新排列。只要理解了这一点,就能将题目转化为连通分量的元素匹配问题。