将数据流变为多个不相交区间
Last updated
Last updated
问题描述
给你一个由非负整数 a1, a2, ..., an 组成的数据流输入,请你将到目前为止看到的数字总结为不相交的区间列表。
实现 SummaryRanges 类:
SummaryRanges() 使用一个空数据流初始化对象。
void addNum(int val) 向数据流中加入整数 val 。
int[][] getIntervals() 以不相交区间 [starti, endi] 的列表形式返回对数据流中整数的总结。
进阶:如果存在大量合并,并且与数据流的大小相比,不相交区间的数量很小,该怎么办?
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/data-stream-as-disjoint-intervals
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。
“进阶”:在插入过程中完成合并操作;
输入:
["SummaryRanges", "addNum", "getIntervals", "addNum", "getIntervals", "addNum", "getIntervals", "addNum", "getIntervals", "addNum", "getIntervals"]
[[], [1], [], [3], [], [7], [], [2], [], [6], []]
输出:
[null, null, [[1, 1]], null, [[1, 1], [3, 3]], null, [[1, 1], [3, 3], [7, 7]], null, [[1, 3], [7, 7]], null, [[1, 3], [6, 7]]]
解释:
SummaryRanges summaryRanges = new SummaryRanges();
summaryRanges.addNum(1); // arr = [1]
summaryRanges.getIntervals(); // 返回 [[1, 1]]
summaryRanges.addNum(3); // arr = [1, 3]
summaryRanges.getIntervals(); // 返回 [[1, 1], [3, 3]]
summaryRanges.addNum(7); // arr = [1, 3, 7]
summaryRanges.getIntervals(); // 返回 [[1, 1], [3, 3], [7, 7]]
summaryRanges.addNum(2); // arr = [1, 2, 3, 7]
summaryRanges.getIntervals(); // 返回 [[1, 3], [7, 7]]
summaryRanges.addNum(6); // arr = [1, 2, 3, 6, 7]
summaryRanges.getIntervals(); // 返回 [[1, 3], [6, 7]]
提示:
0 <= val <= 10^4
最多调用 addNum 和 getIntervals 方法 3 * 10^4 次
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/data-stream-as-disjoint-intervals
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。
思路
每次 getIntervals
时,先对数组排序,然后依次找出每个不相交的区间;
class SummaryRanges:
def __init__(self):
self.ls = []
def addNum(self, val: int) -> None:
""""""
self.ls.append(val)
def getIntervals(self) -> List[List[int]]:
""""""
ls = sorted(self.ls)
ret = []
l = ls[0]
for i in range(1, len(ls)):
if ls[i] - ls[i-1] > 1: # 判断是否需要合并
ret.append([l, ls[i-1]])
l = ls[i]
ret.append([l, ls[-1]])
return ret
明确每次 addNum
时,区间会发生那些变化:
情况1:存在一个区间 [l, r]
满足 l <= val <= r
;
情况2:存在一个区间 [l, r]
满足 r + 1 == val
;
情况3:存在一个区间 [l, r]
满足 l - 1 == val
;
情况4:存在两个个区间 [l0, r0]
和 [l1, r1]
满足 r0 + 1 == val == l1 - 1
,即加入 val 后,会合并为一个区间 [l0, r1]
情况5:以上均不满足,加入后 val 单独成为一个区间;
这里使用了 SortedDict
降低了代码难度,也可以使用一个有序数组来模拟;
时间复杂度: addNum O(NlgN)
、getIntervals O(N)
;
空间复杂度: O(N)
;
from sortedcontainers import SortedDict
from bisect import bisect_right, bisect_left
class SummaryRanges:
def __init__(self):
self.ret = SortedDict() # {l: r}
# 加入首尾两个哨兵,防止区间不存在的情况,这样会徒增很多判断
self.ret[-10] = -10
self.ret[10010] = 10010
def addNum(self, val: int) -> None:
ret = self.ret
L = list(self.ret.keys())
R = list(self.ret.values())
# 二分找出 val 的相邻区间
idx = bisect_left(L, val) # idx = ret.bisect_left(val)
pre = L[idx - 1], R[idx - 1]
nxt = L[idx], R[idx]
if pre[0] <= val <= pre[1] or nxt[0] <= val <= nxt[1]: # 情况1
pass
elif pre[1] + 1 == val == nxt[0] - 1: # 情况4
ret.pop(nxt[0])
ret[pre[0]] = nxt[1]
elif pre[1] + 1 == val: # 情况2
ret[pre[0]] = val
elif nxt[0] - 1 == val: # 情况3
ret.pop(nxt[0])
ret[val] = nxt[1]
else: # 情况5
ret[val] = val
def getIntervals(self) -> List[List[int]]:
return list(self.ret.items())[1:-1] # 去除两个哨兵
上面的代码中用到了 SortedDict
,示例:
>>> d = SortedDict()
>>> d[3] = 33
>>> d[2] = 22
>>> d[4] = 44
>>> d[6] = 66
>>> d[7] = 77
>>> d
SortedDict({2: 22, 3: 33, 4: 44, 6: 66, 7: 77})
>>> d.bisect_left(4) # 二分查找返回的是插入位置
2
>>> d.bisect_right(4) # left 和 right 的区别是如果插入值已存在,则 left 会插到前面,right 会插到后面
3