实验室动态

[2017 TKDE] Longest Increasing Subsequence Computation over Streaming Sequences

李友焕关于数据流上进行最长上升子序列(LIS)计算的论文(Longest Increasing Subsequence Computation over Streaming Sequences)被 TKDE 2017 录用。

这篇论文是之前李友焕发表在 VLDB 2017 的 LIS 计算论文的扩展。这篇论文仍是围绕更新代价和空间代价均为线性的四邻链表数据结构对数据流下 LIS 计算的支持。核心的扩展内容在于四邻链表对已知的所有特征限制的 LIS 计算的高效支撑。在之前 VLDB 的工作中,四邻链表能够对极值上升差和极值权重的带限制LIS计算提供高效的支持,而在 TKDE 的工作中,我们一方面考虑了极值宽度的 LIS 计算,其中宽度定义为 LIS 的首尾元素的位置距离,毕竟在趋势分析中,对宽度的限制能够体现对趋势变化的紧凑性的需求;另一方面我们针对范围限制和坡度限制的 LIS 计算在四邻链表上设计了高效的计算算法,其中范围限制是要求 LIS 每两个连续元素之间的位置距离和值差都在给定的范围内,而坡度限制则是要求 LIS 每两个相邻元素值差相对距离的商(即斜率)必须不小于给定的一个参数 m。针对范围和坡度限制的 LIS 计算与之前的极值计算有很大的区别,但在四邻链表上我们设计了很巧妙高效的计算算法,在理论结果优于已有工作的同时,还在多个数据集上的实验验证了我们算法的高效性。