ICDE 2021丨时间序列相关研究论文汇总

文章系列：

IEEE ICDE（IEEE International Conference on Data Engineering）是 IEEE 的旗舰会议，和 SIGMOD、VLDB 并称数据库领域三大顶会，旨在解决设计、构建、管理和评估高级数据密集型系统和应用程序中的研究问题，是研究人员、从业人员、开发人员和用户探索前沿思想并交流技术、工具和经验的领先论坛。被中国计算机协会 CCF 推荐为 A类会议。

IEEE ICDE 会议的多年平均接受率为 19.1%，暂未披露 2021 论文接收详情。

本文主要整理下 ICDE 2021 Research Track (Full & Short) & TKDE Posters 中时间序列相关研究成果。

01

论文标题 EnhanceNet: Plugin Neural Networks for Enhancing Correlated Time Series Forecasting

论文地址 https://ieeexplore.ieee.org/document/9458855

源码链接 暂未开源

主要内容 相关时间序列预测在许多网络物理系统中起着至关重要的作用，其中实体随着时间的推移相互交互。为了实现准确的预测，捕获时间动态和不同实体之间的相关性至关重要。为了捕捉前者，采用了两种流行的模型，循环神经网络 (RNN) 和时间卷积网络 (TCN)。为了捕捉后者，构建一个图来反映实体之间的某些关系，然后在图上应用图卷积（GC）来捕捉实体之间的相关性。最先进的预测精度是通过将 RNN 或 TCN 与 GC 相结合的模型来实现的。然而，它们既没有捕获不同实体之间存在的不同时间动态，也没有考虑随时间演变的实体相关性。在本文中，我们不是提出另一个新的端到端预测模型，而是提供一个框架来增强现有的预测模型，我们提出通用插件，可以轻松集成到现有解决方案中以解决这两个挑战，从而进一步提高其准确性。具体来说，我们提出了两个插件神经网络，它们能够更好地捕捉不同实体的不同时间动态和跨时间的动态实体相关性，从而提高预测精度，同时减少要学习的模型参数。在三个真实世界相关时间序列数据集上的实验结果表明，所提出的具有两个插件网络的框架能够实现上述目标。

02

论文标题 Scalable Model-Based Management of Correlated Dimensional Time Series in ModelarDB+

论文地址 https://ieeexplore.ieee.org/document/9458830

源码链接 https://github.com/skejserjensen/ModelarDB

主要内容 监控关键基础设施高质量的传感器在高采样频率越来越多但是作为它们产生大量的数据只有简单的聚合存储删除离群值和波动变化可能表明问题解决我们目前的基于模型的方法来管理与维度,利用时间序列时间序列之间的相关性, 特别是我们建议压缩组相关时间序列中使用一组可扩展的模型类型用户定义错误绑定可能零我们命名这个新的类别的基于模型的时间序列多模型组压缩方法压缩我们提出第一个方法和扩展模型类型压缩时间序列组我们建议原语为用户有效地定义组不同大小的数据集和基于这些自动分组方法只使用时间序列方面我们提出算法执行简单和多维聚合查询模型最后我们实现方法我们的评价表明，与广泛使用的格式相比，由于高压缩，modelar提供了更快的摄取，更好的压缩，由于使用模型的更快聚合的适应性和接近线性可伸缩性，它也是可扩展的，并支持在线查询处理。

03

论文标题 TS-Benchmark: A Benchmark for Time Series Databases

论文地址 https://ieeexplore.ieee.org/document/9458659

源码链接 https://github.com/timescale/tsbs

主要内容 时序数据广泛应用于供应链、库存数据分析、智能制造等场景。已经发明了许多时间序列数据库系统来管理和查询大量时间序列数据。我们观察到，现有的时间序列数据库基准测试侧重于复杂分析的工作负载，例如模式匹配和趋势预测，其性能可能受数据分析算法的影响很大，而不是后端数据库。然而，在时间序列数据库的许多实际应用中，人们更感兴趣的是数据注入吞吐量和查询处理时间等性能指标。仍然需要一个基准来广泛比较这些指标中时间序列数据库的性能。我们引入了这样一个称为 TS-Benchmark 的基准，它主要应用于风力涡轮机的设备监控场景。提出了一种基于 DCGAN 的数据生成模型，从一些实时的时间序列数据中生成大量的时间序列数据。工作负载分为三部分：数据加载（批量）、流数据注入和历史数据访问（典型查询）。我们实现了基准测试并比较了四个有代表性的时间序列数据库：InfluxDB、TimescaleDB、Druid 和 OpenTSDB。报告和分析结果。

04

论文标题 DAEMON: Unsupervised Anomaly Detection and Interpretation for Multivariate Time Series

论文地址 https://ieeexplore.ieee.org/document/9458835

源码链接

主要内容：在许多复杂系统中，设备通常受到监控并生成大量的多元时间序列。然而，由于复杂的模式和很少有用的标记数据，从这些时间序列数据中检测异常是一个巨大的挑战。现有方法要么依赖较少的正则化，要么需要大量标记数据，导致异常检测的准确性较差。为了克服这些限制，在本文中，我们提出了一种无监督的异常检测框架，称为 DAEMON（Adversarial Autoencoder Anomaly Detection Interpretation），它在各种数据集上表现出色。关键思想是使用两个鉴别器对抗性训练一个自动编码器来学习多元时间序列的正常模式，然后使用重构误差来检测异常。 DAEMON 的鲁棒性是通过隐藏变量的正则化和使用对抗生成方法重建的数据来保证的。此外，为了帮助运营商更好地诊断异常，DAEMON 提供了基于组成单变量时间序列的重构误差的异常解释。在四个真实数据集上的实验结果表明，DAEMON 可以达到 0.94 的整体 F1 分数，优于最先进的方法。此外，DAEMON 的异常解释准确率可以达到 97%。

05

论文标题 GRAB: Finding Time Series Natural Structures via A Novel Graph-based Scheme

论文地址 https://ieeexplore.ieee.org/document/9458905

源码链接

主要内容 近年来，传感器的广泛使用极大地激发了研究人员对时间序列数据挖掘的兴趣。现实世界的时间序列通常包括自然结构。例如，从患者康复应用程序中捕获的时间序列可以分为一系列动作，例如坐、站和走。寻找时间序列自然结构（即潜在语义状态）是时间序列挖掘应用中的核心子程序之一。然而，这项任务并非微不足道，因为它有两个挑战：（1）如何确定连续段之间的正确变化点，以及（2）如何将段聚类到不同的状态。在本文中，我们提出了一种新的基于图的方法，GRAB，发现时间序列的自然结构。特别是，GRAB 首先通过子序列之间的相似性将时间序列划分为一组不重叠的片段。然后，它构建一个基于片段的图，并采用图划分方法将片段聚类为状态。对真实世界数据集的大量实验证明了我们的 GRAB 方法的有效性和效率。具体来说，GRAB 可以找到高质量的潜在状态，并且在数量级上优于最先进的解决方案。

06

论文标题 An Actor-Critic Ensemble Aggregation Model for Time-Series Forecasting

论文地址 https://ieeexplore.ieee.org/document/9458798

源码链接

主要内容 集成模型被广泛用作时间序列预测中的一种有效技术，并且最近倾向于利用元学习方法，因为它们在将单个模型组合成一个集成模型方面具有公认的预测优势。然而，寻找集成聚合的最佳策略是一个开放的研究问题，特别是当集成需要实时调整时。在本文中，我们提出了一种新的元学习方法，用于聚合线性加权集成以完成时间序列预测任务。我们概述了一个深度强化学习框架，其中环境组件和目标函数的连贯设计作为我们任务中的聚合方法。在这个框架中，集成中的组合策略被建模为一个顺序决策过程，它能够捕捉时间序列中的时间行为，而 actor-critic 模型旨在学习连续动作空间中的最佳权重。对各种真实世界数据集的广泛实证研究表明，与最先进的方法以及几个基线相比，我们的方法取得了出色或相当的结果。

07

论文标题 Efficient Shapelet Discovery for Time Series Classification

论文地址 https://ieeexplore.ieee.org/document/9458803

源码链接

主要内容 时间序列 shapelet 是判别性子序列，最近发现对时间序列分类 (TSC) 有效。很明显，shapelets 的质量对 TSC 的准确性至关重要。然而，主要的研究集中在从一些 shapelet 候选者中建立准确的模型。为了确定这样的候选者，现有的研究非常简单，例如，枚举一些固定长度的子序列，或者随机选择一些子序列作为 shapelet 候选者。然后，主要的计算工作是从候选对象构建模型。在本文中，我们提出了一种新的高效 shapelet 发现方法，称为 BSPCOVER，以发现一组用于模型构建的高质量 shapelet 候选者。我们对著名的 UCR 时间序列数据集和具有代表性的最先进方法进行了广泛的实验。结果表明，BSPCOVER 将最新方法的速度提高了 70 倍以上，并且准确率通常与现有作品相当或更高。