IJCAI 2021丨时间序列相关研究论文汇总
国际人工智能联合会议 IJCAI(International Joint Conference on Artificial Intelligence)主要由国际人工智能联合会议组织和东道国国家人工智能学会联合主办(每两年举行一次),旨在通过会议记录、书籍、录像和教材的方式传播人工智能在会议上提出了尖端的科学成果。被中国计算机协会 CCF 推荐为 A类会议。
IJCAI 2021 论文接收成果:共收到 4204 篇投稿,其中 587 篇论文被接收,接收率为 13.9%。相比于 IJCAI 2020 接受率 12.6%(592/4717)有所上升。
本文主要梳理下 IJCAI 2021 中 Main Track & Survey Papers & Journal Papers 的时间序列相关前沿研究成果,主要方向包括:时间序列预测,时间序列分类,时序因果挖掘,多元时序分析,时序表示学习等。
01
论文标题 Time-Aware Multi-Scale RNNs for Time Series Modeling
论文地址 https://www.ijcai.org/proceedings/2021/315
源码链接 https://github.com/qianlima-lab/TAMS-RNNs
主要内容 多尺度信息对于建模时间序列至关重要。尽管大多数现有方法考虑了时间序列数据中的多个尺度,但它们假设各种尺度对每个样本都同等重要,因此无法捕捉时间序列的动态时间模式。为此,我们提出了时间感知多尺度循环神经网络 (TAMS-RNNs),它可以解开不同尺度的表示,并在每个时间步为每个样本自适应地选择最重要的尺度。首先,将 RNN 的隐藏状态解开为多个独立更新的小隐藏状态,它们使用不同的更新频率对时间序列多尺度信息进行建模。然后,在每个时间步,使用时间上下文信息来调制不同尺度的特征,选择最重要的时间序列尺度。因此,所提出的模型可以在每个时间步自适应地捕获每个时间序列的多尺度信息。大量实验表明,该模型在多元时间序列分类和人体运动预测任务上优于最先进的方法。此外,音乐流派识别的可视化分析验证了模型的有效性。
02
论文标题 Time-Series Representation Learning via Temporal and Contextual Contrasting
论文地址 https://www.ijcai.org/proceedings/2021/324
源码链接 https://github.com/emadeldeen24/TS-TCC
主要内容 从具有时间动态的未标记时间序列数据中学习体面的表示是一项非常具有挑战性的任务。在本文中,我们通过时间和上下文对比(TS-TCC)提出了一个无监督的时间序列表示学习框架,从未标记的数据中学习时间序列表示。首先,通过使用弱增强和强增强将原始时间序列数据转换为两个不同但相关的视图。其次,我们提出了一种新颖的时间对比模块,通过设计一个艰难的跨视图预测任务来学习鲁棒的时间表示。最后,为了进一步学习判别表示,我们提出了一个基于时间对比模块的上下文的上下文对比模块。它试图最大化同一样本的不同上下文之间的相似性,同时最小化不同样本的上下文之间的相似性。已经在三个真实世界的时间序列数据集上进行了实验。结果表明,在我们提出的 TS-TCC 学习的特征之上训练线性分类器的性能与监督训练相当。此外,我们提出的 TS-TCC 在少标记数据和迁移学习场景中显示出高效率。
03
论文标题 Adversarial Spectral Kernel Matching for Unsupervised Time Series Domain Adaptation
论文地址 https://www.ijcai.org/proceedings/2021/378
源码链接 https://github.com/jarheadjoe/Adv-spec-ker-matching
主要内容 无监督域自适应(UDA)由于不需要目标域中的标签而受到越来越多的关注。大多数现有的 UDA 方法通过最小化域之间特定度量计算的差异距离来学习域不变特征。然而,这些基于差异的方法不能稳健地应用于无监督时间序列域适应 (UTSDA)。这是因为这些方法中的差异度量仅包含低阶和局部统计量,它们对时间序列分布的表达有限,因此导致域匹配失败。实际上,现实世界的时间序列总是非局部分布,即具有非平稳和非单调统计。在本文中,我们提出了一种对抗性频谱核匹配 (AdvSKM) 方法,其中专门设计了一个混合频谱核网络作为内部内核,以改革 UTSDA 的最大平均差异 (MMD) 度量。混合谱核网络可以精确表征时间序列分布中的非平稳和非单调统计量。将混合谱核网络嵌入到 MMD 中不仅可以保证精确的差异度量,而且有利于域匹配。此外,谱核网络的可微架构使对抗核学习成为可能,这为差异匹配带来了更多的判别性表达。对几个真实世界 UTSDA 任务的大量实验结果验证了我们提出的方法的有效性。
04
论文标题 Two Birds with One Stone: Series Saliency for Accurate and Interpretable Multivariate Time Series Forecasting
论文地址 https://www.ijcai.org/proceedings/2021/397
源码链接 暂未开源
主要内容 执行准确且可解释的时间序列预测既重要又具有挑战性。 尽管深度学习方法可以提高预测准确性,但它们通常会牺牲可解释性。 在本文中,我们提出了一种新的序列显着性方案,以提高准确性和可解释性。 通过从时间序列的滑动窗口中提取序列图像,我们将序列显着性设计为在序列图像与其扰动版本之间具有可学习掩码的混合策略。 系列显着性与模型无关,可作为一种自适应数据增强方法来训练深度模型。 此外,通过稍微改变目标,我们优化了序列显着性,以在特征和时间维度上找到可解释预测的掩码。 在几个真实数据集上的实验结果表明,序列显着性对于产生准确的时间序列预测结果以及生成时间解释是有效的。
05
论文标题 TE-ESN: Time Encoding Echo State Network for Prediction Based on Irregularly Sampled Time Series Data
论文地址 https://www.ijcai.org/proceedings/2021/414
源码链接 暂未开源
主要内容 基于不规则采样时间序列 (ISTS) 的预测在实际应用中受到广泛关注。为了更准确的预测,方法最好能掌握更多的数据特征。 ISTS不同于普通时间序列,其特点是序列内时间间隔不规则,序列间采样率不同。然而,由于在对这两个特征进行建模时人为地在时间序列中引入了新的依赖关系以及在时间序列之间有偏见地学习关系,现有的方法具有次优的预测。在这项工作中,我们提出了一种新颖的时间编码 (TE) 机制。 TE 可以将时间信息作为时间向量嵌入到复数域中。它具有不同采样率下的绝对距离和相对距离的特性,有助于表示两种不规则性。同时,我们创建了一个名为时间编码回波状态网络 (TE-ESN) 的新模型。它是第一个可以处理 ISTS 数据的基于 ESN 的模型。此外,TE-ESN 结合了长短期记忆和系列融合来掌握横向和纵向的关系。在一个混沌系统和三个真实世界数据集上的实验表明,TE-ESN 的性能优于所有基线,并且具有更好的储层特性。
06
论文标题 Multi-series Time-aware Sequence Partitioning for Disease Progression Modeling
论文地址 https://www.ijcai.org/proceedings/2021/493
源码链接 暂未开源
主要内容 电子医疗记录 (EHR) 是患者数据的综合纵向集合,在建模疾病进展以促进临床决策方面发挥着关键作用。基于 EHR,在这项工作中,我们专注于败血症——一种可以从几乎所有类型的感染(例如流感、肺炎)发展而来的广泛综合征。败血症的症状,如心率加快、发烧和呼吸急促,是其他疾病的模糊和常见症状,这使得对其进展的建模极具挑战性。受最近一种新型子序列聚类方法的成功启发:基于 Toeplitz 逆协方差的聚类 (TICC),我们将脓毒症进展建模为子序列划分问题,并提出了多序列时间感知 TICC (MT-TICC),其中包含EHR 的多系列性质和不规则时间间隔。 MT-TICC 的有效性首先通过案例研究得到验证,该案例研究使用带有真实标签的真实世界手势数据集。然后我们进一步将其应用于使用 EHR 的败血症进展建模。结果表明,MT-TICC 可以显着优于竞争性基线模型,包括 TICC。更重要的是,它揭示了可解释的模式,这为更好地理解败血症的进展提供了一些启示。
07
论文标题 Time Series Data Augmentation for Deep Learning: A Survey
论文地址 https://www.ijcai.org/proceedings/2021/631
源码链接 暂未开源
主要内容 深度学习最近在许多时间序列分析任务上表现非常出色。深度神经网络的优越性能很大程度上依赖于大量的训练数据来避免过拟合。然而,许多现实世界时间序列应用的标记数据可能会受到限制,例如医学时间序列中的分类和 AIOps 中的异常检测。作为提高训练数据规模和质量的有效方法,数据增强对于深度学习模型在时间序列数据上的成功应用至关重要。在本文中,我们系统地回顾了时间序列的不同数据增强方法。我们为所审查的方法提出了一个分类法,然后通过突出它们的优点和局限性来对这些方法进行结构化审查。我们还根据经验比较了不同任务的不同数据增强方法,包括时间序列分类、异常检测和预测。最后,我们讨论并强调了五个未来方向,以提供有用的研究指导。
08
论文标题 Uncertain Time Series Classification
论文地址 https://www.ijcai.org/proceedings/2021/683
源码链接 https://github.com/frankl1/ustc
主要内容 在过去的十年中,时间序列分析在医学、物理学和工业等广泛领域中有着广泛的应用,引起了人们的广泛兴趣。 随着越来越有效的方法的发展,时间序列分类领域最近特别活跃。 然而,现有方法假设输入时间序列没有不确定性。 然而,在某些应用中,不确定性非常重要以至于不能被忽视。 该项目旨在为不确定的时间序列构建高效、稳健且可解释的分类方法。
09
论文标题 Learning Temporal Causal Sequence Relationships from Real-Time Time-Series
论文地址 https://arxiv.org/abs/1905.12262
源码链接 暂未开源
主要内容 我们的目标是挖掘解释时间序列轨迹中观察到的事件(后果)的时间因果序列。 时间序列中关键事件的因果解释在设计调试、异常检测、规划、根本原因分析等方面都有应用。 我们利用决策树和区间算法来挖掘解释时间序列中定义事件的序列。 我们提出修改后的决策树构建指标来处理由时间维度引入的非确定性。 挖掘的序列以易于解释的可读时间逻辑语言表示。 通过各种示例说明了所提出方法的应用。