14 - Rolling Window


标题: “14 - 滚动窗口” 权重: 16


我们还可以计算一系列值的有意义的统计摘要,并将其作为输入特征。让我们提取常见的统计时间序列特征。数据包装器使用开源的 tsfresh 包实现了自动时间序列特征提取功能。使用时间序列特征提取转换,我们可以自动化特征提取过程。这消除了手动实现信号处理库所需的时间和精力。我们将使用滚动窗口特征转换提取特征。该方法计算由窗口大小定义的一组观测值的统计属性。

要创建此转换,请按照以下步骤操作:

  • 单击一组转换元素旁边的加号,然后选择"添加转换”。
  • 在 TRANSFORMS 菜单中单击橙色的"+ 添加步骤"按钮。
  • 选择时间序列。
  • 对于"转换”,选择"滚动窗口特征”。
  • 对于"为此列生成滚动窗口特征”,选择count
  • 对于"时间戳列”,选择pickup_time
  • 对于"ID 列”,输入PULocationID
  • 对于"窗口大小”,输入 8。我们也可以使用不同的值,例如 24 小时。
  • 选择展平以为每个计算的特征创建一个新列。
  • 将"策略"选为"最小子集”。此策略提取八个在后续分析中有用的特征。其他策略包括高效子集、自定义子集和所有特征。
  • 选择预览。
  • 选择添加以保存该步骤。

将此转换应用于数据集时,我们可以查看到目前为止的所有步骤,并预览结果数据集。

单击"返回数据流"以返回到块图编辑器窗口。