11 - Resample


标题: “11 - 重采样” 权重: 13


现在,我们准备进行最终的聚合操作! 我们想要根据 PULocationIDpickup_time 列的组合来聚合所有行,同时将特征替换为每个组合的平均值。

我们使用特殊的内置时间序列转换 重采样。重采样转换将时间序列观测的频率更改为指定的粒度。它还提供了上采样和下采样的选项。应用上采样会增加观测的频率,例如从每天到每小时,而下采样会降低观测的频率,例如从每小时到每天。

要创建此转换,请按照以下步骤操作:

  • 单击转换元素集合旁边的加号,然后选择"添加转换”。
  • 在 TRANSFORMS 菜单中单击橙色的"+ 添加步骤"按钮。
  • 选择时间序列。
  • 对于"转换”,选择"重采样”。
  • 对于"时间戳”,选择 pickup_time
  • 对于"ID 列”,选择 PULocationID
  • 对于"频率单位”,选择"每小时”。
  • 对于"频率数量”,输入 1。
  • 对于"聚合数值的方法”,选择"平均值”。
  • 其余参数使用默认值。
  • 选择预览。
  • 选择添加以保存步骤。

当应用此转换到数据集时,我们可以查看到目前为止的所有步骤,并预览结果数据集。

单击"返回到数据流"以返回到块图编辑器窗口。