标题: “11 - 重采样” 权重: 13
现在,我们准备进行最终的聚合操作! 我们想要根据 PULocationID
和 pickup_time
列的组合来聚合所有行,同时将特征替换为每个组合的平均值。
我们使用特殊的内置时间序列转换 重采样。重采样转换将时间序列观测的频率更改为指定的粒度。它还提供了上采样和下采样的选项。应用上采样会增加观测的频率,例如从每天到每小时,而下采样会降低观测的频率,例如从每小时到每天。
要创建此转换,请按照以下步骤操作:
pickup_time
。PULocationID
。当应用此转换到数据集时,我们可以查看到目前为止的所有步骤,并预览结果数据集。
单击"返回到数据流"以返回到块图编辑器窗口。