Module 3: Feature transformation and training


title: “模块 3:特征转换和训练” weight: 4


在本模块中,我们演示如何使用模块 2 中导出的特征集并创建一个机器学习模型,根据历史记录预测客户是否会重新订购产品。鉴于问题类型是有监督的二进制分类,我们将使用 SageMaker 内置算法 XGBoost 来设计这个分类器。模型训练完成后,我们还将部署经过训练的模型作为 SageMaker 端点,以进行实时推理。

我们还将使用 CSV 和 Parquet 格式的离线特征存储中导出的特征集执行批量评分。

最后,我们将更新客户特征组以添加新特征,将数据摄取到特征组中,并使用这些数据重新训练 XGBoost 模型。

注意:本模块依赖于模块 1 中准备的数据集和创建的特征组。