Update Feature Group (Optional notebook)

Here is the translation of the provided text into Chinese:


标题: “更新特征组(可选笔记本)” 权重: 4


在本笔记本中,我们说明如何使用boto3 API修改特征组,然后将数据摄取到修改后的特征组中。

特征组模式会随着新的业务需求或发现新的特征可以获得更好的模型性能而不断发展。数据科学家和机器学习工程师需要能够轻松地向现有特征组添加特征。这种能力减少了创建和维护多个特征组的开销,因此有利于迭代式机器学习模型开发。模型训练和推理可以利用新特征通过对特征组进行最小更改来使用相同的特征组。

以下图表说明了在功能商店中创建和摄取特征的过程。

注意: 本模块依赖于模块1 中准备的数据集和创建的特征组。

主要要点

  • 我们查看来自客户特征组(在模块1中创建)的现有数据,并修改客户特征组以添加"has_kids"特征。

  • 我们将摄取样本数据并验证客户记录的数据是否已摄取。

  • 我们将使用Athena查询数据集提取来准备数据集(使用SageMaker SDK以编程方式),重新训练一个类似于我们在笔记本m3_nb1_model_training.ipynb中所做的XGBoost 模型。

  • 最后,我们将通过部署新模型并针对样本测试记录进行预测来进行测试。

导航到笔记本

  • 导航到amazon-sagemaker-feature-store-end-to-end-workshop Jupyter Lab目录结构的主目录。然后导航到03-module-feature-transformation-and-training并打开笔记本m3_nb4_update_feature_group.ipynb

  • 将内核设置为Python 3(数据科学),并选择ml.t3.medium实例

  • 按Shift+Enter在每个单元格中执行代码。当代码运行时,方括号之间会出现一个*。几秒钟后,代码执行将完成,*将被替换为数字。

  • 您可以按照笔记本中的说明继续进行。