标题:“16 - 自动驾驶实验” 权重: 22
Amazon SageMaker Autopilot消除了构建ML模型的繁重工作,并帮助我们自动构建、训练和调整基于我们数据的最佳ML模型。使用SageMaker Autopilot,我们只需提供一个表格数据集并选择要预测的目标列,该列可以是数字(如房价,称为回归)或类别(如垃圾邮件/非垃圾邮件,称为分类)。SageMaker Autopilot将自动探索不同的解决方案,以找到最佳模型。然后,我们可以直接使用一键部署将模型部署到生产环境,或使用Amazon SageMaker Studio对推荐的解决方案进行迭代以进一步提高模型质量。
要了解更多关于SageMaker Autopilot的信息,请参考此处 的文档。
在本次会议中,我们将利用SageMaker Autopilot来利用我们之前从Data Wrangler步骤获得的输出,并并行训练和调整多个回归模型,并选择表现最佳的模型。要启动Autopilot,请转到启动器并选择中间选项以启动新的Autopilot实验(如下图所示)。在这里,我们将使用pickup_time
和PULocationID
特征来训练一个回归模型,该模型将预测给定小时该位置的行程数量。
在创建实验页面的"基本设置"下,为我们的实验提供一个名称,并选择我们想要保存我们之前从Data Wrangler步骤获得的结果的S3位置。另外,提供一个S3位置来存储Autopilot实验的结果。Autopilot会验证/转换输入数据,并将数据的中间状态存储在此位置。它还会将生成的特征转换编码器和它训练的各种预测模型存储在此位置。
最后,我们还可以选择将最佳模型部署为实时推理的端点。
在"高级设置"下,让我们将Autopilot训练的候选模型的最大数量限制为10个模型。我们这样做是为了这个研讨会。如果我们有时间执行完整的实验,我们可以让它训练所有250个模型。
在下一步中,确认部署最佳模型。
下图显示了启动Autopilot实验时的状态页面,包含所有步骤。鉴于我们只训练10个模型,整个实验应该需要大约30分钟才能完成。
我们也可以随时停止实验。