Self-Paced Lab


title: “自定进度实验室” weight: 12


如果您已经执行了上一页"Option 1. AWS 导师指导实验室"中提到的说明,则不需要执行这些步骤。

AWS 账户

为了完成此研讨会,您需要一个AWS账户,以及该账户中至少具有以下AWS服务的完全权限的AWS IAM用户:

  • Amazon SageMaker
  • AWS IAM
  • Amazon S3

**使用您自己的账户:**使用个人账户或创建一个新的AWS账户 进行此研讨会,而不要使用组织的账户,以确保您对所需的服务拥有完全访问权限,并确保您不会在研讨会结束后留下任何资源。

**成本:**作为本研讨会一部分启动的一些(但不是全部)资源符合条件免费使用AWS免费层,前提是您的账户年龄不足12个月。有关更多详细信息,请参阅AWS 免费层页面Amazon SageMaker Pricing 。为了避免在完成研讨会后产生实例、端点和其他不再需要的资源的费用,请参阅清理模块。运行整个研讨会后进行清理应产生不到5美元的费用。

**清理:**如前所述,请参阅清理模块 ,了解如何在研讨会后清理资源。

**AWS 区域:**本研讨会使用了Amazon SageMaker等其他AWS服务。我们建议在以下受支持的AWS区域之一运行此研讨会:

  • 美国:北弗吉尼亚州、俄亥俄州或俄勒冈州
  • 亚太地区:孟买、新加坡、悉尼或东京
  • 欧洲:法兰克福、爱尔兰、伦敦、米兰、巴黎或斯德哥尔摩

请访问Amazon SageMaker文档中的支持的区域和配额 ,了解完整的支持区域列表。

选择一个区域后,您应该在该区域创建本研讨会的所有资源,包括Amazon SageMaker Studio实例或新的Amazon S3存储桶。在开始之前,请确保从AWS控制台右上角的下拉菜单中选择您的区域。

**浏览器:**我们建议您使用Chrome或Firefox的最新版本来完成此研讨会。

**账户限制:**我们将在研讨会中使用大型实例,如ml.m5.4xlarge、ml.m5.xlarge和ml.m5.large。请务必查看您将在其中运行此研讨会的区域的SageMaker服务配额 。如果在本研讨会期间遇到错误消息,表明您已超出配额,则可以使用AWS Support请求提高您希望扩展的SageMaker资源的服务限制。

启动Amazon SageMaker Studio

Amazon SageMaker Studio是一个基于Web的集成开发环境(IDE),用于机器学习,可让您构建、训练、调试、部署和监控您的机器学习模型。SageMaker Studio提供了将模型从实验推向生产所需的所有工具,同时提高您的生产力。在一个统一的可视化界面中,客户可以执行以下任务:

  • 在Jupyter笔记本中编写和执行代码
  • 构建和训练机器学习模型
  • 部署模型并监控预测性能
  • 跟踪和调试机器学习实验

要使用Amazon SageMaker Studio和Amazon SageMaker Studio Notebooks,您必须使用SageMaker控制台完成下面的Studio入职流程。

  • 导航到AWS管理控制台,在搜索框中搜索SageMaker

  • 单击Amazon SageMaker Studio

  • 使用快速入门程序设置用户账户,它使用IAM身份验证。选择附加有AmazonSageMakerFullAccess策略的IAM执行角色,或创建一个新的角色。

  • 创建studio环境需要几分钟时间。Studio的状态应该显示为"就绪”。

  • 一旦studio环境创建完毕,选择用户名并单击"打开Studio”。加载页面可能需要几分钟时间,您将被重定向到Studio主页。

  • 如需更多信息,请查看Studio指南入职Studio

克隆研讨会存储库

本研讨会的代码托管在github 上。我们将使用git命令将代码下载到Studio工作区。

  • 打开一个系统终端窗口

  • 将安全的FeatureStore存储库克隆到Amazon Sagemaker Studio实例中的本地工作区。请注意:此存储库包含一个github子模块(ml-lineage-helper),某些笔记本示例必须也克隆该子模块才能正常运行。因此,运行git clone时必须包含–recursive选项,就像这样:

::code[git clone –recursive https://github.com/aws-samples/amazon-sagemaker-feature-store-end-to-end-workshop.git]

  • 如果您已经克隆了存储库并需要拉取子模块代码,可以从存储库的顶层目录运行此命令:

::code[git submodule update –init –recursive]

  • 您应该在克隆子模块期间注意到这些输出行:

Submodule ‘ml-lineage-helper’ (https://github.com/aws-samples/ml-lineage-helper.git) registered for path ‘ml-lineage-helper’ Cloning into ‘/home/sagemaker-user/workshops/amazon-sagemaker-feature-store-end-to-end-workshop/ml-lineage-helper’…

  • 检查存储库的内容,即目录结构和文件,因为您将在整个研讨会过程中需要它们。