Make Realtime Predictions from your Autopilot generated model

标题: “从我们的 Autopilot 生成的模型进行实时预测” 权重: 326

一旦我们训练好模型并部署了实时端点,我们就可以使用它进行预测。

在我们的示例中,我们将克隆一个公共存储库,并使用 Jupyter Notebook 执行推理。

克隆存储库

我们可以从终端或内置的 Git 界面克隆存储库。选择以下选项之一来克隆推理笔记本从存储库。

从终端克隆

  1. 在 Studio 中,单击文件 -> 新建启动器
  2. 图像终端面板上单击加号
  3. 在打开的终端中输入
git clone https://github.com/aws-samples/unified-data-prep-and-model-training

输入上述命令后,我们已经将存储库克隆(复制)到本地 Studio 文件系统。

直接从 Studio UI 克隆

  1. 在 Studio 中,单击Git菜单项,然后选择克隆存储库

  1. 在弹出的 Git 存储库对话框中输入https://github.com/aws-samples/unified-data-prep-and-model-training,然后单击克隆按钮。

单击克隆按钮后,我们已经将存储库克隆(复制)到本地 Studio 文件系统。

打开克隆的笔记本


3. 单击侧面板中的文件夹图标打开文件浏览器。


我们应该看到unified-data-prep-and-model-training文件夹。


4. 双击unified-data-prep-and-model-training打开amazon-sagemaker-examples文件夹。



5. 双击打开inference_invocation.ipynb。当出现设置笔记本环境对话框时,输入:

  • 对于镜像,选择Data Science 2
  • 保留所有其他默认值。
  • 单击选择

配置运行推理所需的变量

设置好在笔记本中运行的代码后,我们需要配置两个变量:

  • endpoint_name
  • payload_str

配置 endpoint_name

endpoint_name 代表自动创建的实时推理端点的名称。在设置它之前,我们需要找到它的名称。

  1. 从 SageMaker 资源下拉菜单中选择端点


2. 找到名称带有我们创建的 Autopilot 作业名称加上随机字符串的端点。


3. 单击端点名称。

端点详细信息页面出现。


4. 突出显示完整的端点名称,然后按 Ctrl+C 将其复制到剪贴板。

  1. 将此值(确保加引号)粘贴到推理笔记本中的 endpoint_name

配置 payload_str

payload_str 将包含推理请求。有效的 payload_str 值可以通过将源(原始,未转换)CSV 导入 Excel,删除 is_canceled 列(因为我们在没有目标列的情况下进行推理请求),然后将 CSV 另存为 validation_set.csv 来获得。

我们现在可以从 validation_set.csv 中取一行,并将其用于 payload_str 来执行推理。一个可以使用的示例 payload_str 变量是:

Resort Hotel,342,2015,July,27,1,0,0,2,0,0,BB,PRT,Direct,Direct,0,0,0,C,C,3,No Deposit,NULL,NULL,0,Transient,0,0,0,Check-Out,2015-07-01

这应该会返回类似于:

b'false,0.00015823285502847284\n'

在响应中,第一个列表值是 true(将取消)或 false(不会取消)。第二个值是正类的概率。