Search and Discovery using Feature-Level Metadata


title: “使用特征级元数据进行搜索和发现” weight: 3


在本笔记本中,您将学习如何添加特征级元数据(描述和键/值对)以改进特征的搜索和发现;您还将学习如何使用 Amazon SageMaker Studio 和 API/SDK 搜索和发现特征。

注意:本模块依赖于在模块1 中准备的数据集和创建的特征组。

关键要点

  • 使用 Feature Store,客户可以在特征组级别添加元数据。希望能够搜索和发现新特征用于其模型的数据科学家还可以在特征级别搜索信息。例如,这些信息可以包括特征的描述、最后修改日期、原始数据源、某些指标或敏感度级别。

  • 下图说明了特征组、特征和相关元数据之间的架构关系。


  • 我们将使用 Boto3 API 向特征添加元数据,包括描述和一组键/值对。

  • 我们还将使用搜索功能通过 Boto3 API 查询特征。我们还将解释用户如何使用 Amazon SageMaker Studio 轻松搜索和查询特征。使用 SageMaker 搜索和发现功能,用户可以通过简单输入几个字符立即搜索结果。

导航到笔记本

  • 导航到 amazon-sagemaker-feature-store-end-to-end-workshop Jupyter Lab 目录结构的主目录。然后导航到 02-module-working-with-offline-store 并打开笔记本 m2_nb2_feature_metadata_search_discovery.ipynb

  • 将内核设置为 Python 3 (Data Science),并选择实例为 ml.m5.4xlarge

  • 通过在每个单元格中按 Shift+Enter 执行单元格。代码运行时,方括号之间会出现一个 。几秒钟后,代码执行将完成, 将被替换为一个数字。

  • 您可以按照笔记本中的说明继续操作。