RTB Workshop

机器学习广泛应用于程序化广告,本章我们使用AWS的SageMaker服务来进行机器学习,训练模型并使用ECS进行线上推理,实现流量过滤

整体架构如下图所示,由三个主要组件组成:

高层视图

  1. ML Pipeline 组件:包括下载和准备数据、特征工程和 ML 模型的训练
  2. 数据存储:保存所有数据和生成的模型文件
  3. ECS流量过滤模块:运行 ML 模型,进行流量过滤。

ML-数据管道

为了处理大量出价(Bid)展示(Impression)数据,我们使用Amazon EMR 集群,它是从SageMaker Studio 创建出来的:

ML数据管道

数据存储

使用S3存储所有数据。用单个 S3 存储桶,使用由不同前缀分隔数据。

流量过滤组件

经过训练的模型将部署在ECS流量过滤模块。出价服务器使用模型推理,根据模型预测做出出价/不出价决策:

招标申请