第三部分 计算广告关键技术
第9章 计算广告技术概览
- 计算广告系统架构
广告系统最核心的驱动力:数据的记录、交易、流转、建模和使用。
- 广告投放引擎
- 广告投放机(ad server)
接受广告前端Web服务器发来的请求,完成广告投放策略并返回最后页面片段的主逻辑
- 广告检索(ad retieval)
在线时根据用户标签(user attributes)与页面标签(page attributes)从广告索引(ad index)中查找符合条件的广告候选。
- 广告排序(ad ranking)
在线高效的计算广告的eCPM,并进行排序的模块。
- 收益管理(yield managerment)
将局部广告排序的结果进一步调整,以全局收益最优为目的做调整的功能。用到离线计算好的某种分配计划来完成在线时的决策
- 广告请求接口
广告请求可能来自基于HTTP的Web服务器,也可能来自于移动App内的SDK,或者其他类型的API接口。
- 定制化用户划分(customized audience segmentation)
从广告主处收集用户信息的产品接口,进过较复杂的加工,经过数据高速公路导入受众定向模块来完成。
- 数据高速公路
将在线投放的数据实时传输到离线分布式计算平台与类计算平台上,共后续处理和建模使用。
- 离线数据处理
- 用户会话日志生成
从各个渠道收集的日志先整理程以用户ID为键的统一存储格式,为了让后续的受众定向过程更急i啊简单高效
- 行为定向(behavioral targting)
完成挖掘用户日志,根据日志中的行为给用户打上结构化标签库(structural label base),并将结果存储在用户标签的在线缓冲中,工广告投放机使用。
- 上下文定向( contextual targeting)负责给上下文页面打上标签
- 点击率建模(click modeling)在分布计算平台上训练得到点击率的模型参数和相应特征,加载到换成中供线上投放使用。
- 分配规划(planning)根据广告系统全局优化的具体需求,得到使用线上执行的分配方案
- 商业智能(business intelligence,BI)系统
- 广告管理系统:广告操作者
- 在线数据处理
- 在线反作弊
- 计费
- 在线行为反馈
- 实时引起
第10章 基础知识准备
- 信息检索(Information Retrieval,IR)
检索加排序两段的决策过程
- 最优化(Optimization)
如何用系统的方法和思路找到该目标的最优解
- 机器学习(Machine Learning,ML)
用数据或先验知识优化计算算法的效果
第11章 合约广告核心技术
- 广告排期系统
广告排期系统是将广告素材安装预先确定的排期直接插入媒体页面,当一些横幅广告位上没有广告位合约,需要用其他服务器动态决策广告补足。
- 担保式投送系统
在线投放引擎接受用户触发的广告请求,根据用户标签和上下文标签找到可以匹配的广告合约,然后由在线分配模块决定本次展示投放哪个广告。
- 流量预测
根据定向条件和出价估计广告展示量,以辅助广告主做进行决策。
- 频次控制
某个用户在一段时间内看到某个或某组广告的曝光次数。
- 在线分配
通过对每一次广告展示进行实时在线决策,从而达到满足某些量的约束的前提下,优化广告产品整体收益的过程。
第12章 受众定向核心技术
- 受众定向技术分类
用户标签:用户历史行为数据为依据,为用户打上的标签
上下文标签:根据用户当前的访问行为得到的即时标签
定制化标签:广告主定制化标签
- 上下文定向
关键词提取
- 行为定向
根据某用户一段时期内的各种网络行为,将该用户映射到某个定向标签。
- 人口属性预测
以用户行为为基础自动预测其人口属性
第13章 竞价广告核心技术
- 搜索广告系统
对每次展示的各个候选,根据查询估计其点击率,并乘以广告主出的点击单价得到eCPM,再按此排序即可。
搜索广告算法上最关键的技术是点击率预测,其次是查询词的扩展。
- 广告网络
决策过程:服务器接受前端用户访问触发的广告请求,首先根据上下文信息和用户身份标识从页面标签和用户标签中查出相应的上下文标签和用户标签;然后用这些标签以及其他一些广告请求条件从广告索引中找到合符要求的广告候选集合,最后,利用CTR预估模型计算所有的广告候选的eCPM,再根据eCPM排序选出赢得竞价的广告,并返回给前端完成投放。
- 点击率预测
将要展示的广告a和一个展示过的广告类似,可以预估a的点击率与展示过的广告接近。
第14章 程序化交易核心技术
供给方的功能简单的比价平台,而需求方开始承担广告决策的主要职责。