type
status
password
date
slug
summary
category
URL
tags
icon
排序模型预估点击率、点赞率、收藏率、转发率等多种分数。
网络结构
训练
损失函数
降采样
- 问题:每100次曝光,约有10次点击、90次无点击;每100次点击,约有10次收藏、90次无收藏。
- 解决⽅案:负样本降采样。保留⼀⼩部分负样本,让正负样本数量平衡,节约计算。
预估值校准
由于对负样本进行降采样,负样本变少,导致预估点击率⼤于真实点击率。
正样本、负样本数量为 和 。对负样本做降采样,采样率是 ,取得 个负样本
- 真实点击率: (期望)。
- 预估点击率: (期望)。
由上⾯两个等式可得校准公式[1]:
视频指标
播放时长
完播率
回归
分类
融合预估分
融合预估分数
多目标模型输出对点击率、点赞率、收藏率等指标的预估分数。最终用统一的融合公式将预估分合成一个排序分,对商品进行排序。
简单的加权和
视频完播率
真实案例
海外某短视频APP的融分公式
其中 是观看时长、 是点赞率。是超参数,需要人工调整。
国内某短视频APP的融分公式(快手)
根据预估时长 ,对 篇候选视频做排序。如果某视频排名第 ,则它得分
某电商的融分公式
电商的转化流程:曝光 点击 加购物车 付款。模型预估: 。最终融合分数: