Skip to content

推荐系统简介

基本概念

小红书的转化流程:

IMAGE_1742307834672

短期指标

IMAGE_1742307967773

  • 点击率:点击次数 / 曝光次数
    • 不能唯点击率,不然骗点击就会泛滥
  • 点赞率
  • 收藏率
  • 转发率
  • 阅读完成率?

这些只是短期消费指标。盲目追求可能涸泽而渔。需要增加一定的多样性。

北极星指标

  • 用户规模:DAU、MAU
  • 消费:使用推荐的时长、人均阅读数量
  • 发布

北极星指标 >> 短期指标,发生冲突前者优先。

冷启动?

推荐算法的实验流程

IMAGE_1742308260607

推荐系统的链路

IMAGE_1742308305925

  • 召回:从物品数据库中取出物品
  • 粗排:小规模机器学习模型,打分
  • 精排:深度神经网络,精细打分
  • 重排:打散、重新排序

IMAGE_1742308903623

召回

IMAGE_1742308495200

排序

IMAGE_1742308558603

IMAGE_1742308648516

重排:增加多样性

IMAGE_1742308581329

  • 多样性抽样:MMR、DPP
  • 用规则打散相似的笔记。
  • 插入广告、推广、根据生态要求调整排序(不能很多美女?)

推荐系统的AB测试

  • 先做离线测试
  • 再做小流量AB测试。还可以进行模型参数的选择
  • 再增加流量
  • 最后全流量(推全

IMAGE_1742309919112

把用户随机分组,开展对照试验:

IMAGE_1742309038986

分层实验

IMAGE_1742309134749

IMAGE_1742309199808 为了最大化利用流量,需要分层实验,不同层正交、同层互斥

IMAGE_1742309320648

IMAGE_1742309448875

Holdout机制

IMAGE_1742309519876

IMAGE_1742309558613

推全和反转

IMAGE_1742309672229

IMAGE_1742309811155

IMAGE_1742309838053


Last update: 2025-03-19 17:57:13
Created: 2025-03-19 17:57:13

Comments