0314 byte¶
FYI:我当天就被挂了。还是太菜了,统计学忘的比较多。有待加强~
面试官人很好。循循善诱,很有礼貌。
面试官先介绍了他们组的情况,在算法推荐大组里的数科组。主要关注几个方向的数分:
- UCG:评论区之类的
 - PCG:高质量内容产出者
 - 投稿
 - 。。。
 
我的简历上数科相关的简历不多,所以主要问的都是比较通用的统计学问题。
AB Test¶
给了一个具体的场景:一波人增加知识区内容推荐,另外一波对照组。
- 了解AB Test吗?
- 如何设计实验?我说对照试验
 - 如何选取metrics?我说点赞率、留存率
 
 - 如何检验知识区推荐行为是否有效?我说t检验
 - t检验怎么做?不是正态分布可以t检验吗?==> 中心极限定理
 - CLT的条件?
 - p值是什么,有何含义?原假设成立的情况下p值的分布是什么?
 - 有什么方差缩减技术?
- 我说bootstrapping
 - 这个也忘掉了
 
 - 针对GMV的比较问题,可能有很多的0,正态假设不成立了,应该如何检验?我说非参数检验
 - 非参数检验和参数检验的比较?有什么优劣?
- 同样都是大样本的情况下?我说非参数检验效力更弱
 
 - 比值类型的统计量(总点赞数/总观看数)如何的检验? ==> Delta Method
- 这个我是真忘了
 
 
因果推断¶
另外一个具体场景:版本更新是否能优化用户体验?
- 了解因果推断吗?其实不是很了解
 - 如何分析版本更新对用户体验的影响?
 - 直接回归有什么问题?【是否更新版本是0-1变量】
 
SQL¶
最后做了一个SQL题目。
| fan_id | author_id | 
|---|---|
| 1 | 1 | 
| 1 | 2 | 
| 2 | 2 | 
| 3 | 2 | 
| 4 | 1 | 
| 4 | 2 | 
每一行是每个粉丝喜欢的作者。
现在需要查询:对于每个作者,其他的作家中和他共同粉丝最多的前三位。
   最后更新: 2025-03-14 15:45:47 
创建日期: 2025-03-14 15:45:47
    创建日期: 2025-03-14 15:45:47
广告
人要恰饭的嘛🤑🤑