吴良超的学习笔记

User Experience Optimization:From Heuristic Intervention to Unified Value Modeling

发表于 2025-12-07 标签计算广告，机器学习，推荐

In the evolution of Search, Ads, and Recommendation systems, User Experience (UX) is an unavoidable core challenge. In this article, we quantify UX as LT (Life Time), specifically referring to user retention (e.g., the number of days a user opens the app within a 7-day window).

Unlike pure content recommendation, which seeks to maximize total watch time, optimization in commercial or marketing-oriented sectors (Ads, E-commerce, Live Streaming) is about maximizing business value (Cost, GMV, etc.) while staying above a "UX Redline." More accurately, it is about maximizing the efficiency of exchanging "Unit LT" for "Business Metrics."

We typically use Holdout Experiments (Reverse Experiments) to measure how a business strategy affects LT. The factors influencing these results are multifaceted:

Explicit Factors: These are the most direct and well-known, involving the position and density of business items (e.g., start_pos, gap, load).
Implicit Factors: Supply quality and ranking accuracy. The quality and diversity of ad creatives or live-streaming content determine the appeal of the distribution queue. If supply is insufficient or ranking is inaccurate, users are less likely to be attracted to the platform.
Opportunity Cost (Backfill Logic): A frequently overlooked point. A holdout experiment compares the "Business Queue" with a "Backfill Queue" (usually the organic recommendation queue). The final impact on LT is essentially:

\[\Delta LT = LT_{Business} - LT_{Backfill}\]

The negative impact on LT is minimized only when the business content is as attractive as—or more attractive than—the organic content it replaces.

While improving supply and ranking accuracy are the fundamental drivers for LT, they take time to yield results. In day-to-day engineering, adjusting load, start pos, and gap remains the most immediate lever. Furthermore, we must establish strict defensive mechanisms to prevent short-term gains from masking long-term, cumulative UX damage.

This article explores the evolution of UX optimization through three stages: Short-term Defense (Heuristic Protection), Mid-term Tuning (Experience Modeling), and Long-term Alignment (Unified Value Modeling).

阅读全文 »

出海、选择与 “弯路”

发表于 2025-10-05 标签闲话几句

许多人大概都读过这段充满宿命感的话：

当你老了，回顾一生，就会发觉：什么时候出国读书、什么时候决定做第一份职业、何时选定了对象而恋爱、什么时候结婚、其实都是命运的巨变。只是站在三岔路口，眼见风云千樯，你作出抉择的那一日，在日记上，相当沉闷和平凡，当时还以为是生命中普通的一天

这段自出《杀鹌鹑的少女》的文字，具象化了选择的厚重感。而事实上，很多 “当时只道是寻常” 的瞬间，确实会这个名为 “人生” 的游戏开辟很多新的分支。最近几天在玩 Detroit: Become Human 这款游戏，通过三个仿生人（androids）徐徐展开讲述了一个有关人工智能、科技、伦理、人性的故事，而故事的结局是由你在游戏中的种种抉择所决定的，你的一个不经意的选择，可能会掀起一场人类与仿生人的流血革命

都说选择大于努力，我们特别擅长拿着后视镜去度量一个选择的 “好” 与 “坏”。因为我们没有上帝视角去获取整个游戏的 FlowChart，去看到那些未选择之路种种；更要命的是，我们在当前已选择的道路上的任何操作无法撤销或回滚，当最终的结果不太如人意时，就会在事后复盘时被打上一个 “走了弯路” 的标签，然后幻想那条未选择的道路所拓展出来的分支

最近就面临着一个关于出海的选择，一直觉得出海是国内企业发展的未来，但是真正面临这样的选择时，也少不了瞻前顾后、忧心忡忡，总想小心翼翼地迈出下一步，希望少走 “弯路”。脑子里的各种观点打架打了好多天，我觉得是时候写一篇文章来梳理一些这个迷思了。本文是关于出海和选择的一些碎碎念，祝开卷有益～

阅读全文 »

Attention Is All You Have

发表于 2025-10-03 标签闲话几句

2017 年，《Attention Is All You Need》悄然问世，带来了 Transformer 的架构，这个此后被搜广推领域广泛应用、并成为后来掀起新一轮 AI 革命的 LLM 的基石。Transformer 让机器拥有了某种 “超级注意力”：一种可以并行处理全局信息、计算序列中所有元素关联权重的强大机制。它不需要像人类一样逐字逐句地阅读和理解，而是可以一瞬间 “看到” 全部，并找出其中最关键的连接

但是一个巨大的悖论和困境正在上演。人类创造了看似拥有 “无限可扩展注意力” 的机器，但人类自身所拥有的，却是一套古老而有限的生物注意力系统。机器的核心是 “更多、更快、更全局”，而人类的核心是 “选择、聚焦、做减法”。我们正用着自己这套需要休息、会疲劳、极易分心的心智系统，去对抗一个由 “超级注意力” 算法驱动的、旨在无限捕获我们注意力的科技环境

对于碳基生物而言，更加残酷的一个事实是 "Attention Is All You Have"。因为对人类来说，注意力是与生俱来、且每日额度恒定的核心生命资产。而这唯一的货币投向何处，你的生命就投资何处，最终也将到达何处。我们一直在说 “人是环境的产物”，究其原因，也许是人在某个环境中，不得不将其的注意力倾注到这个环境设定的规则里最关注的事情，进而决定了人将变为何种产物

如果说注意力是人最宝贵的财富，那如何保护自己的注意力便是一个值得探讨的命题。本文尝试对这部分展开一些探索，包括人的注意力为何是有限的，这少得可怜的注意力在当下的注意力经济中是如何被各种争夺，以及如何构建自己的注意力框架。本文是笔者最近感觉自我工作效率低下后的一次寻根问底求法的过程，祝开卷有益～

阅读全文 »

搜索相关性：从建模到排序机制

发表于 2025-07-20 标签计算广告，机器学习，搜索

最近一段时间在研究搜索的相关性问题，一个颇有搜索特色的问题。搜索场景下的相关性，指的是展示给用户的内容，跟用户输入的 query 必须满足一定的关联关系，比如说搜 “肯德基”，就不应该出现 “麦当劳” 的内容

不同于在 feed 场景下，用户对内容基本无预期，feed 场景的推荐算法可以基于用户历史浏览兴趣、最近热点内容等做 exploit，或是通过探索用户的一些新兴趣做 explore。但在 search 场景下，用户主动搜索输入的 query 往往是有强意图的，出的内容也是要符合用户的这个预期的，否则这些搜索就是无效的，进而会造成搜索留存（LT）的损失。而在用户视角下，如果平台搜索的算法做得足够好，应该在第一页就能够找到自己想要的内容，而这这其实也导致了单 pv 下 search 浏览深度会远比 feed 要低

场景上的差异，会导致 search 相较于 feed 的优化目标也有不小差异。比如说搜索 LT 的度量中，时长并不是最重要的指标；从排序角度，增加了相关性的约束，导致特定 query 下可被用来排序的候选有限（相较于 feed），同时排序公式中往往也要加入相关性因子来达成相关性目标，对最大化原目标（如广告就是收入）的效率造成干扰

排序的相关性约束，也是导致了很多在 feed 下有效的 ranking 迭代，在 search 中效果不优甚至无效的原因，比如说这个问题里提到的现象为什么搜索系统技术文章很少，但推荐系统技术文章很多？，一个很重要的原因是给定 query，相关性候选不足导致了 ranking 搜索空间不足，而 ranking 本身的收益应该是随着候选量增加的边际效率是递增的

本文主要探讨下搜索场景下的相关性问题的解决思路。如果粗略地划分，相关性往往会涉及到两部分：相关性的建模，以及相关性模型预估分的作用机制，本文尝试对这部分的内容详细展开做一些讨论

阅读全文 »

工作、体制化与自由

发表于 2025-05-03 标签闲话几句

最近一段时间很忙，忙到整个大脑带宽被打满、回到出租屋只想躺平放空，或是忍不住无意义的刷短视频；忙到觉得自己工种变了（变成了一个消防员，天天在救火）；忙到甚至没有没时间去做更长期规划；能明显感觉到自己的词汇量、语义精度、表达能力和表达欲在迅速下降，同时自我对知识、对他人、对世界的好奇心和热情，似乎正在被浇灭。人身处其中的时候也许并不觉得有什么大碍，因为已经被 “体制化” 了，但一旦有更长的空闲时间，开始做 “上帝会发笑” 的行为，就能愈发感觉到了这种状态的恐怖之处，我觉得可能是时候给自己做个诊断了，于是有了这篇文章

本文主要是对最近一些经历和疑惑的碎碎念，以及试图求得其中的破解之法；涉及工作、情绪、短视频、以及自由的追求，文章极度发散，内容极度主观，就是一个情绪出口和以及写给自己的心理按摩，如果你愿意看，那祝开卷有益～

阅读全文 »

一起这种艺术

发表于 2025-03-12 标签闲话几句

文章的源起，是在深入了解听过 n 次但选择性忽略了歌词里所诉说的故事的《远在咫尺》后，对最后那句 “一起这种艺术，若果只是漫长忍让，应感激终身的伴侣” 颇有感触，把储藏在脑子里的很多零散的观点拽出来了，只是这些观点现在也是凌乱不堪，所以尝试通过这篇文章来 connect the dots

本文尝试对 “爱情” 这一命题展开一些探讨，涵盖 “心动” 的源起、人来人往的 “投射与认同” 游戏、已经是标品的相亲流程、以及 “一起” 的这种艺术，内容依旧是随心所欲的发散，祝开卷有益～

阅读全文 »

大模型技术报告解读

发表于 2025-02-23 标签机器学习，深度学习， LLM

今年的春节，deepseek 把大模型的讨论热度推向了高潮，即使是在十八线小城的年味里，也藏着些意料之外的科技褶皱。表妹用方言对着手机喊 “给俺写段拜年词”，小侄子在忙着跟豆包里的声音温柔、善解人意的 “校花” 聊天，连巷口的春联摊主都学会了用生成式设计定制烫金纹样 —— 这些烟火气里的数字涟漪，像一场无声的启蒙运动，将 “大模型” 三个字编织进了这座十八线小城的毛细血管

两年前的 AI 还像一座青铜巨像，吞吐数据时浑身震颤着算力的轰鸣，只能在北上广深的数据中心里吞吐星辰；而今的大模型已化作游走的溪流，沿着 5G 基站浸润到县城修车铺的扫码系统、揉进快手主播的方言脚本，甚至蛰伏在老人机的语音助手里咳嗽一声提醒吃药。从 “暴力美学” 的千亿参数军备竞赛，到 MoE 架构轻巧切开算力蛋糕的刀锋，从耗资数千万美元的实验室贵族，到 DeepSeek-R1 用 600 万美元训练成本撕开的平民入场券 —— 这场进化不仅是技术的跃迁，更是科技叙事从 “神坛独白” 转向 “人间对话” 的隐喻：当大模型学会在显卡残骸上跳成本最优化的芭蕾，技术的毛细血管终于触到了烟火人间的心跳

阅读全文 »

adload 约束下的混排价值最大化

发表于 2025-01-19 标签计算广告，机器学习

之前写的混排文章，主要介绍了《Ads Allocation in Feed via Constrained Optimization》里的基本做法，同时拓展讨论了混排中的一些开放性问题，这篇 paper 解决的问题是 request 维度的插入规则，但是没有考虑到一些比较实际的约束如 adload，即出广告的比例是有限的

而如果考虑到 adload 的约束，就不能只考虑 request 内的价值比较了，而是要考虑到 request 之间或者说 session 维度的价值最大化了，如在某些高价值请求上多出，低价值请求上少出或不出，以此达到 adload 约束下收入最大化。这篇 paper《Hierarchically Constrained Adaptive Ad Exposure in Feeds》为这个问题提供了一个解决思路；paper 整体做法还是 beam search 和 generator+evaluator 的混排范式，但是在这个过程中会把整体约束考虑到这个在线的求解过程中；相较于常规做法把控 adload 独立在混排之外，是一个比较好的思路，值得一读～

阅读全文 »

Multi-channel Budget Allocation and Bidding

发表于 2024-12-22 标签计算广告，机器学习

最近一段时间在研究 multi-channel bidding 的问题，套用 Google Ads 的 Power More Conversions and Value through Cross-Channel Bid Optimization 是这么定义这个问题的

Traditionally, advertisers have applied automated bidding to campaigns that target a single channel. For example, they might use a bid strategy that maximizes conversion value on separate campaigns for Search, Display, and Video. But there are limitations to this siloed approach. But multi-channel bid optimization can help you to drive better results compared to single-channel bid optimization by maximizing marginal CPA or ROAS in each and every auction

简单来说，就是一个计划在更多流量位上同时投放，能够更好优化预算的边际收益（marginal CPA or ROAS），这个也很好理解，因为有了更丰富的流量库存，同一笔预算效率理论上是能做到更优的；这跟国内当前各个媒体平台近年提的 “通投”、“全站投放” 等产品，本质上也是类似的。这类产品广告主提供了使用门槛更低的产品，省去了广告主在不同 channel 分配预算或设置出价的过程，同时平台能够通过算法能力把预算的效率变得更高

从技术视角上来看，这里的 multi-channel 有两个问题值得讨论

（1）统一出价是否是最优的？如果不是，分 channel 出价要怎么做
（2）预算是否要显式分配到各个 channel

上面讨论的 multi-channel 的例子都是在一个大的平台下的 channel，这种情况下各 channel 的预算和出价是比较容易共享的；而另外一个常见的 multi-channel 的定义是跨平台的，比如说很多广告主会同时在 google 和 meta 两个 channel 投放，这个时候显然预算和出价是不能共享的；那站在广告主的视角下，怎么分配是最优的也是一个值得讨论的问题

本文主要讨论前者，即在同一平台的多个 channel 同时投放时，budget allocation 和 bidding 的相关问题；同时会提一下在不同平台（channel）投放时的一些研究，祝开卷有益～

阅读全文 »

爬过第二座山

发表于 2024-10-03 标签闲话几句，读书

最近听了情感播客《面基》的两期关于中年的播客：《中年，人生的第二座山》和《中年之路上的四种觉醒》后，也看了提及的几本相关的书:《第二座山》、《中年之路》、《中年觉醒》以及一些研究报告；颇有感触，想写点东西来记录一下，于是有了这篇文章

每次读到这类内容，都会有一种错觉，似乎听完后就可以合理化自己躺平，给自己不努力找一个借口；因为一命二运三风水、命运无常，在随机性面前的我们似乎无能为力（比较扎心的是，这的确是一个不争的事实）；但这并不意味着我们要躺平，原因在之前写的《做一个清醒的傻瓜》中也提到了：“在努力还没达到一定程度前，我们连面对随机性的机会都没有，或者说幸存者偏差也是有门槛的，当你的能力不足时，进入决赛圈的资格都没有”

本文是写给自己的心理按摩，是为了让自己在 “尽人事” 后，能够更坦然地 “听天命”；是为了能在面对人生的第二座山的时候，能够更加从容；祝开卷有益～

阅读全文 »