在搜广推业务的演进过程中,用户体验(本文量化的方式是 LT,即用户在 APP 的留存情况,如 7 天内有几天打开了 app)是一个绕不开的核心命题。与纯内容推荐追求用户时长最大化不同,在广告、电商、直播等商业化或营销导向的业务中,用户体验优化的本质是在体验红线之下,寻求业务价值(Cost, GMV 等)的最大化;或者更准确地说,是追求单位 LT 兑换业务指标效率的最大化

通常,我们通过反转实验(Holdout Experiment)来度量业务策略对 LT 的影响。而影响反转实验 LT 指标的因素非常多:

  • 显性因素:这是最常见和为人熟知的因素,指的是对应业务的 item 在展现时的位置和密度(比如说 start pos、gap、load 等)
  • 隐性因素:供给侧的质量与排序侧的准确性。例如广告素材、直播间内容的质量与多样性,直接决定了分发队列的吸引力,都会直接影响分发的素材的多样性,进而影响用户是否会更容易被平台的内容吸引,这部分其实也跟我们系统的排序能力相关,因为除了供给需要充足,也需要准确的排序能力来把合适的内容推送给不同的用户
  • 机会成本(回填逻辑):这是常被忽略的一点。反转实验的本质是比较 “业务队列” 与 “回填队列(通常是自然推荐队列)” 的价值差异。业务策略对 LT 的最终影响,实际上等于 (业务内容的 LT) - (被挤占的自然内容的 LT)。只有当业务内容的吸引力接近甚至超过自然内容时,LT 的负向影响才会最小化

因此,虽然优质供给和精准排序是提升 LT 的根本,但其见效周期长。在实际工程迭代中,通过调控 Load、Start Pos 和 Gap 往往是影响 LT 最直接、见效最快的手段。此外,我们在追求业务增长的同时,必须建立严格的防御机制,防止因观测周期滞后,导致短期不可观测的体验受损在长期累积成巨大的负向效应。

本文将探讨用户体验优化的演进路径,将其归纳为短期防御(规则圈选)、中期调优(体验建模)与长期对齐(价值统一)三个阶段。

阅读全文 »

许多人大概都读过这段充满宿命感的话:

当你老了,回顾一生,就会发觉:什么时候出国读书、什么时候决定做第一份职业、何时选定了对象而恋爱、什么时候结婚、其实都是命运的巨变。只是站在三岔路口,眼见风云千樯,你作出抉择的那一日,在日记上,相当沉闷和平凡,当时还以为是生命中普通的一天

这段自出《杀鹌鹑的少女》的文字,具象化了选择的厚重感。而事实上,很多 “当时只道是寻常” 的瞬间,确实会这个名为 “人生” 的游戏开辟很多新的分支。最近几天在玩 Detroit: Become Human 这款游戏,通过三个仿生人(androids)徐徐展开讲述了一个有关人工智能、科技、伦理、人性的故事,而故事的结局是由你在游戏中的种种抉择所决定的,你的一个不经意的选择,可能会掀起一场人类与仿生人的流血革命

都说选择大于努力,我们特别擅长拿着后视镜去度量一个选择的 “好” 与 “坏”。因为我们没有上帝视角去获取整个游戏的 FlowChart,去看到那些未选择之路种种;更要命的是,我们在当前已选择的道路上的任何操作无法撤销或回滚,当最终的结果不太如人意时,就会在事后复盘时被打上一个 “走了弯路” 的标签,然后幻想那条未选择的道路所拓展出来的分支

最近就面临着一个关于出海的选择,一直觉得出海是国内企业发展的未来,但是真正面临这样的选择时,也少不了瞻前顾后、忧心忡忡,总想小心翼翼地迈出下一步,希望少走 “弯路”。脑子里的各种观点打架打了好多天,我觉得是时候写一篇文章来梳理一些这个迷思了。本文是关于出海和选择的一些碎碎念,祝开卷有益~

阅读全文 »

2017 年,《Attention Is All You Need》悄然问世,带来了 Transformer 的架构,这个此后被搜广推领域广泛应用、并成为后来掀起新一轮 AI 革命的 LLM 的基石。Transformer 让机器拥有了某种 “超级注意力”:一种可以并行处理全局信息、计算序列中所有元素关联权重的强大机制。它不需要像人类一样逐字逐句地阅读和理解,而是可以一瞬间 “看到” 全部,并找出其中最关键的连接

但是一个巨大的悖论和困境正在上演。人类创造了看似拥有 “无限可扩展注意力” 的机器,但人类自身所拥有的,却是一套古老而有限的生物注意力系统。机器的核心是 “更多、更快、更全局”,而人类的核心是 “选择、聚焦、做减法”。我们正用着自己这套需要休息、会疲劳、极易分心的心智系统,去对抗一个由 “超级注意力” 算法驱动的、旨在无限捕获我们注意力的科技环境

对于碳基生物而言,更加残酷的一个事实是” Attention Is All You Have”。因为对人类来说,注意力是与生俱来、且每日额度恒定的核心生命资产。而这唯一的货币投向何处,你的生命就投资何处,最终也将到达何处。我们一直在说 “人是环境的产物”,究其原因,也许是人在某个环境中,不得不将其的注意力倾注到这个环境设定的规则里最关注的事情,进而决定了人将变为何种产物

如果说注意力是人最宝贵的财富,那如何保护自己的注意力便是一个值得探讨的命题。本文尝试对这部分展开一些探索,包括人的注意力为何是有限的,这少得可怜的注意力在当下的注意力经济中是如何被各种争夺,以及如何构建自己的注意力框架。本文是笔者最近感觉自我工作效率低下后的一次寻根问底求法的过程,祝开卷有益~

阅读全文 »

Recently I’ve been researching search relevance, a problem with search-specific characteristics. Search relevance means content shown to users must satisfy certain association with user-input query. For example, searching “KFC” shouldn’t show “McDonald’s” content.

Unlike feed scenarios where users have no content expectations, feed recommendation algorithms can exploit based on user browsing history, recent hot content, etc., or explore new interests. But in search scenarios, user-initiated queries have strong intent. Returned content must match this expectation, otherwise the search is invalid, causing search retention (LT) loss. From user perspective, if platform search works well, they should find desired content on first page, leading to much lower search browsing depth per PV than feed.

Scenario differences lead to different optimization objectives for search vs feed. For example, duration isn’t the most important metric for search LT measurement. From ranking perspective, added relevance constraints mean limited candidates for ranking under specific query (compared to feed), while ranking formulas often add relevance factors to achieve relevance objectives, interfering with maximizing original objectives (like revenue for ads).

Relevance constraints in ranking are why many effective feed ranking iterations are suboptimal or ineffective in search. For example, the phenomenon mentioned in Why are there few search system tech articles but many recommendation system articles? - an important reason is given query, insufficient relevance candidates limit ranking search space, while ranking’s benefit should have increasing marginal efficiency as candidate count increases.

This article discusses solution approaches for search relevance. Roughly, relevance involves two parts: relevance modeling, and the mechanism for applying relevance model estimates. This article attempts detailed discussion of these aspects.

阅读全文 »

最近一段时间在研究搜索的相关性问题,一个颇有搜索特色的问题。搜索场景下的相关性,指的是展示给用户的内容,跟用户输入的 query 必须满足一定的关联关系,比如说搜 “肯德基”,就不应该出现 “麦当劳” 的内容

不同于在 feed 场景下,用户对内容基本无预期,feed 场景的推荐算法可以基于用户历史浏览兴趣、最近热点内容等做 exploit,或是通过探索用户的一些新兴趣做 explore。但在 search 场景下,用户主动搜索输入的 query 往往是有强意图的,出的内容也是要符合用户的这个预期的,否则这些搜索就是无效的,进而会造成搜索留存(LT)的损失。而在用户视角下,如果平台搜索的算法做得足够好,应该在第一页就能够找到自己想要的内容,而这这其实也导致了单 pv 下 search 浏览深度会远比 feed 要低

场景上的差异,会导致 search 相较于 feed 的优化目标也有不小差异。比如说搜索 LT 的度量中,时长并不是最重要的指标;从排序角度,增加了相关性的约束,导致特定 query 下可被用来排序的候选有限(相较于 feed),同时排序公式中往往也要加入相关性因子来达成相关性目标,对最大化原目标(如广告就是收入)的效率造成干扰

排序的相关性约束,也是导致了很多在 feed 下有效的 ranking 迭代,在 search 中效果不优甚至无效的原因,比如说这个问题里提到的现象 为什么搜索系统技术文章很少,但推荐系统技术文章很多?,一个很重要的原因是给定 query,相关性候选不足导致了 ranking 搜索空间不足,而 ranking 本身的收益应该是随着候选量增加的边际效率是递增的

本文主要探讨下搜索场景下的相关性问题的解决思路。如果粗略地划分,相关性往往会涉及到两部分:相关性的建模,以及相关性模型预估分的作用机制,本文尝试对这部分的内容详细展开做一些讨论

阅读全文 »

最近一段时间很忙,忙到整个大脑带宽被打满、回到出租屋只想躺平放空,或是忍不住无意义的刷短视频;忙到觉得自己工种变了(变成了一个消防员,天天在救火);忙到甚至没有没时间去做更长期规划;能明显感觉到自己的词汇量、语义精度、表达能力和表达欲在迅速下降,同时自我对知识、对他人、对世界的好奇心和热情,似乎正在被浇灭。人身处其中的时候也许并不觉得有什么大碍,因为已经被 “体制化” 了,但一旦有更长的空闲时间,开始做 “上帝会发笑” 的行为,就能愈发感觉到了这种状态的恐怖之处,我觉得可能是时候给自己做个诊断了,于是有了这篇文章

本文主要是对最近一些经历和疑惑的碎碎念,以及试图求得其中的破解之法;涉及工作、情绪、短视频、以及自由的追求,文章极度发散,内容极度主观,就是一个情绪出口和以及写给自己的心理按摩,如果你愿意看,那祝开卷有益~

阅读全文 »

文章的源起,是在深入了解听过 n 次但选择性忽略了歌词里所诉说的故事的《远在咫尺》后,对最后那句 “一起这种艺术,若果只是漫长忍让,应感激终身的伴侣” 颇有感触,把储藏在脑子里的很多零散的观点拽出来了,只是这些观点现在也是凌乱不堪,所以尝试通过这篇文章来 connect the dots

本文尝试对 “爱情” 这一命题展开一些探讨,涵盖 “心动” 的源起、人来人往的 “投射与认同” 游戏、已经是标品的相亲流程、以及 “一起” 的这种艺术,内容依旧是随心所欲的发散,祝开卷有益~

阅读全文 »

This Spring Festival, DeepSeek pushed large language model discussion to new heights. Even in an 18-tier small town’s New Year atmosphere, unexpected technological ripples were hidden. My cousin shouts dialect at her phone “Write me a New Year greeting”, my nephew chats with Douba’s gentle, understanding “school beauty”, even the alley’s Spring couplet vendor learned to customize gold-patterned designs with generative AI - these digital ripples in daily life, like a silent enlightenment movement, wove “large language models” into this small town’s capillaries.

Two years ago AI was like a bronze giant statue, trembling with computational roar when ingesting data, only able to process stellar data in first-tier city data centers. Today’s large models have become flowing streams, infiltrating along 5G base stations into county auto repair shops’ QR scan systems, kneaded into Kuaishou streamers’ dialect scripts, even hibernating in elderly phones’ voice assistants coughing once to remind medication. From “brute force aesthetics” hundred-billion parameter arms race, to MoE architecture deftly slicing computational cake, from millions-of-dollars lab aristocracy, to DeepSeek-R1 tearing open commoner admission with $6M training cost - this evolution isn’t just technological leap, but metaphor for tech narrative shifting from “monologue from the altar” to “dialogue with humanity”: when large models learn cost-optimized ballet on GPU remains, technology’s capillaries finally touched daily life’s heartbeat.

阅读全文 »

今年的春节,deepseek 把大模型的讨论热度推向了高潮,即使是在十八线小城的年味里,也藏着些意料之外的科技褶皱。表妹用方言对着手机喊 “给俺写段拜年词”,小侄子在忙着跟豆包里的声音温柔、善解人意的 “校花” 聊天,连巷口的春联摊主都学会了用生成式设计定制烫金纹样 —— 这些烟火气里的数字涟漪,像一场无声的启蒙运动,将 “大模型” 三个字编织进了这座十八线小城的毛细血管

两年前的 AI 还像一座青铜巨像,吞吐数据时浑身震颤着算力的轰鸣,只能在北上广深的数据中心里吞吐星辰;而今的大模型已化作游走的溪流,沿着 5G 基站浸润到县城修车铺的扫码系统、揉进快手主播的方言脚本,甚至蛰伏在老人机的语音助手里咳嗽一声提醒吃药。从 “暴力美学” 的千亿参数军备竞赛,到 MoE 架构轻巧切开算力蛋糕的刀锋,从耗资数千万美元的实验室贵族,到 DeepSeek-R1 用 600 万美元训练成本撕开的平民入场券 —— 这场进化不仅是技术的跃迁,更是科技叙事从 “神坛独白” 转向 “人间对话” 的隐喻:当大模型学会在显卡残骸上跳成本最优化的芭蕾,技术的毛细血管终于触到了烟火人间的心跳

阅读全文 »

The previous mix-ranking article mainly introduced the basic approach from “Ads Allocation in Feed via Constrained Optimization” and extended the discussion to open problems in mix-ranking. That paper solves request-level insertion rules but doesn’t consider practical constraints like adload, i.e., the proportion of ads shown is limited.

When considering adload constraints, we can’t just compare values within requests; we need to maximize value across requests or at the session level. For example, showing more ads on high-value requests and fewer or no ads on low-value requests to maximize revenue under adload constraints. This paper “Hierarchically Constrained Adaptive Ad Exposure in Feeds” provides a solution approach. The paper’s overall approach still uses beam search and the generator+evaluator mix-ranking paradigm, but incorporates overall constraints into the online solving process. Compared to conventional approaches that control adload independently from mix-ranking, this is a better approach worth reading~

阅读全文 »
0%