<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="http://www.w3.org/2005/Atom">
  <title>吴良超的学习笔记</title>
  
  
  <link href="https://wulc.me/atom.xml" rel="self"/>
  
  <link href="https://wulc.me/"/>
  <updated>2026-02-28T05:01:22.899Z</updated>
  <id>https://wulc.me/</id>
  
  <author>
    <name>良超</name>
    
  </author>
  
  <generator uri="https://hexo.io/">Hexo</generator>
  
  <entry>
    <title>场</title>
    <link href="https://wulc.me/2026/02/22/%E5%9C%BA/"/>
    <id>https://wulc.me/2026/02/22/%E5%9C%BA/</id>
    <published>2026-02-22T13:53:19.000Z</published>
    <updated>2026-02-28T05:01:22.899Z</updated>
    
    <content type="html"><![CDATA[<p>最近在读《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zNjg5NzA2NS8=">创意行为：存在即答案<i class="fa fa-external-link-alt"></i></span>》，一本关于创作的书，里面有这么一句话</p><blockquote><p>我们的目的不是制造艺术<br>而是要进入那美妙的境界<br>让艺术无可避免地发生</p></blockquote><p>这句优美得甚至有些玄乎的句子，一下子把脑子里很多零碎的观点都拽了出来。比如说关于创作的 “人只是上帝手中的一支笔”，“世界有分享欲，无时无刻都在找通灵者”；比如说关于生活的 “与善人居，如入芝兰之室，久而不闻其香，即与之化矣”，Naval的 “three most important decisions in life: where you live, who you arewith, and what youdo”；亦或是关于人性的 “人性之无分于善不善也，犹水之无分于东西也”、“性相近也，习相远也”</p><p>这些散落在不同维度的碎片，似乎都在论证着同一个笔者一直深信不疑的观点：<strong>人是环境的产物</strong></p><p>环境不仅仅是空间，更重要的，是其中看不见却无处不在的 “场”。我们在特定的规则下，会不由自主地做出符合这些规则的行为，这些行为经年累月地沉淀，最终内化为我们的性格与命运。无论是工作、生活、创作，还是那幽微莫测的人性，都与场的引力息息相关。清醒地辨识自己身处何种场，觉察它对我们的无声浸润，进而去选择、去走向那与自身价值观共振的场 —— 这对一个人的长远发展与内心的平静，至关重要</p><p>本文是关于 “场” 这个话题的一些碎碎念，内容或许有些发散，祝开卷有益～</p><span id="more"></span><h1 id="关于工作">关于工作</h1><h2 id="规则与场">规则与场</h2><p>工作的 “场”，很大程度上是由考核机制塑造的</p><p>考核机制决定了人的行为，如同芒格说的 "Show me the incentive, and Iwill show you theoutcome"。对程序员而言，若考核代码行数，得到的便是臃肿冗长的实现；对客服而言，若考核响应速度，换来的便是快速打发而非真正解决问题；对基金经理而言，若考核资金规模，诞生的便是在牛市高点推出的那些需要数年才能回本的爆款基金。很多时候，我们以为自己在主动工作，殊不知只是对考核机制做出条件反射 —— 如同迷宫中寻找奶酪的老鼠，奶酪的位置一变，路径也随之改变</p><p>2025 年的前大半年，工作上可谓是疲惫不堪。当时在《<a href="https://wulc.me/2025/05/03/%E5%B7%A5%E4%BD%9C%E3%80%81%E4%BD%93%E5%88%B6%E5%8C%96%E4%B8%8E%E8%87%AA%E7%94%B1/">工作、体制化与自由</a>》里曾这样记录：，“最近一段时间很忙，忙到整个大脑带宽被打满、回到出租屋只想躺平放空，或是忍不住无意义的刷短视频；忙到觉得自己工种变了（变成了一个消防员，天天在救火）；忙到甚至没有没时间去做更长期规划；能明显感觉到自己的词汇量、语义精度、表达能力和表达欲在迅速下降，同时自我对知识、对他人、对世界的好奇心和热情，似乎正在被浇灭 “</p><p>如今复盘那段经历，觉得很重要的一个原因还是当时业务目标定得过于激进。在这个 “场 “下，看到的是从上到下的焦虑，让团队长期陷于追逐短期收益的泥淖（即便这与长期目标相悖），所在方向人力不足又雪上加霜。不是说短期目标不对，因为任何业务发展都不可避免地存在长短期目标的配合，只是这种状态将个人的精力耗散于琐碎的应急，而那些真正重要的事 —— 业务的长期发展、个人的成长规划 —— 却被无情抛诸脑后。长远来看，这样的短视，对组织与个体都是一种消耗</p><p>这种高压而短视的工作之 “场”，还催生了另一个问题：对即时反馈的渴求，以及随之而来的 “体制化” 现象。就像码头工人的 “<span class="exturl" data-url="aHR0cHM6Ly93d3cuemhpaHUuY29tL3F1ZXN0aW9uLzQzNjA3MDg3L2Fuc3dlci8yNjkzNjU1Mzc5">早酒文化<i class="fa fa-external-link-alt"></i></span>” 一样 —— 在繁重劳作后，他们需要烈酒来麻痹身体、换取片刻的欢愉。我们在高压环境下，将所有精力投注于短期的、重复的任务，收到的正反馈往往稀薄。更多时候，只是已有知识的反复调用，枯燥流程的无限循环，如同被惩罚的西西弗斯，一次次将巨石推向山顶，又眼睁睁看它滚落。<strong>人若长久浸淫于这种没有正反馈的环境中，生命力会迅速流失，不得不依靠 “低级娱乐” 来输入廉价的快乐</strong>。这也是为什么许多人下班后选择刷短视频，而非拿起书本 —— 那不是懒惰，那是求生。但这是一种令人绝望的平衡</p><p>关于短视频的危害，已无需赘言。当工作中的负反馈与业余时间的低级娱乐达成某种脆弱的平衡后，任何试图打破这种平衡的行为，都会变得格外艰难。譬如你决心告别短视频，尝试在业余时间学习新技能 —— 这会让工作中的负反馈失去宣泄的出口；同时，陌生领域带来的新负反馈又会叠加其上。两者交织，人便很难坚持下去。大多数人自我提升计划的夭折，根源大抵在此。久而久之，<strong>人便被环境 “体制化”—— 身体、大脑、认知，乃至性格，都朝着融入当前环境的方向生长，只为让自己不那么痛苦</strong></p><h2 id="人与场">人与场</h2><p>塑造工作之 “场 “的更根本的一个因素，是人</p><p><strong>如果说考核机制是场的骨架，流程规范是场的血肉，那么人 —— 那些制定规则的人和朝夕相处的人才是场的灵魂</strong>。骨架可以被设计，血肉可以被填充，但灵魂决定了这个场是温暖还是冰冷，是让人向上生长还是日渐枯萎</p><p>首先是那些制定规则的人。业务目标由管理者确立，目标决定组织架构，架构衍生考核机制，机制最终塑造你的行为。这是一条从决策者案头一路延伸到每个人屏幕前的因果链。你以为是自己在选择如何工作，其实很多时候，你只是在顺应那个被设计好的轨道。管理者手中的笔，勾勒的是你日常的地形图 —— 哪里是平原可以驰骋，哪里是高山需要攀爬，哪里是沼泽会让你陷进去。他们未必有意如此，但每一个目标的设定、每一个指标的敲定，都在无声地改写你每天的选择</p><p>而比目标更不容易被观察到的的，是企业文化里那些 “虚” 的东西 —— 使命、愿景、价值观。它们听起来像墙上的标语，像年会上的口号，但却会渗透进每一次会议、每一封邮件、每一个决策里。它决定了一件事被讨论时，是 “这样做能短期交付” 优先，还是 “这样做是对的” 优先；决定了一个人犯错时，是被问责还是被鼓励；决定了一个团队面对压力时，是互相甩锅还是彼此托底。那些看似虚无的词语，最终会变成你每天呼吸的空气 —— 看不见，却无时无刻不在塑造你和企业</p><p>然后对你影响更频繁的场，是你那些朝夕相处的同事。同事是你每天见面最多的人，他们是你在茶水间吐槽时的听众，是你在困惑时下意识参照的坐标，是你在疲惫时抬头看见的镜子。你看着他们如何应对困难，如何庆祝成功，如何在加班深夜互相说一声 “先回了”—— 这些细碎的、重复的、不假思索的瞬间，才是你真正浸泡其中的那个场</p><p><u>一个好的同事群体会形成一种无声的引力：当你想要敷衍时，看到他们在认真，你会不好意思；当你想要放弃时，看到他们还在坚持，你会再撑一下；当你陷入自我怀疑时，他们随口一句 “你可以的”，可能比任何激励都管用。反过来，一个消耗型的同事群体也会慢慢拖垮你 —— 那些习惯性抱怨的人，那些把责任推给别人的人，那些对任何事情都说 “就这样吧” 的人，他们的存在本身就在悄悄改变你对 “正常” 的定义</u></p><p>对于那些不止于拿一份工资、按点上下班，而是把工作产出视为自己职业生涯作品的人来说，这一点尤为关键</p><p><strong>因为当你在意作品时，你交付的不只是时间和劳动力，还有你的审美、你的判断、你对自己的期待。你希望经手之事能打上自己的印记，哪怕微小，也是骄傲。而这样的你，对所在的场会格外敏感 —— 因为场决定了你的作品能否诞生，以及诞生的过程是滋养还是消耗</strong></p><p>如果所做的事情不符合自己的价值观，每一天都会是一场漫长的自我说服。你打开文档写标题时，心里知道这个方向不对；你在会议上点头时，脑子里有个声音在说 “这不是我想要的”。<strong>那种割裂感不会杀死你，但它会一点点抽干你 —— 你开始对工作失去热情，对产出失去骄傲，对 “作品” 这个词失去感觉</strong>。而做什么事，往往不是你能决定的。多数时候，是leader 定方向，你负责执行；更幸运的情况下，是你和 leader共同讨论决定。但无论哪一种，如果最终的方向与你相信的东西背道而驰，你都要付出双倍的能量：一份用来完成任务，一份用来安抚自己</p><p>如果一个大项目需要多方合作，你却遇到不给力的合作方，那种痛苦会像钝刀子割肉。你盯着进度条，发消息没人回，开会时对方永远说 “在做了”，交付时质量永远差一截。最终卡点不在你这里，结果却依然不符合预期 —— 你看着那个不如人意的作品，知道它本可以更好，但它就这样被拖成了平庸。你甚至不知道该怪谁，只能把烂摊子收拾完，然后告诉自己 “下次注意”。但下次呢？下次可能还是同样的人</p><p>如果身处一个形式大于实质的环境，你最需要的不是业务能力，而是表演能力。你要学会在汇报时把三分说成七分，在会议上提出正确但不重要的问题，在邮件里抄送该抄送的人而不是真的解决问题。你每天都在演戏 —— 演忙碌，演配合，演一切正常。慢慢地，你发现自己真的变成了一个演员，连真实的想法都要先问自己 “这能说吗”。那种异化感，比加班更累。</p><p>所以，<strong>对个人而言，选择团队就是选择日常。选择一个做事风格与价值观跟自己一致的团队 —— 这样你不需要每天和自己打架；选择跟优秀的人一起共事 —— 这样你会被推着往前走而不是被拽着往下沉；选择一个能平等交流、对事不对人、能碰撞出更多想法和作品的环境 —— 这样你的每一次发言都有回响，你的每一份付出都能被看见。这些听起来像理想主义，其实是最务实的自我投资。因为你每天在怎样的场里呼吸，你就会长成怎样的人</strong></p><p>从这个角度来说，<strong>对管理者而言，组建优秀的团队、营造平等开放的讨论环境，不是锦上添花，而是首要的任务</strong>。<u>管理的本质是激发善意和潜能</u> —— 这句话被说太多次，反而容易被忘记。但真正的好管理者明白：你不需要时刻盯着谁，不需要反复强调规则，你只需要把对的人聚在一起，给他们一个可以安心说话、放心做事的地方。剩下的，他们会自己完成。</p><p>因为一个好的工作场，本身就是最好的管理者。它让身处其中的人不由自主地向上生长 —— 不是因为有人逼，而是因为周围的人都在向上，因为讨论问题时那种纯粹的氛围，因为看到自己的作品一点点成型时的满足。在这种场里，努力不需要动员，成长不需要催促。你只是在那里，就自然会朝着光的方向，一点点长成更好的自己</p><h2 id="场与人">场与人</h2><p>工作的场，也深刻地影响着个人的长期发展路线</p><p>在互联网公司里，常常能观察到两类角色：IC（Individual Contributor）与Manager。Manager往往都是那批晋升较快的人，表面上看起来是能力使然，但剥开来看，也许更重要的一个因素是 —— <strong>他们被放在了一个能持续收到正反馈的场里</strong></p><p>这个场会不断给他们新的刺激：<u>第一次带人，第一次定方向，第一次为团队争取资源，第一次在高层面前汇报。每一次新尝试，无论成败，都会带来新的经验；每一次经验积累，都会转化为下一次机会的入场券</u>。他们被置于一个 “快速成长” 的轨道上，这个轨道本身就在推着他们前行 —— 像冲浪者被浪推动，不需要拼命划水，只要站稳，就能向前。一个人因业务需要晋升为管理者，便获得了管理经验；有了管理经验，便有资格带领更大的团队；下一次机会来临时，那个有经验的人自然会进入候选名单。这不是循环论证，这是场的正反馈</p><p>而另一些人，年复一年做着同样的事，在同一个岗位上原地踏步。并非他们不够努力 —— 他们可能比任何人都努力，每天最早到最晚走，交付稳得出错率极低。只是他们所在的场过于稳定：稳定的流程、稳定的任务、稳定的预期</p><p><u>稳定本身不是坏事，甚至是一种福利。但当稳定成为一种常态，场就开始悄悄改变它的性质。你不再需要学习新东西，因为老办法够用；你不再需要挑战自己，因为舒适区很安全；你不再需要抬头看路，因为脚下的路你已经走了十年。渐渐地，你发现自己被困住了 —— 不是被人锁住，而是被 “不需要改变” 的惯性裹挟。那个场像一潭水，起初还能泛起涟漪，后来慢慢变成死水，而你成了水底的石头，被水流磨得光滑圆润，却再也动不了分毫</u></p><p><strong>最残酷的地方在于：不是你不愿意动，而是那个场已经不再给你动的理由和机会</strong>。你没有新的任务，所以没有新的技能；没有新的挑战，所以没有新的经验；没有新的机会，所以没有新的履历。<strong>你以为自己在积累十年经验，其实只是把第一年的经验重复了十次</strong>。如果你一直做老的事情，又怎么可能诞生新的事物呢？</p><p>当然，这并不是说 Manager 就一定比 IC好，也不是说晋升快的人就一定更幸福。每种角色都有自己绕不过去的烦恼：管理者要背更大的锅，要处理更多的人际摩擦，要在上下之间反复平衡；管理者也逃不过大龄问题，尤其是国内的就业环境里，中年危机的阴影一样会笼罩。而那些在稳定场里的人，虽然晋升慢，但也可能拥有更可控的生活节奏、更少的焦虑、更多的陪伴家人的时间。得失之间，冷暖自知</p><p>但无论你是 IC 还是Manager，无论你在正反馈的浪尖还是在稳定场的深处，最关键的始终是那件事：<strong>你能不能让自己一直保持成为一个有 “价值” 的人，保持更新和学习的能力，在面对新事物时依然有初学者的好奇和勇气</strong></p><p>尤其是在互联网行业，变化是唯一的常量。今天的技能明天可能过时，今天的经验后天可能成为包袱。你需要付出数倍的精力和时间，去抵抗那个把你往下拉的惯性 —— 而这，本来就是高薪礼物背后，暗中标好的价格</p><p>所以，<u>当你发现自己在一个过于稳定的场里，不妨问自己一句：是我选择了稳定，还是稳定选择了我？是我主动留在这里，还是我已经走不动了？</u></p><h1 id="关于生活">关于生活</h1><h2 id="最初的场">最初的场</h2><p>生活的场，最早来自原生家庭</p><p>我们许多行为模式、情绪反应，乃至对世界的看法，都是在原生家庭中养成的，毕竟我们都说小孩就是一张白纸。童年时父母如何相处，我们往往便以为亲密关系应当如是；父母如何面对问题，往往会影响我们处理问题和矛盾的方法。这不是基因的刻写，而是我们从小浸泡在那个场里，像海绵一样无声地吸收了一切 —— 不仅是那些刻意教导的道理，更是那些未被言说的沉默、那些情绪暗涌的褶皱、那些日复一日重复的日常。我们学会了在争吵时是爆发还是隐忍，在失落时是倾诉还是封闭，在获得时是安然接受还是惶恐不安。这些都不是课堂上的知识，而是浸润在骨子里的呼吸</p><p>然而，成年后的我们常常面临一个困境是：那个在前二十年塑造了我们的 “场”，未必适合现在的自己，甚至，会反噬自我。<u>许多人一辈子都活在原生家庭的影子里 —— 明明早已独立，过年回家时却会退化成青春期的叛逆少年，为了一句饭菜的咸淡而莫名动怒；明明已经有挣钱能力，却仍旧被过往贫穷的阴霾笼罩着，小心翼翼不敢花一分钱，仿佛一旦放松警惕，就会坠回那个匮乏的深渊；明明向往亲密关系，却因为父母在童年的争吵打骂留下的记忆而因噎废食，在爱来临时下意识推开，在幸福靠近时转身逃离。</u>这不是他们不够成熟，而是那个 “家庭的场” 太过强大 —— 熟悉的气味、熟悉的语调、熟悉的争吵模式，一旦踏入，便被瞬间激活，如同按下旧日程序的开关。<strong>身体比意识更诚实，它记得所有的恐惧、委屈和无力</strong></p><p>这几年流行一种说法 “重新把自己养育一遍”，其核心在于，当我们意识到原生家庭的场不再适合当下的自己时，便要主动去构建新的场：结交新的朋友，尝试新的生活方式，建立属于自己的日常仪式。这个过程，如同在一片荒芜中重新开垦花园 —— 需要时间，需要耐心，也需要勇气。你要学着像理想中的父母那样对自己说话：跌倒时不是斥责 “你怎么这么不小心”，而是轻声问 “疼不疼”；疲惫时不是咬牙硬撑，而是允许自己停下来。你要为自己营造新的场域 —— 也许是清晨的一杯咖啡，也许是傍晚的独自散步，也许是和那些懂得倾听的朋友的相聚。在这些新的空间里，你慢慢练习：练习说出真实的想法，练习接纳自己的不完美，练习在恐惧袭来时仍然向前走一步</p><p>这个过程，正是心理学家所说的 “<strong>精神弑父母</strong>”—— 不是对父母的否定和抛弃，而是在精神上完成与他们的分离。弑，是为了不再被他们的影子笼罩；弑，是为了让自己从过去中解脱出来，真正成为自己的主人。<strong>这不是背叛，而是一种深刻的忠诚 —— 对自己生命的忠诚</strong>。当你终于能够分辨哪些情绪是你的，哪些是从那个家庭场里继承的；当你能够选择用不同于父母的方式去爱、去生活、去面对困难。那一刻，你并没有离开他们，而是终于有能力以平等的、完整的人的身份，与他们重新相遇</p><p><u>这注定是一场残酷而温柔的告别，也是一次艰难的涅槃。你埋葬的，是那个困在旧日场里的自己；你迎来的，是一个可以自主选择生活场域的人。这片新开垦的花园，终将开出你自己的花</u></p><p>而这一切的前提，往往是经济独立。我一直相信，<strong>经济独立才能带来精神独立</strong>。因为只有远离了父母和原生家庭的那个场，你才能真正看清那个场对你的影响。虽然在很多外人看来，“富二代” 很幸福，事实上也确实如此，ta 们能够轻易得到很多人穷其一生也许都无法企及的东西，但他们往往有一种特殊的 “苦”：虽然很有钱，却很难脱离原生家庭的那个场。钱是从家里来的，关系是家里给的，甚至婚姻都要听家里的安排。对于大部分无法独立的二代们，他们被困在一个镀金的笼子里，笼子很美，但终究是笼子</p><p>这笼子的栏杆不是铁的，而是由优渥的生活、体面的社会关系和不容辜负的期待编织而成。<strong>你很难反抗一个给了你一切的人 —— 哪怕他们同时也在拿走你最重要的东西：你自己</strong>。当你的银行卡每个月准时到账，当你住着父母名下的房子，当你求职时第一个想到的是 “家里有没有关系”，你就很难在饭桌上说出那句 “我不想过你们安排的人生”。因为潜意识里你知道，那句话的代价太高了：不只是争吵，而可能是生活本身的崩塌。这不是软弱，而是人性 —— 人在依赖中很难生出真正的反骨</p><p>而普通人家的孩子，或者那些早早切断脐带的人，他们的独立往往从第一笔自己挣来的工资开始。那笔钱可能不多，交完房租所剩无几，但它有一个无可替代的意义：它证明了你可以靠自己活下来。当你知道即使全世界抛弃你，你还有能力租一个容身之处、买一碗果腹之食，你的脊梁就开始直起来了。父母催婚时，你可以平静地说 “这是我的事”；他们干涉你的选择时，你可以微笑着听完，然后继续走自己的路。这不是叛逆，而是因为你有了底气 —— 你不再需要为生存付出自我的代价</p><p>这就是为什么说经济独立是精神独立的基石。<u>它不只是钱的问题，而是那个 “场” 被打破的开始。当你搬出原生家庭，住进自己租的小屋，哪怕只是十平米，你也会发现：原来房间可以按自己喜欢的方式布置，原来晚归不需要向谁解释，原来沉默的时候是真的安静，而不是在等待下一场争吵</u>。你在建造自己的场 —— 虽然简陋，但它属于你。慢慢地，你开始用自己挣的钱做决定：报一门想学的课，去一个想去的地方，买一本父母不会理解的书。每一个微小的选择，都是在对自己说：我的人生，我来写</p><p>而那些困在镀金笼子里的人，他们的困境恰恰在于：笼子太舒服了，舒服到让人忘记自己在笼中。他们从未真正体会过 “靠自己活下来” 的那种原始的、扎扎实实的底气。父母的爱与控制缠绕得太紧密，密到分不清哪是祝福哪是枷锁。他们当然可以一辈子衣食无忧，但也可能一辈子都无法回答一个问题：如果没有父母，我是谁？所以精神弑父母的第一步，往往是离开那个 “场”。而离开，常常从经济上的 “断奶” 开始。不是要你与父母决裂，而是要你证明给自己看：我可以。当你用自己的双手托住自己的生活，你才能以平等的姿态回到父母面前，不再是那个需要被保护的孩子，而是一个独立的、完整的成年人。那时，你与他们的关系才能真正从 “依赖与被依赖” 变成 “爱与爱”</p><h2 id="第三个场">第三个场</h2><p><strong>如果说摆脱原生家庭的 “场” 是我们前半生需要解决的课题，那组建自我的家庭则是我们后半生需要解决的课题。而在我们组建家庭中寻找的伴侣，会为我们构建另一个影响一生的场</strong> —— 这一次，你不是被动的接受者，而是主动的建造者</p><p>你选择的那个人，带着 ta 自己的原生家庭的气味、温度、习惯和裂痕，走进你的生命。你们相遇时，不只是两个人在相遇，而是两个 “场” 在相遇 —— 你从小浸泡的那些沉默与喧哗，ta 童年时学会的隐忍与爆发，你们各自从父母那里继承的爱的语言和伤人的方式，都悄悄藏在你们的眼神、语调和不假思索的反应里。刚开始恋爱时，你们以为相爱就是一切；<u>直到住到一起，才会发现原来牙膏从中间挤还是从底部挤，吵架后是需要拥抱还是需要独处，节日要不要庆祝，生病时是被照顾还是被嫌弃 —— 这些看似微小的事，背后都是两个 “场” 的碰撞。那些碰撞不是谁对谁错，而是两种 “正常” 在试探彼此的边界</u></p><p>而奇妙的是，<strong>你们正在共同建造第三个场</strong>。这个新的场，既不是你的原生家庭的复制品，也不是 ta 的，而是你们两人一砖一瓦搭建起来的、独属于你们的世界。在这个世界里，你们会慢慢形成自己的语言：某个眼神代表 “我累了”，某句话成了只有你们才懂的笑话，某个角落是争吵后各自冷静的坐标。你们也会形成自己的规则：如何分配家务，如何面对金钱，如何在疲惫时依然给对方留一盏灯。这些日常的、重复的、不起眼的瞬间，就像水珠一样，一滴一滴，最终汇聚成你们共同浸泡的那个 “场”</p><p><u>这个场的意义在于：它<strong>既是港湾，也是土壤</strong>。在外面的世界受伤时，你回到这个场，能被理解、被接住、被疗愈 —— 那些原生家庭没能给你的安全感，可能在这里慢慢生长出来；而那些你从童年带来的伤口，也可能在这个场的滋养下，第一次有机会真正愈合。同时，这个场也在无形中塑造着你们：好的亲密关系不是让人停留在原地，而是让人在安全的土壤里，长出新的枝桠。你可能发现，自己变得比以前更柔软了，或者比以前更勇敢了 —— 那不是你刻意的改变，而是这个新的 “场” 日复一日熏陶的结果</u></p><p>所以，<strong>选择另一半，某种程度上是在选择自己的下半生。你选择的不只是一个爱人，而是一种日常，一种氛围，一种彼此塑造的力量</strong>。你们会一起面对柴米油盐，也会一起经历风雨飘摇；会在平凡的日子里互相打磨，也会在关键的时刻彼此托举。那些在原生家庭中缺失的、受伤的、未完成的，有可能在这个新的场里被重新修复，当然也有可能被进一步放大将你彻底吞噬，关键还是取决于你构建了一个怎么样的场</p><p><u>一个良好的家庭的场的建造并不容易。它需要你们在争吵后依然选择沟通，在疲惫时依然愿意看见对方，在熟悉到几乎麻木的日常里，依然记得最初为什么选择彼此。它需要你们不断觉察：哪些情绪是当下的事，哪些是从过去带来的旧伤；哪些反应是对方的错，哪些是自己原生家庭种下的雷</u>。真正的亲密关系，不是两个完美的人相遇，而是两个带着伤口的人，选择在彼此面前慢慢疗愈，同时小心不去碰痛对方</p><p>与之相反的是，一个不良的家庭环境里，两个人的伤口不但没有互相疗愈，反而彼此撕扯。你童年被抛弃的恐惧，被对方的若即若离精准触发；你从小目睹的争吵模式，在自己身上完整复刻。你恨父母当年的歇斯底里，却发现自己吼出的话和当年的父亲一模一样；你发誓不要像母亲那样隐忍，却一次次咽下眼泪假装一切都好。那个场像一面镜子，照出你最不想看见的自己，而你被困在镜中，不知如何挣脱</p><p>所以，是否要选择第三个场，以及能否建好它，成了现代人面临的深刻难题</p><p>有些人终其一生都无法建好这个场。不是因为他们不努力，而是因为他们从第一个场里带来的东西太重了。那些未曾愈合的伤口，那些未曾言说的恐惧，那些被刻进骨子里的相处模式，会在每一个深夜、每一次争吵中浮现，把两个人都拖进漩涡</p><p>有些人，干脆选择不建。他们看过太多失败的例子，听过太多破碎的声音，宁愿一个人待在安全的孤独里，也不愿冒险去建造一个可能坍塌的场。他们说 “一个人也挺好的”、说 “婚姻不是必需品”、说 “爱情最后都会变成亲情”。这些话都有道理，但夜深人静时，偶尔也会想起那个问题：如果有一个场，可以让你卸下所有防备，你愿不愿意试试？</p><p>更复杂的是，《<a href="https://wulc.me/2025/03/12/%E4%B8%80%E8%B5%B7%E8%BF%99%E7%A7%8D%E8%89%BA%E6%9C%AF/">一起这种艺术</a>》，终究是两个人的作品。即使你想建，也需要找到一个同样想建的人。两个带着各自场的人，要在碰撞中磨合，要在分歧中妥协，要在漫长的岁月里一次次选择对方 —— 这本身就是一个奇迹。而这个奇迹发生的概率，比你想象的要低。如同在《<span class="exturl" data-url="aHR0cHM6Ly9iYWlrZS5iYWlkdS5jb20vaXRlbS8lRTQlQjglODAlRTUlOEElQTAlRTQlQjglODAvMTc3Njk4NjY=">一加一<i class="fa fa-external-link-alt"></i></span>》中Eason 最后的独白</p><blockquote><p>其实…… 有冇呢个人……<br>根本有冇呢啲嘢嘅呢？</p></blockquote><h1 id="关于创作">关于创作</h1><p>创作的场，更加玄妙</p><h2 id="上帝的手">上帝的手</h2><p>有人说，<strong>创作者只是上帝手中的一支笔，上帝只是通过你把这些内容写了出来</strong>。而很多创作者都有过这样的体验：有时候灵感如泉涌，笔下生花；有时候大脑一片空白，对着空白文档半天敲不出一个字。我们以为这是灵感的问题，其实这是 “创作的场” 的问题 —— <u>不是你没有能力，而是你没能进入那个可以接收信号的频率</u></p><p>在《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zNjg5NzA2NS8=">创意行为：存在即答案<i class="fa fa-external-link-alt"></i></span>》里有一段让人印象深刻的话，“在我们所参与的这个更大的创造里，我们不是指挥者。我们在被指挥。艺术家遵循宇宙的时间表，正如自然里的一切成员。<u>如果你有一个激动人心的想法，又不把它变成现实，那这个想法通过另一个创作者找到表达的出口也不奇怪；这不是另一个艺术家窃取了你的想法，而是这个想法的时机已到</u> “</p><p>这段话也许揭示了这个一个令人敬畏的事实：<strong>想法不是你的私有财产，它们是宇宙的访客，你只是它们暂时停留的房间</strong>。如果你关上门，它们就去敲别人的门。你以为是你抓住了灵感，其实是灵感选择了你 —— 而你唯一能做的，是让自己的房间保持开放、整洁、有人居住的气息</p><p>荣格有这么一句话：“不是歌德创造了浮士德，而是浮士德创造了歌德。”伟大的作品，似乎都有自己的生命，它们只是在寻找合适的 “通灵者” 把自己表达出来。<strong>艺术家或者说创作者不是创造者，而是宇宙广播的翻译员</strong>。他们的工作是汲取这些信息，转译它们、分享它们。那些流传千年的杰作，不是某个人 “想” 出来的，而是某个人 “接” 住的</p><p>那往往是哪些人接住这些想法呢？书里提到最好的艺术家往往是那些天线极为敏感的人 —— 是那些在特定时刻能在共振中汲取能量的人。很多伟大的艺术家最初发展出敏感的天线不是为了创造艺术，而是为了保护自己。他们要保护自己，因为痛苦对他们来说比别人更强烈。他们对事物感觉更深。正因为如此，他们才能接收到那些细微的信号。<strong>这是一份天赋的诅咒，也是诅咒中的礼物：你感知到的痛苦比别人深，你能接收到的回响也比别人远</strong></p><h2 id="在场">在场</h2><p>我们如何拾取既无法收听，也无从定义的信号呢？答案不是去寻找，也不是试图去预测或分析。相反，我们<strong>创造一个开放的空间，允许它在里面存在</strong>。这个空间完全没有我们日常的堆积阻塞的思想状态，就像真空一样，将宇宙已经解锁的想法汲取出来。正如书里所说的这句话：“我们的目的不是制造艺术，而是要进入那美妙的境界，让艺术无可避免地发生 “</p><p>这个境界是什么？是你放下 “我要写一篇好文章” 的执念，只是让自己成为通道；是你不再用头脑构思，而是用整个身体去感受；是你允许自己写出一堆垃圾，却在垃圾堆里发现了一颗钻石。创作最吊诡的地方在于：你越是想抓住它，它越是逃逸；你越是放松，它反而找上门来。如同Oscar Wilde 说的 "<strong>Life is too important to be takenseriously</strong>"（生活过于重要，以至于不能被认真对待），艺术，或者说是创作，亦是如此</p><p>如果你开始写一首歌，那就一口气把它写完。最初的灵感蕴含一种生命力，可以牵引着你完成整个作品。有些细节没达到最好的水平不要紧，完成草稿即可。通常而言，<u>一个完整而不完美的版本，比看似完美的小片段更为有益。因为那个不完整的版本里，藏着作品全部的 DNA—— 你随时可以回来修改、打磨、重塑，但骨架已经立起来了。而完美的小片段，就像一颗漂亮的牙齿，没有嘴可以安放</u>。当一个想法逐渐清晰，或者我们已经动笔写下一个引子时，我们可能会觉得自己已经抓到了诀窍，剩余部分会水到渠成。但如果这时候就停下，任凭最初的火花逐渐消退，要重新点燃可能就难了</p><p><strong>灵感也免不了受到熵定律的约束</strong>，宇宙的能量是流动的，你截留的那股洪流，如果不及时疏导让它奔涌而出，它就会慢慢干涸、淤塞、改道。你以为你保存了它，其实你失去了它。这就是为什么许多创作者都有这样的经验：半夜醒来想到一个绝妙的句子，心想 “明天再记下来”，结果第二天怎么也想不起来。不是记忆出了问题，而是那个句子已经离开了，去找另一个愿意在深夜里起身的人</p><p>所以，创作的 “场 “，说到底是一种 “在场 “—— 你让自己真正地在那里，空在那里，准备好在那里。像一片土壤等待种子，像一张唱片等待唱针，像深夜的收音机等待那一段飘忽不定的频率。你无法强迫灵感降临，但你可以让自己成为一个灵感愿意降临的地方。而当你终于进入那个场，你会发现：不是你写完了作品，是作品写完了你。<u>你从另一端走出来时，比进去时更丰富了一些 —— 因为在那短暂的时间里，你曾与某个更大的东西连接过</u></p><p>我很喜欢孟岩写的这篇文章《<span class="exturl" data-url="aHR0cHM6Ly9tcC53ZWl4aW4ucXEuY29tL3MvOW1XeHdNbjljUDJ5cUR1YW5jZVZIdw==">存在即答案<i class="fa fa-external-link-alt"></i></span>》里面的这段话</p><blockquote><p>创作不是刻意的追逐或费力的雕琢，而是一种专注、放松的倾听和等待。<strong>它要求我们不断吸收优秀的东西，塑造我们的品味和对好东西的判断。同时，保持初心者的心态，去除内心的干扰，营造安静纯粹的环境，让灵感和创意在内心自然而然地流动</strong>。我们只是记录者，而非创造者，我们真正的工作是全然地在场、清醒地感受，让艺术不可避免地通过我们呈现出来。</p></blockquote><p>我想，创作的场，需要一种 paradoxical的修行 —— 既要努力吸收、打磨技艺、塑造品味，又要放下 “我必须写出好东西” 的执念；既要保持敏感，让天线始终竖起，又不能在信号来临时用力过猛，把那个脆弱的频率吓跑。就像握一只鸟，太紧会捏死，太松会飞走。那个刚刚好的力度，叫做 “<strong>放松的专注</strong>”</p><p>这也许就是为什么许多创作者在洗澡时、散步时、半梦半醒时最容易冒出好想法 —— 因为那些时刻，你既在场，又不在场。<u>身体在做着不需要动脑的事，意识处于半开放的状态，那个 “日常堆积阻塞的思想状态” 暂时退场，于是宇宙的信号有了可乘之隙。你不请它来，它反而自己来了</u></p><p>所以，如果你也想进入那个场，不妨可以试试这样做：</p><p>当你开始动笔时，允许自己写得很烂。允许废话连篇，允许逻辑混乱，允许词不达意。因为只有当你不再害怕写烂东西的时候，好东西才会悄悄溜进来。初稿的烂，是通往好作品的唯一道路。</p><p>当你卡住的时候，不要硬闯，也不要放弃。放下笔，去走路，去喝水，去看云。让潜意识继续工作，让那个卡住的部分自己松动。很多时候，答案不是想出来的，而是等出来的。</p><p>当你终于写完一个作品，哪怕不完美，也要把它当作一个完整的生命来对待。它诞生了，它有它自己的样子。你可以以后修改它、打磨它，但此刻，请允许它存在。</p><p>最重要的是：持续地在那里。不是等灵感来了才去写，而是每天都去那个场里坐一会儿。像园丁每天去看他的花园，即使冬天没有花开，他也知道泥土下面有根在呼吸。你越是在场，那个场就越熟悉你，就越愿意接纳你</p><p>所以，去吧。去成为那个灵感愿意降临的地方。去写、去画、去唱、去做，去在场</p><h1 id="关于人性">关于人性</h1><h2 id="性本善性本恶">性本善？性本恶？</h2><p>人性本善，还是本恶？这个问题争论了几千年</p><p>孟子说性善，荀子说性恶，告子说性无善恶。我越来越倾向于告子的观点：“人性之无分于善不善也，犹水之无分于东西也。” 人性就像流水，你在东方挖开它就向东流，在西方挖开它就向西流。水本身没有方向，是地势决定了它的流向；人本身没有固定的善恶，是环境塑造了他的选择</p><p><u>同样的水，可以灌溉良田，也可以吞噬生命；可以清澈如镜，也可以污浊不堪。水还是那个水，只是流经的地方不同。人也如此 —— 那个在和平年代温文尔雅的人，放在另一套环境里，会不会变成另一个人？这个问题，细思极恐</u></p><p>最极端的例子是饥荒。历史上，每逢大饥荒，总有 “人吃人” 的记载。明末清初的《甲申纪事》里写道：“人相食，骨肉相食，易子而食。”这不是那些人天生残忍，而是极端环境把生存本能推到了极致。当一个人饿到皮包骨头，眼窝深陷，眼前只有死人和快要饿死的孩子时，他的行为已经不能用正常的道德来衡量了。<strong>道德是饱腹者的奢侈品，是安定社会的产物</strong>。把任何一个人放在那样的境地里，谁能保证自己不会变成野兽？</p><p>电影《<span class="exturl" data-url="aHR0cHM6Ly9tb3ZpZS5kb3ViYW4uY29tL3N1YmplY3QvNjAxMTgwNS8=">一九四二<i class="fa fa-external-link-alt"></i></span>》里有这样一个场景：灾民为了活命，卖儿卖女，甚至交换孩子煮食。弹幕里有人骂 “残忍”，有人刷 “人性本恶”。但真正值得问的是：<u>如果把你放在 1942 年的河南，饿到啃树皮、吃泥土，眼看最后一个孩子奄奄一息，你会做什么？我们不是那些人，只是因为我们没有活在那个场里</u></p><p>那个著名的实验，<span class="exturl" data-url="aHR0cHM6Ly96aC53aWtpcGVkaWEub3JnL3poLWNuLyVFNiU5NiVBRiVFNSU5RCVBNiVFNyVBNiU4RiVFNyU5QiU5MSVFNyU4QiVCMSVFNSVBRSU5RSVFOSVBQSU4Qw==">Stanfordprisonexperiment<i class="fa fa-external-link-alt"></i></span>，也在告诉我们：场是如何把普通人塑造成恶魔的。1971 年，心理学家津巴多把一群健康的大学生随机分成狱警和囚犯，放在模拟监狱里。原本计划进行两周的实验，六天后就被迫终止 —— 因为那些学生完全被环境吞噬了。扮演狱警的变得残暴，开始侮辱囚犯，强迫他们做俯卧撑、脱光衣服；扮演囚犯的变得抑郁、崩溃，有人甚至出现心理应激反应；仅仅六天，短短六天，一群普通人就变成了施虐者和受虐者。津巴多后来写了一本书叫《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zMDY1NDgxLw==">路西法效应<i class="fa fa-external-link-alt"></i></span>》，副标题是 “好人是如何变成恶魔的”。他得出的结论是：<strong>情境的力量足以让最普通的人变得残暴或顺从，只要给他合适的角色、规则和环境</strong></p><p>无独有偶，在纳粹集中营许多幸存者的回忆录里都提到：有些囚犯变成了 “<span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvS2Fwbw==">Kapo<i class="fa fa-external-link-alt"></i></span>”（集中营里的囚犯监工），他们对同胞的残暴程度甚至超过了纳粹。这不是他们天生冷酷，而是那个极端环境让他们相信：只有变得比敌人更狠，才能活下来。环境重塑了他们的价值排序，生存取代了一切</p><p>但同样是在二战期间，也有另一种人。许多普通人冒着生命危险藏匿犹太人，他们被称为 “<span class="exturl" data-url="aHR0cHM6Ly96aC53aWtpcGVkaWEub3JnL3dpa2kvJUU1JTlDJThCJUU5JTlBJTlCJUU3JUJFJUE5JUU0JUJBJUJB">国际义人<i class="fa fa-external-link-alt"></i></span>”。研究这些人的心理时发现，他们并没有比其他人更勇敢或更高尚，但他们往往成长在一个重视正义、同情弱者的家庭或社区里。有人回忆说 “父母从小就告诉我，每个人都有尊严，哪怕是陌生人。” 那个场，让他们在关键时刻听到了另一个声音 —— 不是 “这很危险”，而是 “这是对的事”。当大多数人选择沉默时，他们选择开门，不是因为他们天生是英雄，而是因为他们浸泡过的场让那扇门更容易被推开</p><p><strong>这就是环境的魔力。它不是在你做选择时替你决定，而是在你做选择之前，就已经悄悄改变了你的判断标准。</strong>你每天接触的人、反复听到的言论、习以为常的氛围，都在一点一点塑造你的 “正常”。当你身边的人都在作弊，诚实就显得愚蠢；当你身边的人都在行善，冷漠就显得可耻。你不是在善恶之间做选择，你只是在顺应你的场</p><h2 id="激发善意">激发善意</h2><p>所以，与其争论人性本善还是本恶，不如思考：<strong>如何把自己置于一个能激发善意的环境中</strong></p><p>如果我们用芒格的反向思维方式。想明白怎样才能幸福，先想清楚什么会让人不幸；想明白怎样才能善良，先想清楚什么会让人作恶。按照这个思路，我们<u>要避免的是把自己放到那些会激发恶意的环境里 —— 比如资源极度匮乏的地方，比如没有规则约束的真空，比如权力完全失衡的关系。这些场，会一点点磨掉你身上的善意，把你变成自己都不认识的人</u></p><p>然后，才是更积极的那一步：让自己更多地 “与善人居”。你选择的朋友圈、你每天浏览的信息、你生活的社区、你沉浸的文化产品，都在悄悄改变你 —— 当你身边的朋友都在读书，你也会不自觉地拿起书；当你关注的内容创作者都在输出真诚和思考，你也会慢慢学会辨别什么是好东西；当你生活的社区里有人需要帮助时总有人伸手，你也会在下一次看到类似场景时，多犹豫一秒，然后选择帮忙。那些微小的、重复的、习以为常的瞬间，就是场在塑造你</p><p>反过来也一样。当你身边的人都习惯了抱怨，你也会觉得世界本来就该这样；当你刷到的内容都在制造焦虑，你也会觉得自己活得很失败；当你生活的环境里人人自扫门前雪，你也会在下一次看到需要帮助的人时，告诉自己 “多一事不如少一事”。你没有变，你只是在顺应那个场</p><p>所以，选择自己的场，就是选择自己的人性走向。不是因为你软弱，而是因为你清醒 —— 清醒地知道自己会被环境塑造，清醒地知道自己想要成为什么样的人，然后主动把自己放进那个能让你成为那种人的地方</p><p><strong>人性是一汪水，它没有固定的形状，却会被容器塑造。选一个好的容器，不是为了显得高尚，而是为了让那水流过你的一生时，清澈一点，温柔一点</strong></p><h1 id="选择自己的场">选择自己的场</h1><p>写到这里，回头看这些散落在工作、生活、创作、人性中的碎片，忽然发现它们其实都在说同一件事：<strong>我们比自己想象中更脆弱，也比自己想象中更自由</strong></p><p>脆弱的是，我们无法逃脱环境的浸润。无论是办公室的考核机制，还是原生家庭的呼吸节奏；无论是亲密关系里的日常摩擦，还是深夜独坐时那忽明忽灭的灵感 —— 这些 “场” 都在无声地塑造着我们，像河水雕刻河床，像风塑造沙丘。你以为自己在做选择，其实很多时候，你只是在顺应那个场给出的选项</p><p>但自由的是，<strong>我们终究可以选择把自己放在哪个场里</strong></p><p>这才是 “孟母三迁” 背后真正的智慧。孟母不是逃避，而是主动选择 —— 她知道那个场会塑造她的孩子，所以她愿意一次次搬家，哪怕麻烦，哪怕未知。这种决断力，本质上是一种清醒：清醒地意识到自己正在被什么塑造，清醒地知道自己要去向哪里，然后拿出行动，把自己放进那个对的场里。这不是矫情，这是对自己生命最大的负责</p><p>Naval Ravikant 曾指出人生的三个重大决定：<br>1. <strong>Where you live</strong><br>2. <strong>Who you're with</strong><br>3. <strong>What you do</strong></p><p>这三个决定，本质上就是在为你的人生挑选宏大的 “场”。选对了场，你的人生就是顺流而下，每一次努力都会被环境放大，每一次成长都会得到正反馈；选错了场，你终其一生都在与无形的阻力搏斗，像逆流而上的鱼，耗尽力气却只在原地打转</p><p>在哪里生活，决定了你每天呼吸的空气、看见的风景、遇见的陌生人。城市有城市的场，乡村有乡村的场；北上广有北上广的节奏，小城有小城的呼吸。没有绝对的好坏，只有是否适合你。有些人只有在喧嚣中才能生长，有些人只在安静里才能开花。你要诚实地问自己：我在哪里，能成为更好的自己？</p><p>和谁在一起，决定了你最亲近的那些人如何与你对话、如何对待你的脆弱、如何在深夜给你回应。伴侣、朋友、同事 —— 他们是你日常浸泡的场，是你会被无声同化的方向。选对人，你会在爱里变得柔软而坚定；选错人，你会在消耗中一点点枯萎</p><p>从事什么工作，决定了你每天醒来的八个小时被什么占据。是创造还是重复？是意义感还是空虚？是向上生长还是原地打转？工作不只是谋生，它是你与这个世界发生连接的方式，是你把自己交付出去的那个场</p><p><u>这三个决定，听起来宏大，其实都落实在一次次具体的选择里：是接受那份高薪但不快乐的工作，还是赌一把去做自己真正热爱的事？是留在一段消耗你的关系里，还是独自面对未知的孤独？是留在熟悉但窒息的城市，还是去一个陌生但有光的地方？</u></p><p>没有人能替你选。甚至选了之后，也没有人能保证结果。但有一件事是确定的：<strong>你永远可以选择离开一个不适合的场，永远可以选择走向一个可能更好的场</strong>。这不是逃避，而是对自己的诚实。每一次离开，都是一次 “迁”；每一次 “迁”，都是一次对自己说：<strong>我值得更好的</strong></p><p>孟母三迁，迁的不是地方，是孩子的未来。我们这一生，其实也是在不断地 “迁”—— 从一个场走向另一个场，从被塑造走向主动塑造，从 “我是环境的产物” 走向 “我是自己的选择”。这个过程没有终点，你永远在途中。但正是这种 “永远在途中”，让你始终保有改变的可能</p><p>所以，在结束这篇漫长的碎碎念之前，我想对你说 —— 也是对我自己说：</p><p><strong>愿你在工作中找到那个让你愿意早起的场</strong>。不是被闹钟叫醒，而是被想做的事情叫醒。在那里，你的每一次努力都看得见回响，你的每一次创造都有人看见</p><p><strong>愿你在生活里找到那个让你安心的场</strong>。哪怕外面风雨再大，回去的地方有一盏灯、一个人、一个可以卸下所有伪装的空间。在那里，你可以脆弱，可以失败，可以不用解释</p><p><strong>愿你在创作中找到那个让灵感降临的场</strong>。不用苦苦追逐，不用焦虑等待，只是安静地在那里，像土壤等待种子，像深夜等待黎明。当信号来临时，你有足够的敏感接住它</p><p><strong>愿你的人性之水，流经的皆是芝兰之室</strong>。不是因为世界本就美好，而是因为你主动选择了那些让美好更容易发生的地方</p><p>选对场，然后顺流而下</p><p>剩下的，交给时间</p>]]></content>
    
    
    <summary type="html">&lt;p&gt;最近在读《&lt;span class=&quot;exturl&quot; data-url=&quot;aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zNjg5NzA2NS8=&quot;&gt;创意行为：存在即答案&lt;i class=&quot;fa fa-external-link-alt&quot;&gt;&lt;/i&gt;&lt;/span&gt;》，一本关于创作的书，里面有这么一句话&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;我们的目的不是制造艺术&lt;br&gt;
而是要进入那美妙的境界&lt;br&gt;
让艺术无可避免地发生&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;这句优美得甚至有些玄乎的句子，一下子把脑子里很多零碎的观点都拽了出来。比如说关于创作的 “人只是上帝手中的一支笔”，“世界有分享欲，无时无刻都在找通灵者”；比如说关于生活的 “与善人居，如入芝兰之室，久而不闻其香，即与之化矣”，Naval
的 “three most important decisions in life: where you live, who you are
with, and what you
do”；亦或是关于人性的 “人性之无分于善不善也，犹水之无分于东西也”、“性相近也，习相远也”&lt;/p&gt;
&lt;p&gt;这些散落在不同维度的碎片，似乎都在论证着同一个笔者一直深信不疑的观点：&lt;strong&gt;人是环境的产物&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;环境不仅仅是空间，更重要的，是其中看不见却无处不在的 “场”。我们在特定的规则下，会不由自主地做出符合这些规则的行为，这些行为经年累月地沉淀，最终内化为我们的性格与命运。无论是工作、生活、创作，还是那幽微莫测的人性，都与场的引力息息相关。清醒地辨识自己身处何种场，觉察它对我们的无声浸润，进而去选择、去走向那与自身价值观共振的场 —— 这对一个人的长远发展与内心的平静，至关重要&lt;/p&gt;
&lt;p&gt;本文是关于 “场” 这个话题的一些碎碎念，内容或许有些发散，祝开卷有益～&lt;/p&gt;</summary>
    
    
    
    <category term="闲话几句" scheme="https://wulc.me/categories/%E9%97%B2%E8%AF%9D%E5%87%A0%E5%8F%A5/"/>
    
    
    <category term="闲话几句" scheme="https://wulc.me/tags/%E9%97%B2%E8%AF%9D%E5%87%A0%E5%8F%A5/"/>
    
  </entry>
  
  <entry>
    <title>User Experience Optimization:From Heuristic Intervention to Unified Value Modeling</title>
    <link href="https://wulc.me/2025/12/07/%E7%94%A8%E6%88%B7%E4%BD%93%E9%AA%8C%E6%A6%82%E8%BF%B0/"/>
    <id>https://wulc.me/2025/12/07/%E7%94%A8%E6%88%B7%E4%BD%93%E9%AA%8C%E6%A6%82%E8%BF%B0/</id>
    <published>2025-12-07T08:51:23.000Z</published>
    <updated>2026-02-28T05:01:22.910Z</updated>
    
    <content type="html"><![CDATA[<p>In the evolution of Search, Ads, and Recommendation systems, UserExperience (UX) is an unavoidable core challenge. In this article, wequantify UX as LT (Life Time), specifically referring to user retention(e.g., the number of days a user opens the app within a 7-daywindow).</p><p>Unlike pure content recommendation, which seeks to maximize totalwatch time, optimization in commercial or marketing-oriented sectors(Ads, E-commerce, Live Streaming) is about maximizing business value(Cost, GMV, etc.) while staying above a "UX Redline." More accurately,it is about <strong>maximizing the efficiency of exchanging "Unit LT"for "Business Metrics."</strong></p><p>We typically use Holdout Experiments (Reverse Experiments) to measurehow a business strategy affects LT. The factors influencing theseresults are multifaceted:</p><ul><li>Explicit Factors: These are the most direct and well-known,involving the position and density of business items (e.g., start_pos,gap, load).<br></li><li>Implicit Factors: Supply quality and ranking accuracy. The qualityand diversity of ad creatives or live-streaming content determine theappeal of the distribution queue. If supply is insufficient or rankingis inaccurate, users are less likely to be attracted to theplatform.<br></li><li>Opportunity Cost (Backfill Logic): A frequently overlooked point. Aholdout experiment compares the "Business Queue" with a "Backfill Queue"(usually the organic recommendation queue). The final impact on LT isessentially:</li></ul><p><span class="math display">\[\Delta LT = LT_{Business} -LT_{Backfill}\]</span></p><p>The negative impact on LT is minimized only when the business contentis as attractive as—or more attractive than—the organic content itreplaces.</p><p>While improving supply and ranking accuracy are the fundamentaldrivers for LT, they take time to yield results. In day-to-dayengineering, adjusting load, start pos, and gap remains the mostimmediate lever. Furthermore, we must establish strict defensivemechanisms to prevent short-term gains from masking long-term,cumulative UX damage.</p><p>This article explores the evolution of UX optimization through threestages: Short-term Defense (Heuristic Protection), Mid-term Tuning(Experience Modeling), and Long-term Alignment (Unified ValueModeling).</p><span id="more"></span><h2 id="short-term-strategy-heuristic-defense-protection">Short-termStrategy (Heuristic Defense &amp; Protection)</h2><p>In the early stages, the most effective tools are rule-basedstrategies based on traffic attributes or user segments. The core logicis <strong>"Rapid Loss Prevention" and "Layered Defense."</strong></p><p>By manually or semi-manually "patching" the system (e.g., raisingthresholds for specific segments), we protect high-risk or sensitiveusers. This includes protection for new users, returning users, orlow-activity users. In search, it might involve setting differentthresholds for "active intent" vs. "passive browsing" traffic.</p><p><strong>Implementation Logic</strong></p><p>We segment traffic by request features (e.g., channel entry) or userprofiles (e.g., historical report/bounce rates). Mechanistically, we setindependent, higher eCPM thresholds or increase start_pos/gap losses inthe ranking stages to ensure business content is reduced or removed forthese segments.</p><p><strong>Pros</strong>: Simple to implement, low experimentcost.<br><strong>Cons</strong>: Purely reactive (post-hoc), lacks generalization,and can easily become obsolete.</p><p><strong>The Paradox: Why do these "patches" work?</strong></p><p>If a system has a Static Threshold, it has theoretically fixed theexchange efficiency between business goals and LT. For example, in ads,<strong>a fixed eCPM threshold dictates that a "show" must bring in atleast <span class="math inline">\(X\)</span> revenue to justify the LTloss</strong>.</p><p>In an ideal world, a single static threshold should be globallyoptimal. However, these patches work because of three realities:</p><p><strong>1.Value Estimation Bias</strong>: The system may overestimatethe eCPM for certain groups (like new users). Raising the threshold actsas a manual calibration for this overestimation.<br><strong>2.UX Loss Heterogeneity</strong>: Even if value estimation isaccurate, the LT loss from the same "show" varies by user. A sensitiveuser might churn after one bad ad, while a resilient user remainsunaffected.<br><strong>3.Suboptimal Exchange Efficiency</strong>: Even with perfectpredictions for value and experience, the "weight" given to each in theranking formula might not be globally optimal.</p><p>However, while patches are necessary today, they shouldn't existpermanently. The goal is to improve the accuracy of both value andexperience modeling and optimize their exchange ratio.</p><h2 id="mid-term-strategy-experience-signal-modeling">Mid-term Strategy(Experience Signal Modeling)</h2><p>Heuristic strategies rely on the assumption that certain groups aresensitive. Mid-term optimization moves away from manual interventionstoward dynamic, model-driven interventions.</p><p>We explicitly model the user's experience loss.We can categorizethese modeling approaches into two types:</p><p><strong>1. Direct Experience Signal Modeling(Correlation)</strong></p><ul><li>Offline: Predict the probability of negative behaviors (leave,report, dislike) after a given exposure: <span class="math inline">\(P(Negative | Context)\)</span>.<br></li><li>Online: Based on the predicted probability, dynamically increasethresholds or gaps to reduce "Load" for that specific request.</li></ul><p><strong>2. Uplift Modeling (Causality)</strong></p><ul><li>Offline: Use causal inference to model the change in LT (<span class="math inline">\(\Delta LT\)</span>) and the change in businessvalue (<span class="math inline">\(\Delta Cost\)</span>) when a"Treatment" (showing a business item) is applied.<br></li><li>Online: Calculate the Marginal Exchange Efficiency</li></ul><p><span class="math display">\[Efficiency = \frac{\Delta LT}{\DeltaCost}\]</span></p><p>We select traffic and users with the highest efficiency to perform"LT recovery" (reducing load), maximizing the LT regained for everydollar of revenue sacrificed.</p><p>However, uplift modelling has the following challenges:<br><strong>(1) Label Sparsity</strong>: LT is a long-term, sparse metric.We often rely on Proxy Metrics (e.g., short-term stay time,interaction), and the correlation between these proxies and true LTdetermines the model's success.<br><strong>(2)Counterfactual Data</strong>: Uplift models require"Treatment" and "Control" data. This requires a small portion of"exploration traffic" where ads are withheld, which can be costly.</p><h2 id="long-term-strategy-unified-value-modeling">Long-term Strategy(Unified Value Modeling)</h2><p>The ultimate goal is to move away from "patching LT" and instead<strong>treat experience signals as a "Unified Currency" that isinterchangeable with business metrics (Revenue, GMV).</strong></p><p>We no longer treat LT as an external filter but as an internalcost/benefit within the Ranking Formula, enabling automated end-to-endoptimization.Deriving the Optimal Ranking Formula</p><p>Most ranking problems can be formalized as a constrained optimizationproblem. For an ad queue:</p><p><span class="math display">\[\begin{align}\max_x &amp;\sum_{i=0}^{n-1} ecpm_i \\s.t. \frac{1}{n} &amp;\sum_{i=0}^{n-1} lt_i \ge LT^{*}\end{align}\]</span></p><p>Using the Lagrangian Dual, we can derive the ranking score, similarderivation process can be found here 《<a href="https://wulc.me/2025/07/20/%E6%90%9C%E7%B4%A2%E7%9B%B8%E5%85%B3%E6%80%A7%E6%A6%82%E8%BF%B0/">搜索相关性：从建模到排序机制</a>》</p><p><span class="math display">\[Score_{i} = ecpm_i + \lambda \cdot(lt_{i} - LT^{*})\]</span></p><p>Here, <strong><span class="math inline">\(\lambda\)</span> acts asthe "Shadow Price" of LT—the exchange rate between LT and eCPM</strong>.If a user’s predicted <span class="math inline">\(lt_i\)</span> for aspecific request is high, the final <span class="math inline">\(score_i\)</span> increases, making the item morelikely to win.</p><p>There are several key considerations in this method</p><ul><li><strong>Proxy Metrics</strong>: Since direct LT prediction isdifficult, we use easily observable process metrics as proxies.<br></li><li><strong>Listwise Context</strong>: The best place for thisprediction is the Evaluator/Rerank stage, where the model has the mostcontext to predict how a specific sequence of items affects LT.<br></li><li><strong>Solving for <span class="math inline">\(\lambda\)</span></strong>: <span class="math inline">\(\lambda\)</span> is not static. It can be solvedvia offline replay of historical data to find the global optimum oradjusted in real-time via a PID Controller to ensure the LT constraint(<span class="math inline">\(LT^*\)</span>) is met.</li></ul><p>Though the key considerations are described briefly here, each partactually requires detail investigation in order to solve the problemproperly</p><h2 id="conclusion">Conclusion</h2><p>User Experience optimization in complex search, ads, recommendationis not a one-time fix but a layered, systematic challenge.</p><p>Short-term (Heuristic Defense): Focuses on rapid identification andloss prevention. It uses "patches" to protect the system when valueestimation or exchange rates are not yet optimal.</p><p>Mid-term (Experience Modeling): Uses correlation or Uplift models toscientifically quantify experience. It makes hidden costs explicit andprovides the data foundation for long-term integration.</p><p>Long-term (Unified Value): The final form of optimization. It breaksthe duality of "Business vs. Experience" by converting UX into a"Unified Currency." LT becomes a native value participating in automatedresource allocation.</p><p>These three stages represent an evolution from Local Optima towardGlobal Optima. In practice, they should coexist: use short-term rules tohold the redline, mid-term models to improve efficiency, andcontinuously iterate toward the ideal of unified modeling.</p><hr><h1 id="中文版">中文版</h1><p>在搜广推业务的演进过程中，用户体验（本文量化的方式是 LT，即用户在 APP的留存情况，如 7 天内有几天打开了app）是一个绕不开的核心命题。与纯内容推荐追求用户时长最大化不同，在广告、电商、直播等商业化或营销导向的业务中，用户体验优化的本质是在体验红线之下，寻求业务价值（Cost,GMV 等）的最大化；或者更准确地说，是<strong>追求单位 LT兑换业务指标效率的最大化</strong></p><p>通常，我们通过反转实验（Holdout Experiment）来度量业务策略对 LT的影响。而影响反转实验 LT 指标的因素非常多：</p><ul><li>显性因素：这是最常见和为人熟知的因素，指的是对应业务的 item在展现时的位置和密度（比如说 start pos、gap、load 等）<br></li><li>隐性因素：供给侧的质量与排序侧的准确性。例如广告素材、直播间内容的质量与多样性，直接决定了分发队列的吸引力，都会直接影响分发的素材的多样性，进而影响用户是否会更容易被平台的内容吸引，这部分其实也跟我们系统的排序能力相关，因为除了供给需要充足，也需要准确的排序能力来把合适的内容推送给不同的用户<br></li><li>机会成本（回填逻辑）：这是常被忽略的一点。反转实验的本质是比较 “业务队列” 与 “回填队列（通常是自然推荐队列）” 的价值差异。业务策略对LT 的最终影响，实际上等于 <strong>(业务内容的 LT) - (被挤占的自然内容的LT)</strong>。只有当业务内容的吸引力接近甚至超过自然内容时，LT的负向影响才会最小化</li></ul><p>因此，虽然优质供给和精准排序是提升 LT的根本，但其见效周期长。在实际工程迭代中，通过调控 Load、Start Pos 和Gap 往往是影响 LT最直接、见效最快的手段。此外，我们在追求业务增长的同时，必须建立严格的防御机制，防止因观测周期滞后，导致短期不可观测的体验受损在长期累积成巨大的负向效应。</p><p>本文将探讨用户体验优化的演进路径，将其归纳为<strong>短期防御（规则圈选）、中期调优（体验建模）与长期对齐（价值统一）</strong>三个阶段。</p><!--more--><h2 id="短期策略规则防御与圈选保护">短期策略：规则防御与圈选保护</h2><p>在优化的初期，最常见且有效的手段是基于流量属性或人群特征的规则类策略。其核心逻辑是 <strong>“快速止损” 与 “分层防御”</strong>：通过人工或半人工的方式识别高危 / 高敏流量，针对识别的预估不准确或敏感人群，通过差异化 load策略（如门槛、start_pos、gap），即刻降低其体验受损风险</p><p>体验中常见的分人群、分流量类型等抬门槛等保护策略，就是这一类策略。其核心思路是通过人工 / 半人工的 “打补丁” 策略（分人群、分流量抬门槛）快速保护高危 / 高敏用户。这种思路在多个业务场景中都验证了其有效性。常见的如新用户保护、回流用户保护、非月活用户保护，或者是搜索中区分主、被动流量设置不同的门槛，都属于这一类思路</p><p>具体的实现逻辑也比较简单，往往是通过流量侧或人群侧的分层（往往需要一些数据分析来支持论证划分的有效性），比如说基于请求特征（如频道入口等）进行静态分流；或者在人群侧基于用户画像 / 历史行为（如新用户、低活用户、历史高举报 / 高跳出率用户等）进行动态人群包圈选</p><p>而在机制上，一般是在在排序不同阶段，为这些流量 / 人群包设置独立的、更高的门槛，或者设置更大的start_pos loss/gap loss 来实现这些内容少出或不出的目的</p><p>这类方法的优点是简单和实验成本低；缺点则是纯后验规则，缺少泛化性，容易失效</p><p>基于规则的这些短期策略虽然能快速止损，但是一个值得探讨的问题是：<strong>为什么这些分流量、分人群策略会有效？</strong></p><p>从流量视角，<u>如果我们系统中有一个静态门槛，静态门槛已经固定了业务优化目标跟LT 的兑换效率</u>。以广告为例，最大化目标是收入（ecpm），而固定的 ecpm门槛约束了 ecpm 和 LT 的边际兑换效率（更直观的理解，show 导致的 ltloss，至少要带来这么多的 ecpm 收益）。把上面的 ecpm换成其他业务目标，原理类似</p><p>因此，<strong>静态门槛控制了整体的业务优化目标与 LT 的兑换效率，打平load 的情况下，最优的门槛应该是一个静态门槛</strong></p><p>那为什么很多体验分流量类型，分人群包去抬门槛来保护是有效的？我们可归纳为以下三个关键事实：</p><p>1）<strong>价值预估偏误</strong>：对于某些人群（如新用户），系统可能高估了其业务价值（如 ecpm）。抬高门槛相当于手动提高了这部分流量的兑换比，某种程度上是了这部分流量高估的校准<br>2）<strong>体验损失异质性</strong>：即使价值预估准确，相同的曝光（show）对不同用户造成的 LT 损失也不同（比如说敏感用户可能因一次不当曝光而流失，钝感用户则无感）。这需要系统能准确建模用户体验<br>3）<strong>兑换效率非最优</strong>：即使价值和体验均能准确预估，两者在排序公式中的权衡（兑换比）也可能不是全局最优的</p><p>因此，统一静态门槛实现全局最优的前提非常苛刻：<strong>价值预估准确、体验项预估准确、且两者的兑换效率已是最优</strong>。当任一条件不满足时，分人群 / 流量的策略便成为有效的 “排序补丁”</p><p>但长期看，应该通过把价值项和体验项做准，并且优化两者的兑换比，然后通过统一门槛来调控业务优化目标和LT的兑换比；分流量、分人群的策略是短期的补丁手段，长期看不应该存在线上</p><h2 id="中期策略体验信号建模与干预">中期策略：体验信号建模与干预</h2><p>上面说的圈选策略，是基于某一个或几个特征（如人为对人群划分和流量划分的纬度）。然后基于 <u>“这些人群的的LT 与业务指标兑换效率较低” 的假设</u>，对这部分人施加降 load的操作来降低对 LT 的影响，同时尽可能让业务指标无损</p><p>但这种方式的泛化性有限，依赖的假设可能会随着分布变化而不成立，因此更泛化的方式是通过建模去预估这些体验指标的变化。将用户的体验损失进行显性化建模。由上面定义的人工门槛干预，转向动态的、基于预估体验的干预手段</p><p>这种方式的核心思路是对用户的体验信号进行建模，然后基于建模的预估值，对用户施加更加个性化与效率更高的回捞策略。根据建模方式的不同，常用的建模方式可以分为两大类</p><ul><li>体验信号直接建模： 直接建模与用户 LT 相关的负向行为（如leave、report、dislike）的概率，然后基于预估概率对用户施加不同的降 load策略，属于<strong>相关性建模</strong><br></li><li>uplift 建模： 建模不同用户单位曝光（load） 与 LT关系，提升业务目标（如直播的 awld）与 LT 的边际兑换效率，提升 LT回捞的效率，属于<strong>因果性建模</strong></li></ul><p>由于讲建模的文章比较多，这里只是简单介绍下这两种建模方式的主要思路</p><p>（1）体验信号建模（相关性）</p><ul><li>离线建模： 预估用户在给定曝光后，触发负面体验行为的概率<br></li><li>线上生效：基于预估的负向行为概率，通过提升门槛、后移 start position或增加 gap 来降低用户看到的直播的 load</li></ul><p>（2）uplift 建模（因果性）</p><ul><li>离线建模： 利用因果推断方法，建模用户在施加 treatment后（如是否看到业务 item）带来的 LT 变化（<span class="math inline">\(\Delta LT\)</span>） 和业务指标变化（如广告是<span class="math inline">\(\Delta cost\)</span>）<br></li><li>线上生效：基于预估值，计算边际兑换效率，即 <span class="math inline">\(\frac{\Delta LT}{\Deltacost}\)</span>，选择兑换效率高的流量和人群来做 LT的回捞（同样通过上面限制 load 的方式即提升门槛、后移 start position或增加 gap），从而达到打平业务指标的损失下，最大化回捞的 LT</li></ul><p>这种方式的优势是，相较于基于规则的圈选，建模有更好的泛化性；同时通过uplift 建模优化业务目标与 LT的边际兑换效率。但是面临的挑战是建模难度会比较大，主要体现在<br>1）无论相关性或因果性建模都会遇到，label 获取问题，LT是一个稀疏且长周期的指标，直接建模极难收敛，需要找一些相关的代理指标，这些代理指标跟LT 指标的建模难度和与 LT 指标的相关性都会影响最终的建模效果<br>2）uplift 建模依赖获取反事实数据的准确性（即 label的准确性），但严格上来说是没法获取到绝对的 ground truth的，实际中会通过各种方式来模拟，同时为了获取label，需要有一部分探索流量少出或不出直播，对线上有损（利用不出 item反转损失可控）</p><h2 id="长期策略体验价值统一建模与兑换">长期策略：体验价值统一建模与兑换</h2><p>无论是短期方案还是中期方案，都是基于先验的知识，或模型预估的体验信号，然后人工构造的规则（如前x 刷不出）或 listwise loss 生效（如 gap loss、start posloss）到最终的排序中，其都依赖人工构造特定的操作（如后移 start pos、缩小gap 等）对线上体验的增益或损失</p><p>而长期方案的目标是彻底摆脱 “为 LT单独打补丁” 的逻辑，<strong>将体验信号（LT损失 / 增益）转化为与业务指标（如收入、gmv、直播观看时长）可等价交换的 “统一货币”</strong>，并在分发链路中实现端到端的自动化博弈。其核心思路是不再将LT 视为一个外部拦截条件，而是将其量化为一个体验成本 / 收益，直接进入 Rank排序公式</p><p><strong>最优排序公式推导</strong></p><p>由于大混排不同队列都有其最核心的优化目标，因此理论上所有问题都可以量化为一个带约束的最优化问题，以广告队列为例，最大化的目标ecpm 。假设有 <span class="math inline">\(n\)</span> 条请求，第 <span class="math inline">\(i\)</span> 条请求广告的 ecpm 为 <span class="math inline">\(ecpm\_i\)</span>，LT 的预估值为 <span class="math inline">\(lt_i\)</span>（这里先用 lt 的原始定义，即 n天内有几天打开了 app，实际建模往往需要用代理指标来替换），LT 的约束为<span class="math inline">\(LT^{*}\)</span>（当前仅考虑 LT约束，多约束推导过程类似），则需要求解的问题的可形式化表达为如下</p><p><span class="math display">\[\begin{align}\max_x &amp;\sum_{i=0}^{n-1} ecpm_i \\s.t. \frac{1}{n} &amp;\sum_{i=0}^{n-1} lt_i &gt;= LT^{*}\end{align}\]</span></p><p>则通过拉格朗日对偶推导，可以推导出排序公式如下，推导过程与《<a href="https://wulc.me/2025/07/20/%E6%90%9C%E7%B4%A2%E7%9B%B8%E5%85%B3%E6%80%A7%E6%A6%82%E8%BF%B0/">搜索相关性：从建模到排序机制</a>》类似</p><p><span class="math display">\[score_{i}=  ecpm_i + \lambda \cdot(lt_{i} - LT^{*})\]</span></p><p>这里的 <span class="math inline">\(\lambda \cdot (lt_{i} -LT_{redline})\)</span> 即是与 ecpm对齐量纲的体验价值。直观理解这一项，如果当前用户预估在当前请求的 <span class="math inline">\(lt_i\)</span> 值越大，则最终的 <span class="math inline">\(score_i\)</span>越大，越容易胜出，反之越难胜出</p><p>这种方式有几个关键点<br>1）由于 LT直接预估的难度会比较大，因此往往需要找一些易于观测的过程指标作为代理指标，这个问题跟中期方案类似，其实建模思路都会遇到这个问题<br>2）预估的位置，混排最终 evaluator 阶段选择候选具备最充分的上下文 context信息，理论上能够充分建模的上下文 context 对 LT的影响。因此可以考虑在混排通过 listwise 模型模型建模对 LT 影响<br>3）<span class="math inline">\(\lambda\)</span> 参数求解，通过历史回放求解最优的<span class="math inline"> \(\lambda\)</span> 或者通过控制器实时调控。由于 LT不是一个每时每刻都需要满足的约束，因此可以考虑用历史数据做天级别的回放来求解最优的历史</p><p>虽然这几个关键点都是一笔带过，但实际中每一点都会对结果有重要影响，每一点都值得写一篇文章来详细说明（这里就先挖个坑）</p><h2 id="小结">小结</h2><p>用户体验优化，尤其是在搜广推这类复杂业务场景下，并非一个简单的、一蹴而就的工程问题，而是一个需要分阶段、分层次应对的系统性挑战。本文将其梳理为短期、中期、长期三个递进式的策略范式，它们分别对应着应急防御、精准干预和系统重构的不同层次需求。</p><p>短期策略（规则防御）核心在于快速识别与止损。它通过分人群、分流量的规则化 “补丁”，在价值预估偏误、体验损失异质性问题尚未解决时，为系统提供最直接的保护。其价值在于工程上的简单高效，但本质是对非理想现状（预估不准、兑换率非最优）的被动适应，缺乏泛化性与前瞻性</p><p>中期策略（体验建模）通过构建体验信号模型（相关性）或 Uplift 模型（因果性），我们试图更科学地量化用户体验的损失与收益，并基于预估值进行动态、个性化的干预。这一步的核心贡献在于将隐性的体验影响显性化，并为长期的系统融合提供了关键的数据和模型基础。其挑战则在于信号稀疏、建模复杂以及探索成本</p><p>长期愿景（价值统一）是用户体验优化的终极形态，旨在彻底打破 “业务” 与 “体验” 的二元对立。其核心理念是将体验价值转化为与业务目标同质、可自由兑换的 “统一货币”，并通过最优化理论将其内化于排序公式之中。这不再是为 LT “打补丁”，而是让 LT 作为一项原生价值，直接参与端到端的自动化博弈与资源分配。实现这一愿景的关键，在于能否找到可靠的体验代理指标，以及能否稳健地求解价值间的动态权衡参数（即上面公式中的<span class="math inline">\(\lambda\)</span>）</p><p>从本质上讲，这三个阶段刻画了一条从 “局部最优解” 逼近 “全局最优解” 的演进路径。在实践中，它们并非相互替代，而应协同共存：用短期规则守住底线，用中期模型提升效率，并持续朝着长期统一建模的理想架构迭代。未来的用户体验优化，必将是更深度的价值量化、更智能的实时调控，以及更彻底的系统级价值对齐</p>]]></content>
    
    
    <summary type="html">&lt;p&gt;In the evolution of Search, Ads, and Recommendation systems, User
Experience (UX) is an unavoidable core challenge. In this article, we
quantify UX as LT (Life Time), specifically referring to user retention
(e.g., the number of days a user opens the app within a 7-day
window).&lt;/p&gt;
&lt;p&gt;Unlike pure content recommendation, which seeks to maximize total
watch time, optimization in commercial or marketing-oriented sectors
(Ads, E-commerce, Live Streaming) is about maximizing business value
(Cost, GMV, etc.) while staying above a &quot;UX Redline.&quot; More accurately,
it is about &lt;strong&gt;maximizing the efficiency of exchanging &quot;Unit LT&quot;
for &quot;Business Metrics.&quot;&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;We typically use Holdout Experiments (Reverse Experiments) to measure
how a business strategy affects LT. The factors influencing these
results are multifaceted:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Explicit Factors: These are the most direct and well-known,
involving the position and density of business items (e.g., start_pos,
gap, load).&lt;br&gt;
&lt;/li&gt;
&lt;li&gt;Implicit Factors: Supply quality and ranking accuracy. The quality
and diversity of ad creatives or live-streaming content determine the
appeal of the distribution queue. If supply is insufficient or ranking
is inaccurate, users are less likely to be attracted to the
platform.&lt;br&gt;
&lt;/li&gt;
&lt;li&gt;Opportunity Cost (Backfill Logic): A frequently overlooked point. A
holdout experiment compares the &quot;Business Queue&quot; with a &quot;Backfill Queue&quot;
(usually the organic recommendation queue). The final impact on LT is
essentially:&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;span class=&quot;math display&quot;&gt;&#92;[&#92;Delta LT = LT_{Business} -
LT_{Backfill}&#92;]&lt;/span&gt;&lt;/p&gt;
&lt;p&gt;The negative impact on LT is minimized only when the business content
is as attractive as—or more attractive than—the organic content it
replaces.&lt;/p&gt;
&lt;p&gt;While improving supply and ranking accuracy are the fundamental
drivers for LT, they take time to yield results. In day-to-day
engineering, adjusting load, start pos, and gap remains the most
immediate lever. Furthermore, we must establish strict defensive
mechanisms to prevent short-term gains from masking long-term,
cumulative UX damage.&lt;/p&gt;
&lt;p&gt;This article explores the evolution of UX optimization through three
stages: Short-term Defense (Heuristic Protection), Mid-term Tuning
(Experience Modeling), and Long-term Alignment (Unified Value
Modeling).&lt;/p&gt;</summary>
    
    
    
    <category term="计算广告" scheme="https://wulc.me/categories/%E8%AE%A1%E7%AE%97%E5%B9%BF%E5%91%8A/"/>
    
    
    <category term="计算广告" scheme="https://wulc.me/tags/%E8%AE%A1%E7%AE%97%E5%B9%BF%E5%91%8A/"/>
    
    <category term="机器学习" scheme="https://wulc.me/tags/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/"/>
    
    <category term="推荐" scheme="https://wulc.me/tags/%E6%8E%A8%E8%8D%90/"/>
    
  </entry>
  
  <entry>
    <title>出海、选择与 “弯路”</title>
    <link href="https://wulc.me/2025/10/05/%E5%87%BA%E6%B5%B7%E4%B8%8E%E9%80%89%E6%8B%A9/"/>
    <id>https://wulc.me/2025/10/05/%E5%87%BA%E6%B5%B7%E4%B8%8E%E9%80%89%E6%8B%A9/</id>
    <published>2025-10-05T08:51:23.000Z</published>
    <updated>2026-02-28T05:01:22.768Z</updated>
    
    <content type="html"><![CDATA[<p>许多人大概都读过这段充满宿命感的话：</p><blockquote><p>当你老了，回顾一生，就会发觉：什么时候出国读书、什么时候决定做第一份职业、何时选定了对象而恋爱、什么时候结婚、其实都是命运的巨变。只是站在三岔路口，眼见风云千樯，你作出抉择的那一日，在日记上，相当沉闷和平凡，当时还以为是生命中普通的一天</p></blockquote><p>这段自出《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8xMTUwNTkzMC8=">杀鹌鹑的少女<i class="fa fa-external-link-alt"></i></span>》的文字，具象化了选择的厚重感。而事实上，很多 “当时只道是寻常” 的瞬间，确实会这个名为 “人生” 的游戏开辟很多新的分支。最近几天在玩<span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvRGV0cm9pdDpfQmVjb21lX0h1bWFu">Detroit:Become Human<i class="fa fa-external-link-alt"></i></span>这款游戏，通过三个仿生人（androids）徐徐展开讲述了一个有关人工智能、科技、伦理、人性的故事，而故事的结局是由你在游戏中的种种抉择所决定的，你的一个不经意的选择，可能会掀起一场人类与仿生人的流血革命</p><p><img data-src="https://wulc.me/imgs/life_paths.jpeg" height="50%" width="50%"></p><p>都说选择大于努力，我们特别擅长拿着后视镜去度量一个选择的 “好” 与 “坏”。因为我们没有上帝视角去获取整个游戏的FlowChart，去看到那些未选择之路种种；更要命的是，我们在当前已选择的道路上的任何操作无法撤销或回滚，当最终的结果不太如人意时，就会在事后复盘时被打上一个 “走了弯路” 的标签，然后幻想那条未选择的道路所拓展出来的分支</p><p>最近就面临着一个关于出海的选择，一直觉得出海是国内企业发展的未来，但是真正面临这样的选择时，也少不了瞻前顾后、忧心忡忡，总想小心翼翼地迈出下一步，希望少走 “弯路”。脑子里的各种观点打架打了好多天，我觉得是时候写一篇文章来梳理一些这个迷思了。本文是关于出海和选择的一些碎碎念，祝开卷有益～</p><span id="more"></span><h1 id="关于出海">关于出海</h1><h2 id="失落日本的出海史">“失落” 日本的出海史</h2><p>B 站有个分析师 up 主针对日本的出海历史做了一个<span class="exturl" data-url="aHR0cHM6Ly9zcGFjZS5iaWxpYmlsaS5jb20vMzgzMzUwMTEwL2xpc3RzLzQxMjk4NzY/dHlwZT1zZWFzb24=">出海专题<i class="fa fa-external-link-alt"></i></span>，从宏观角度讲述了日本的出海历史，同时提供了个人在这种大环境下的一些选择。最近又出了一本《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zNzQ2NzUzNi8=">以日为鉴<i class="fa fa-external-link-alt"></i></span>》的书籍，虽说历史不会重演，但免不了会有惊人的相似性，可以读一下作为参考（下面的这些数据基本来自这些视频和书籍，但豆瓣的书评提到，这本书的一些数据可能不够权威，笔者在引用时也会尝试找到其出处）</p><h3 id="海外再造日本">海外再造日本</h3><p>截止 2022 年末，日本的海外净资产达到了 418万亿日元。与此相比，当年日本国内总额为 545 万亿日元，由此形成了所谓 “<span class="exturl" data-url="aHR0cHM6Ly9uZXdzLnFxLmNvbS9yYWluL2EvMjAyNDA3MThBMDBISzEwMA==">海外再造日本<i class="fa fa-external-link-alt"></i></span>” 的经济现象</p><p>日本在进入<span class="exturl" data-url="aHR0cHM6Ly96aC53aWtpcGVkaWEub3JnL3dpa2kvJUU2JTk3JUE1JUU2JTlDJUFDJUU2JUIzJUExJUU2JUIyJUFCJUU3JUJCJThGJUU2JUI1JThF">泡沫危机<i class="fa fa-external-link-alt"></i></span>后，首先遇到的最大问题就是<strong>增量减少</strong>。<u>以房产投资和日常消费为代表的内需走向低迷。泡沫破裂前，80 年代日本雇员薪资增速约 5.5%；破裂后的 92 年，迅速降至 1.8% 左右，此后长期负增长，工资下滑进一步导致国内消费需求萎靡。</u>（此时此刻，恰如彼时彼刻？）当时，日本庞大的内需市场快速萎缩，全社会从消费型转向储蓄型，市场陷入同质化竞争。内卷之下，服务业不得不提升质量以吸引客户，这倒逼出了极致的服务态度</p><p>在此背景下，日本于 1994 年开启大规模出海潮，企业利润也逐渐回升。2000 年，日本企业利润重回 1989 年高位；2007 年，全国企业利润已是泡沫经济前的 1.5 倍。上世纪 90 年代泡沫破裂后，日本对外直接投资占 GDP 比例从 1990 年的 6.5% 迅速提升至 2021 年的 40%。21 世纪的第一个十年，更实现了出口和投资双轮驱动。出口额占 GDP 比重从 95 年最低的 8% 升至如今的 20%。据大和证券统计，日本上市公司海外利润占比接近 60%，多个行业龙头海外收入超 75%</p><p>那么，这又是如何做到的？</p><p>泡沫破裂后，日本对外直接投资的动机主要包括以下几个方面<u>（1）拓宽本国的海外品牌影响力（2）在海外重塑全球分工体系（3）利用先进技术优势换取海外市场（4）寻求低成本的劳动力</u>。而在具体运作上，基本的逻辑是：一方面<strong>寻找中国与东盟为代表的亚洲新兴经济体利用其劳动力与市场优势</strong>，另一方面<strong>通过新兴经济体的利润反哺研发，实现欧美市场所需的技术创新</strong></p><p>这也意味着日本对外投资活动主要以市场和技术驱动为主。日本同时需要从新兴经济体获取利润又需要和欧美企业进行竞争，事实上目前的中国也正在走上这条被追赶的路，一方面一带一路扩大在新兴国家的影响力，另一方面重复高端技术以蚕食欧美企业份额</p><p>90 年代，日本大量投资东亚新兴经济体。自 1995 年始，索尼、东芝、丰田、大金等头部企业组成产业联盟抱团出海。此轮出海目的地不再是 80 年代首选的美国，而是中国与东南亚。1995 至 1996 年，日本对东南亚直接投资占总额 20%，中国占 10%。此后数年，日本将国内产业链集中迁至不同国家，<u>把低端产能转移到海外廉价劳动力市场，国内保留高利润的高端产能</u>。</p><p>2000 年左右，日本商品迎来中国进口需求的爆发。中国迅速释放的内需，吸收了日本在华工厂的大量订单。日本在华工厂本地销售比例从 1999 年的 31% 猛增至 2010 年的近 70%。可以说，日本早期在华投资建厂，既赚取了廉价生产成本与土地红利，也吃到了中国发展的时代红利</p><p>在投资出海的同时，日本国内产业结构也在剧烈调整。泡沫破裂前，金融业是日本市值最高板块，占比近 30%。日股市值前 30 的公司中，一半属金融行业。金融与地产股一度占全市值 38%。</p><p>三十年后，金融股仅占 8%，地产股不到 2%。市值最高的四大行业依次为工业、消费、信息产业与医疗健康，占总额 65%。而泡沫破裂前，医疗仅占 3%，信息产业占 5%，消费品占 11%。事实上，除工业制造这一日本 80 年代的荣耀外，其余三大行业多在泡沫破裂后崛起，且基本属非制造业范畴；工业、消费、信息产业、医疗健康这几个产业，其最大市场恰恰在海外，海外收入常年高于国内。以医药龙头第一三共为例，其 2022 年日本营收仅占 35%。</p><h3 id="普通人的出海之路">普通人的出海之路</h3><p>上面都是偏宏观的数据，落到普通人头上，在出海这个新游戏里，机遇又在哪里？回顾历史，会发现里面有一个比较核心的思想：<strong>在国内增长放缓时，将自身技能、商业头脑或资本与海外市场更早期的发展阶段相结合，从而获得溢价和机遇</strong></p><p>当年的普通日本人，主要有 3 个出海增量机会。分别是<u>工作出海，商业出海与投资出海</u></p><p><strong>（1）工作出海</strong></p><p>工作出海，或者说跟随公司出海是最主流、最稳妥的方式，也是普通人最有机会的领域</p><p>在说出海的企业对个人的影响前，可以先看一下日人普通人的择业观和变化，也许会对我们有更多启发</p><p>从就业选择看，泡沫前 80 年代，日本最受欢迎的企业中，除索尼与丰田外，几乎全是当时如日中天的金融和地产公司。泡沫时期，金融业普通员工工资是社会平均的 2.8 倍，中层干部达 4.1 倍。从业人员从 1976 年的 150 万，十年后增至近 265 万</p><p>然而，泡沫经济后的四年，日股跌 60%，地价跌 50%。日本金融业模式特殊，自成一体，缺乏国际化能力，国内业务萎缩，又难以开拓国际业务，加之房产泡沫破裂导致不良率攀升，行业盈利能力骤降。证券业首当其冲，前五年主要通过裁员降薪维持，从业人数仅降 15%。但 1997 年 11 月，日本最大券商山一证券破产，行业彻底进入破产潮。当年金融从业人口减少 60 万，部分 “幸运儿” 转入号称永不倒闭的银行业</p><p>随着 1998 年亚洲金融危机爆发，日本银行体系全面崩塌，四年间累计 150 家银行破产，日本金融业坠入深渊，大量转型银行的金融人员再度失业</p><p>尽管日本银行业于 2000 年开启重组出海，但直到 2005 年不良率才降至 3.5%，出海收入占比开始快速提升。此时，距泡沫破裂已过去十五年。尽管此时日本金融业开始吸纳海外岗位，但 90 年代的 “天之骄子” 们大多已转行，或所学知识难以适应海外业务需求。这大概就是 “<strong>时代的一粒尘，落在个人头上，就是一座山</strong>” 了</p><p>此外，<u>泡沫破裂后，日本迎来了接近 10 年的考公热，公务员报录比例超过1:30，但随着此后持续的低薪与工作量升高，公务员逐渐被日本年轻人所抛弃，如今报录比仅为1:3</u></p><p>实际上，90 年代后，日本除大企业外，有三类公司异军突起：第一类是消费降级型，如优衣库；第二类是隐形冠军，如基恩士；第三类是出海抢单的非制造业企业。第二、三类企业创造了大量就业，甚至在 90 年代日本 “就业冰河期” 形成了 “出海暖流” 之说。<u>日本出海一代，既躲过了国内经济下行的内卷，又凭借海外增量机会，摇身成为 2000 年后日本中产的主力之一</u></p><p>一个典型例子是技术人才。当丰田、本田等在泰国、美国设新厂时，一名在日本本土有经验的产线班长或质控员，可被派往海外，培训当地员工，确保流程与品质标准与本土一致。他们能获得可观的外派津贴，并享受当地较低的生活成本。另一种模式是日企海外子公司本地化运营，催生了对既懂技术又了解当地市场人才的需求，为日企员工加入本土企业创造了条件</p><p>工作出海这种方式的特点往往是<strong>大企业先行，中小企业随后成为主力；从配套生产到独立经营；对技术、营销人才需求大都比较大</strong>。最常见的是日本大企业在海外设厂，催生对配套供应链的需求，许多中小企业和个人创业者会为这些海外日企提供零部件和生产服务，而结果就是日本破产中小破产企业数量在 1998 年登顶后一路下滑，10 年后基本降到泡沫前水平，保住了就业的基本盘，与之相反的是韩国在遭遇金融危机后，中小企业集中倒闭后大企业一家独大的局面</p><p><strong>（2）商业出海</strong></p><p>商业出海指的是那些更具冒险精神的人，利用海外市场对日本产品和生活方式的好奇，开创个人事业</p><p>例如，一个曾在餐饮业工作的日本人，看到曼谷或雅加达的日资企业员工和当地富裕阶层对正宗日料的需求。他带着积蓄，在当地开一家小而精的居酒屋或拉面店，从日本进口关键食材，严格复制日式烹饪与待客之道，靠 “正宗” 招牌站稳脚跟</p><p>另一种方式，类似今天的 “跨境电商”。例如，一位熟悉日本消费品市场的主妇或上班族，发现中国富裕家庭开始追求高品质日货。她小批量采购日本母婴产品（如尿不湿、奶粉）、美妆（如 SK-II）、家电（如虎牌电饭煲），通过早期电商平台或线下渠道销售，赚取差价</p><p><strong>（3）投资出海</strong></p><p>投资出海，更多是通过海外金融产品和不动产实现。这也是当下国内投资者常见的模式 —— 身在国内，投资全球</p><p>典型的例子是，一个普通的东京上班族，看到国内利率近乎为零，股市低迷。他将每年的一部分奖金投入到银行或证券公司推荐的 “国际分散投资” 基金中。这些基金专门投资于正在增长的海外市场（尤其是东南亚和美国）的股票和债券，让他能间接分享海外经济增长的红利，实现对冲国内经济风险的目的</p><p>实际上，有一个诞生于日本的概念，精准描述了这一现象 ——<span class="exturl" data-url="aHR0cHM6Ly96aC53aWtpcGVkaWEub3JnL3dpa2kvJUU2JUI4JUExJUU5JTgyJThBJUU1JUE0JUFBJUU1JUE0JUFB"> 渡边太太<i class="fa fa-external-link-alt"></i></span>：指的是以进行借贷利率低的日圆，兑换成外币后向海外高利资产投资做为理财持家手段的炒汇散户，渡边是一个常见的日本姓氏，里面有有一大部分炒汇散户为家庭主妇，《<span class="exturl" data-url="aHR0cHM6Ly96aC53aWtpcGVkaWEub3JnL3dpa2kvJUU3JUJCJThGJUU2JUI1JThFJUU1JUFEJUE2JUU0JUJBJUJB">经济学人<i class="fa fa-external-link-alt"></i></span>》便以渡边太太来称呼这些进行外汇操作的个人投资者</p><p>这其中，蕴含着一个核心理念：<strong>在通胀国挣钱，在通缩国花钱</strong>。这个理念时至今日其实也不过时</p><p>在这个问题里《<span class="exturl" data-url="aHR0cHM6Ly93d3cuemhpaHUuY29tL3F1ZXN0aW9uLzE5MTE3MTIxODIxNzA4MDU1MzEvYW5zd2VyLzE5MTY0MTg1ODM0NzY1Mzk0NTY=">北京土著中产要润么？<i class="fa fa-external-link-alt"></i></span>》，有回答提到了相似的理念</p><blockquote><p>如果回到 1990 的日本，东京土著中产要润吗？卷又卷不过，躺平不甘心，重启人生不确定性太强。靠长辈托举，在东京衣食无忧，到底要不要润到欧美、加拿大和澳大利亚？</p><p>正确回答是：<strong>把东京的资产卖了，换成美元资产进行投资，然后继续生活在日本</strong>，东京大阪名古屋，自己爱住哪住哪。投资海外，生活日本。即使搬去北海道夕张都没事，人跑光了和你又有什么关系<br>以上策略后来被总结成一个经济学术语：渡边太太。至于那些觉得日本能走出通缩，死扛不卖，投资日本固定资产的，在 30 年以后日本终于开始走出通缩时，已经熬成老头老太太，成功过上了生活费不足需要继续工作的退休生活，被东大人挂在网上嘲笑</p><p>以上策略过去 30 年回测适用于东京。至于能不能用在北京，你自己考虑。你们都可以拿来回测一下当年的东京中产，看看策略能不能跑通。<strong>我们做金融的一般来说有个原则：回测跑通的策略不一定对，但是跑不通的那些直接 pass</strong></p></blockquote><h2 id="出海这一站我们身在何处">出海这一站，我们身在何处</h2><p>观察当下中国，与 90 年代初的日本宏观环境，会发现对于普通人的影响因素高度相似</p><p>人口因素上，虽总人口下降，但适龄劳动人口尚未减少，简单说，就是岗位少了，干活的人却没少。就业市场上，房地产与消费均陷低迷，原吸纳大量就业的行业普遍收缩。外部环境上，90 年代日本同样面临与美国贸易摩擦，出口受限</p><p>前述大和证券统计显示，日本上市公司海外利润近总利润 60%，多家龙头海外收入超 75%。反观中国，2023 年上半年，中国境内上市公司海外总利润 3398 亿元，仅占 8.8%。这表明当前中国上市公司高度依赖国内市场。若能实现全民出海，海外利润端或有 5 倍以上增长空间，进而将海外利润增长转化为经济承压期的新动能。我国倡导全球贸易与一带一路，也正是鼓励中国企业出海</p><p>从 2021 年开始，中国就进一步加大了对越南的投资，在视频《 <span class="exturl" data-url="aHR0cHM6Ly93d3cuYmlsaWJpbGkuY29tL3ZpZGVvL0JWMUNyNDIxODdYRQ==">【全球经济】为何 2023 越南经济增速下滑欧美撤资 中国加仓越南为何选择与中国修补关系<i class="fa fa-external-link-alt"></i></span>》里提到了这个现象。中国此轮加大越南投资，主要是 <u>&gt; 换取越南内需市场，以及利用越南劳动力优势的三角循环，另外也是希望中国的品牌进入到亚非拉国家的民众心智中，实现早期的心智占领，从而为后续占领这些国家的市场打下基础</u>。这套逻辑跟前面的提到的日本在东南亚尤其是中国出海投资的逻辑类似：以市场和技术驱动为主，需要同时从新兴经济体获取利润以及和欧美企业进行竞争</p><p>尽管 2018 年后因贸易战等因素，上一轮出海热戛然而止。但根据 <span class="exturl" data-url="aHR0cHM6Ly93d3cucHdjY24uY29tL3poL3NlcnZpY2VzL2RlYWxzLW0tYW5kLWEvcHVibGljYXRpb25zL21hLTIwMjMtcmV2aWV3LWFuZC1vdXRsb29rLmh0bWw=">普华永道的统计<i class="fa fa-external-link-alt"></i></span>，2023 年中国民营企业的海外并购市场结束了连续 3 年的下滑，并购额触底反弹重新回到 120 亿美元大关。虽然 2018 年以后，因为众所周知的各种因素叠加，上一轮出海热戛然而止。但随着 2023 年以后，以比亚迪与阳光电源等新能源企业出海为起点，产业资本成为了这一轮出海热的先驱。而在2024 年，我国上市公司海外收入在去年已经两位数增长的情况下，再次出现近10% 的增长，历史上首次突破 10 万亿收入大关，海外已经能占到总收入的13.8%。与海外市场高歌猛进不同，国内市场则呈现持续低迷，2024 年上市公司国内收入出现 10 年来首次负增长。<em>目前我国境内外收入增长差已经接近 10%，非常接近日本当年全面出海潮启动的指标</em></p><p><strong>随着企业出海的加速，必将带动的是国内人才向海外流动的加速</strong></p><p>若以日本为参照，伴随 2023 年中国新一轮企业出海潮开启，我国普通人的出海机遇期也已到来。以美世与领英的报告为参考，2015 年至今，中国外派岗位数量增长约 640%，2023 年更增长近一倍。可以说，中国普通人正面临工作出海的机遇。截至 2023 年，中国财富 500 强企业中，91% 拥有不同形式的海外业务。据统计，中国已有 5.9 万家企业开展出海招聘，近两年岗位数量呈爆发式增长，领英预计到 2026 年，中国海外招聘岗位将达 450 万个</p><p>分行业看，新能源车行业是近两年出海招聘岗位增长最多的领域，增幅达 412%。互联网与消费电子行业紧随其后。以游戏赛道为例，因东南亚和拉美人口基数大、获客成本低，其海外游戏利润率通常高出国内 30% 以上，而高利润率往往意味着高收入。可以说，在新能源车、互联网与消费电子这三个领域，是否出海工作已非判断题，而是一道人生的选择题</p><p>除了行业，具体岗位需求也有了较大的变化</p><p>不同于过去 10年中海外招聘主要以<strong>销售</strong>为主的固有印象。根据美世的报告，海外企业对于<strong>运营</strong>岗位的需求开始变的更加强烈，因部分早期出海企业已具备一定市场基础，经营开始向本土化与再国际化深化，此过程需大量运营人才支撑。如何培育足够多的运营人才维系已开拓的海外市场，成为许多企业新阶段的出海难题</p><p>日本在进入到 1998 年以后，其出海行业也逐渐转向多元化。在这个过程中，日本有两类人极大的受益：<u>第一类是在多元化转型初期就进入到海外市场的从业者</u>，通过将日本的经营模式与本土化进行结合，利用当时日本强大的供应链从而快速形成成本效应，由此赚到了丰厚的加工利润并进行产业升级 --90 年代末的日本制造业企业出海基本都是这个路子。<u>第二类则是在 2000 年以后通过不断进行本土化改造，将日本产品彻底中国化的各类企业</u>，这其中即包括丰田，也包括无印良品等零售企业海外从业者，一般称之为日本的品牌出海企业</p><p>日本的这两类人，恰与 2023 年中国出海人才的需求画像开始重叠。一方面，我们的新能源、电子类企业开始大规模海外设厂，海外技术类工程师紧缺；另一方面，前述海外运营人才紧缺，正是海外企业深化本土化改造所催生的需求。据霞光智库报告，2024 年我国出海招聘岗位中，对本科以上学历要求占 86%，要求工作 5 年以上岗位超一半。企业对人才要求如此之高，是因部分中国企业已进入深度本土化运营时期，急需高学历人才支援，而非简单劳务工种</p><p>但根据统计，超过一半的企业都表示海外人才招聘十分困难。主要原因之一是<u>目前多数 30 岁以上的从业者较难接受出海工作</u>，该年龄段出海意愿普遍低于 40%，且年龄越大意愿越低。<strong>家庭因素与水土不服</strong>是两大主因。另一方面，95 后出海意愿断崖式领先所有年龄段，多家机构统计其意向度超 75%。以猎聘海外岗位投递数据为例，95 后群体投递次数是全年龄段平均的 4 倍</p><p>这就引发了一个有趣的<strong>人才倒金字塔现象</strong>：尽管多数出海企业在问卷中表示希望招聘 5 年以上、具国际视野的复合型人才，但因早期合适应聘者太少，企业只能先招聘 95 后慢慢培养。随后几年，因这些企业快速发展，早期培养的 95 后反而成为最快具备国际化视野的群体。目前，在海外人才市场中，95 后是所有年龄段占比最高群体，在互联网等新兴行业占比超 60%，90 后占比超 82%。可以说，30 岁以下年轻人吃到了中国近几年互联网出海的第一波红利</p><p><u>虽然说了这么多出海的潜在益处，但是不得不承认的是，当下全球的复杂形式也给中国未来的出海之路带来了阻碍。比如说美国的各种贸易战、关税战。然而，或许就如中国经济这40年崛起之路一样，道路是曲折的，但前途也是光明的。毕竟，日韩在其全面出海之路上，亦曾遭遇不同国家的打压。但中国出海浪潮的趋势应不会改变，产业与文化双出海的战略机遇期，将配合 “一带一路”，成为我国未来二十年新的巨大红利。而这一红利，往往将献给最先行动的勇敢者。毕竟，若已是确定无疑的机会，又怎会轻易落到普通人手中？</u></p><h1 id="选择与努力">选择与努力</h1><p>都说选择大于努力；我们身边总不缺少 “人生赢家” 的故事，故事的版本往往类似：在关键时刻做出了一个 “英明” 的决定，于是乎就享受了时代的红利，从此顺风顺水，功成名就。这很容易让我们产生一种感觉：存在一个 “好选择”，一旦选中，人生就能开启简单模式</p><p>那什么样的选择才叫做好选择？什么样的努力才叫做有意义的努力？而在出海这个问题上，选择和努力又应该如何权衡？</p><h2 id="什么样的选择才叫做好选择">什么样的选择才叫做好选择</h2><p>什么样的选择才叫做好选择？比如说在 2008 年入大 A 然后 2016年清仓？比如说用卖出的钱买入房市和比特币并在 2021 年出？比如说在 2016年加入字节跳动然后把期权比例要满并且持着不卖？</p><p>亲爱的，这不叫好选择，这叫做好运气，或者说好梦（白日梦的梦）。在真实生活的选择里，我们无法拿着后视镜去踩中每一个风口和好趋势。而且盈亏同源、祸福相依，当前的后视镜看到的上行期的美，在另一个平行宇宙里，也许就是下行期的痛了</p><p>赌博也许算选择频次最高的行为之一了，一盘接着一盘，买定离手，需要在短时间做出选择，然后或赢或输，再开启下一盘。我很喜欢于宙的这篇演讲里《<a href="https://wulc.me/2015/11/20/%E6%88%91%E4%BB%AC%E8%BF%99%E4%B8%80%E4%BB%A3%E4%BA%BA%E7%9A%84%E5%9B%B0%E6%83%91">我们这一代人的困惑</a>》关于赌博、或者说 “选择” 的故事</p><blockquote><p>上大学的时候，我热衷于各式各样的赌博游戏，是学校旁边赌场的常客。我赌徒生涯的起点源于赌场里最基本游戏轮盘赌，轮盘上1 到 36 个数字和两个 0，赔率是 1 赔 36。1 到 36分为红黑两色，押注红黑的赔率是 1 赔 1</p><p>作为一个合格的接受过九年义务教育的人都知道，每一次轮盘开始转动的那一刻，都是一次纯粹的独立随机事件。但是赌博这件事情的魅力就在于，当你真正身处赌场，看到已经连续4次开出红色的时候，几乎所有人都会想把筹码压在黑色的那一面。而我当时的梦想，就是破译这其中的奥秘</p><p>我最初的策略非常简单，当连续三次开出奇数，就押注偶数，连续三次红色，就押注黑色。难以置信的事情发生了，在我严格地执行这个策略的情况下，前几次去赌场不但全身而退，每次都还赚了不少，以至于我产生了一种幻觉，也许游戏是有规律可循的，我已经看到了人生巅峰就在不远处向我招手。当然最终的结尾你们一定想到了，在经历过连续18 个偶数，连续开出 21 次黑色后，我把之前赚到的钱都乖乖地还给了赌场</p><p>后来我知道，我那个愚蠢的梦想叫做赌徒谬论，就不具体展开讲了。但它对我意义深刻，我终于明白了<strong>在纯粹的随机事件面前，一切规律都是无谓的</strong></p></blockquote><p>我们生活中遇到的所有事情基本可以分为三类，<u>第一类纯粹由随机性决定，比如布朗运动和轮盘赌博；第二类纯粹由能力决定，比如英语六级考试、110米栏之类；第三类，也是我们最常遇到的，由能力和随机性共同决定，比如创业、投资、恋爱或是梦想</u></p><p>当我们回头去看，那些看似有规律可循的 “机会”，其核心充满了随机性。一个选择在当下看来是 “好” 是 “坏，往往不取决于选择本身，而取决于它背后那套由能力和随机性共同作用的复杂系统</p><p>如果说 “一命二运三风水”、“生死有命，富贵在天”，在随机性面前我们确实会无能为力，如果是这样，那什么样的选择才是 “好选择”？</p><p>也许，<strong>当你能够清晰认知到所作出的决策里，随机性占比有多高，这就是一个 “好选择”</strong>。当你有这种清晰的认知后，你才不会把所有的希望都寄托于运气，也不会在失败后，完全归咎于自己 “选择失误”。就像你决定是否要All In去闯荡演艺圈，你得明白，黄渤的成功里实力固然重要，但那万里挑一的运气，可能才是决定性的。认识到这一点，你才能心平气和地接受任何一种结果。而一个人在年轻的时候，做的每一件事情，能清楚地区分其中随机性所占的比例并能心平气和地接受它，也许就是最宝贵的财富</p><p>人类的大脑中有一个名为 “杏仁核”的器官，主要帮助我们应对生活中的危机事件，所以对 “坏消息” 极其敏感，坏消息也更容易让我们感同身受。在必要时，杏仁核可以救命。但是在日常生活中，我们也很容易被“杏仁核” 挟持，让我们倾向于只看到负面消息，同时做出灾难化想象</p><p>选择、或者说随机性，往往会让人恐惧，其原因是只看到了负面部分。但我们需要记住<u>不确定性是两面的，同时决定了上行风险与下行风险</u>。我们很容易过于在乎「下行风险」，以至于忘记自己完全有能力、有可能做出更好的结果</p><p>所以，<strong>也许一个好选择，是你能同时看到随机性带来的上限和下限的选择</strong>，去看数据、看事实，从数据和第一性原理出发去判断一件事情的好坏，而不是原始的恐惧情绪</p><p>那当外部有很多负面的声音的时候，我们又应该如何应对呢？《钝感力》这本书有一句笔者比较喜欢的话</p><blockquote><p>在人缺乏自信或犹豫不决的时候，无论怎样的左思右想都于事无补。因此在这种时候，就要摒弃杂念，更为大胆、充满自信地向前迈进才行。</p><p>犹豫不决，不仅根本无法前行一步，还有可能往后倒退。对于你的犹豫不决，很多人当然会有他们各自的看法。而这时，我们要做的就是从中选出自己听起来最为顺耳，最能够使自己振作并快乐地努力下去的话语，从而坚定不移地向前迈进</p></blockquote><p>虽然上面说的都是有点偏心态层面有点虚，但这的确非常重要，至少不会让你在某一次结果不如人意之后怨天尤人，失去做下一次选择的勇气和持续向前的魄力。<strong>在我们心里能接受随机性把我们置于最差的结果后，也许我们能开始尝试 “预测和计算” 每个选择的优劣了</strong></p><p>从统计学的角度，每次选择的期望是可以形式化演算出来的，以最简单的压大小为例。如果本金是<span class="math inline">\(a\)</span>，胜出后得到的总奖金是 <span class="math inline">\(b\)</span> (<span class="math inline">\(b \gta\)</span>)，胜率是 <span class="math inline">\(p\)</span>，那这这选择收益的期望就是</p><p><span class="math display">\[E = p*(b-a) - (1-p) * a = pb -a\]</span></p><p>只要保证这个期望为正，那根据<span class="exturl" data-url="aHR0cHM6Ly96aC53aWtpcGVkaWEub3JnL3dpa2kvJUU1JUE0JUE3JUU2JTk1JUI4JUU2JUIzJTk1JUU1JTg5JTg3">大数定律<i class="fa fa-external-link-alt"></i></span>，在重复多次的试验中，实际的收益的均值就会趋近这个期望</p><p>但生活的奇妙之处在于，一是我们是没法知道那个分布的，也就是上面 <span class="math inline">\(p\)</span>的这个值我们是无从得知的，而且每次选择都是不同分布的。二是生活中绝大部分的选择是没法像大数定律那样，可以重复抛硬币去让最终平均收益逼近期望收益</p><p>即便如此，<u>在我们每一次的选择里，可以尝试问一下自己这几个问题：我们关注的收益有哪几方面（健康、金钱、技能等）？我们 “赢” 的概率（能获取到这部分的收益的概率）有多大？如果我们 “输” 了，损失的东西我们是否能接受的？而在这个选择 “赢” 的概率中，随机性又扮演了大的角色？</u></p><p><strong>这些问题也许不能很好做量化，甚至做量纲对齐本身就是一个比较千人千面的答案。但也许当我们能够对自己诚实，去一遍遍的询问拥有着 “一颗不断强大的大脑和一颗充满恐惧、贪欲和脆弱的玻璃心” 的自我时，也许我们就能知道哪些是当下对你最重要的是什么；也许我们就能够学会理解和接受人生的偶然性；也许我们就能允许自己恐惧，因为未知自然让人恐惧，这是你心灵的自然反应；也许我们就可以相信：<u>每个人都有一条路，这条路有很多错综复杂的因素促成，但一定由一个人在当时当地能够做的最好的选择组成。所以你提前恐慌或者不恐慌，并不能改变什么。走上去以后，就好好地走，才能精彩</u></strong></p><h2 id="什么样的努力才叫做有意义的努力">什么样的努力才叫做有意义的努力</h2><p>既然生活充满着随机性和不确定性，没有绝对的 “好选择”，那该朝着哪个方向努力？还有什么事情值得努力？或者说什么样的努力才叫有意义的努力</p><p>这里我还是想借用《我们这一代人的困惑》里的例子，因为实在是写得非常好</p><blockquote><p>去年这个时候，我和朋友在琢磨去大庆做点服装生意，决定去考察几个商场。我当时住在北京，因为之前晚上和朋友在外面玩得比较尽兴，回到家里已经比较晚了，担心睡觉睡过头会错过航班，那晚上就直接在沙发上靠了一晚。那是我第一次去哈尔滨，十一月份已经很冷了，衣服拿得不足，下了飞机冻得头疼。又因为没有提前订票，到了哈尔滨之后才买的火车票，发现就只剩站票了。于是，当我一晚上没睡，冻得头晕眼花，又在绿皮火车上站了两个多小时之后，抵达大庆的那一瞬间我觉得自己实在是太不容易了，将来必须要写进回忆录里面。可是，回头仔细一想，<em>这些所谓的“努力”对我最终把那个服装生意做好，没有半毛钱关系。更何况，如果我前一天晚上能早点上床睡觉，多准备点衣服，提前在网上把火车票订好，完全可以舒舒服服地达到同样的目的</em></p><p><u>我的那次经历像是自己二十多年生活中很多事情的缩影，沉溺在对结果没有直接帮助只是因为自己遭受了一些痛苦的行为中，误以为那就是努力</u></p><p>当我终于意识到我并不是唯一曾经<strong>把无意义的消耗当作努力</strong>的时候，忽然发现，原来生活中我觉得很努力的人，也许没那么勤奋，如果在正确的方向上坚持行动，超过他们也并不困难</p></blockquote><p>我们这一代人对于勤奋和努力的理解，几乎清一色地来自于学校，更精确地说，在前二十多年的生活中，我们眼中最努力的人，就是那些最能拼命看书和做题的人。实际上，这种理解是极其片面而幼稚的，因为看书和做题本身，都是为了一个极其鲜明的目的而存在的，就是通过考试。这种勤奋的付出极其纯粹，更多的复习时间，更高的复习强度，一般而言，都可以直接地提高考试的分数</p><p><strong>但生活的美妙之处却在于，很多事情在我们没做到一定程度之前，是完全没法理解的。生活很多事情的回报曲线往往是非线性的，需要经过漫长的潜伏和积累，才会有质的突破</strong>。就好像作者在演讲里提到的学英语的例子</p><blockquote><p>这就好比学英语，十几年漫长的岁月里我都在幻想，要通过多么复杂的流程，多么精密的设计，多么全面的涉及和多么不可思议的努力，终于有那么一天，或许我就能因为前期的那些无懈可击的学习，说一口比较流利的英语，像说中文一样，可以边说边想，而不是说每一句话之前设计它的句式时态词汇然后在心里复述几遍再看上去流利地背诵出来。谁不是这么设想的呢？可惜，它不仅从来没有实现，并且让我看不到有任何实现的趋势，对于每一个设立目标的人来说，没有比这更痛苦的感受。</p><p>但是在去了美国两年左右的时间之后，我忽然发现自己已经可以毫无障碍地说一口流利的英语了。这并非我采用了什么新的学习方法，而是因为去了印第安纳之后身边中国人很少，在没有选择的情况下，只能被迫用英语去交流和表达，在这个过程中，我并没有认真想过自己每天进步了多少，也没有阶段性的检验学习效果，只是不停地去听和说，因为没有选择嘛。直到两年多后的忽然有一天我才意识到，咦，自己好像真的已经可以了。但是我确实无法总结出来是如何一步一步做到的，只是那两年的时间，我一直都在很不情愿地用英语去生活嘛。</p></blockquote><p>一个人能获得的最可贵的能力，也许和掌握一门语言一样。<strong>你所付出的努力不是能够获得即时回馈的，甚至在很长的一段时间内没有任何收获，直到积累到了一定的阶段后，忽然爆发出惊人的力量</strong>，连你自己都不清楚这一切是如何发生的</p><p><u>当你经历了足够多的量变后引起质变时所拥有的技能，大部分人是终身难以企及的，不是因为他们太笨，恰恰相反，因为他们都太聪明了。触发人类行动的最基本原理被称为反射，我们是需要即时回馈的物种。所以绝大多数人对于世界的理解度是线性的，但更多情况下，事物却是以漫长的潜伏震荡后爆发突破的形式发展的，比如说学习语言、读书写作、锻炼身体</u></p><p>那回到最开始的问题，什么样的努力才是有意义的努力？</p><p>我想在离开学校之后，在现实生活中，当我们遇到的很多事情不再像做题和考试之间联系得那么紧密时，当付出和结果之间往往没有那么立竿见影时，很多人的付出都是浅尝辄止时，<strong>而最可贵、最有意义的努力，也许是在基于上面反复询问自己内心后而做出的 “正确” 方向上，对那些无法立即获得回报的事情，依然能付出十年如一日的专注和热情</strong>。最终的结果也许不足以让你独孤求败，但足以出类拔萃</p><h2 id="出海中的选择与努力">出海中的选择与努力</h2><p>说到 “出海”，无论是留学还是工作，这大概是当代很多年轻人面临的最典型、也最纠结的选择之一了。它完美地融合了能力、随机性、梦想和现实的冰冷计算</p><p>我们很容易被两种极端叙事裹挟：一种是 “出海即天堂”，描绘了一幅远离内卷、高薪自由的生活图景；另一种是 “出海即深渊”，充斥着文化隔阂、玻璃天花板和难以言说的孤独。这两种叙事都像轮盘赌上连续开出的红与黑，让我们产生一种错觉，仿佛押中颜色就能决定命运</p><p>但正如我们前面讨论的，一个 “好选择” 不是去赌一个绝对正确的答案，而是基于多维度期望值的理性计算。我们可以尝试用 “期望值” 模型来掂量一下 “出海” 这个选择</p><p>我们不能只盯着一个维度的得失，得把几个关键维度打包在一起算个总账，比如说对于笔者，<u>健康、金钱、体验多样性、复利性</u>是几个重要的维度</p><ul><li><strong>健康</strong></li></ul><p>健康是所有 0 前面的那个 1，没有了健康，其他一切都没有意义；而成功的道路有很多，但没有任何一条是必须要以健康为代价的</p><p>很多人出海的理由是国内太 “卷” 了，为了不让过高强度的工作影响到身体的健康而选择去海外。但工作过的朋友都知道，不同团队或部门的工作强度的方差极大；虽然都叫出海，但去到哪个公司，哪个部门，哪个团队，会极大影响你实际的工作强度，所以在选择前，需要做好背调</p><p>此外，你需要评估自己能否承受异国他乡的孤独、文化冲击带来的长期心理压力。有些人天性喜欢新鲜事物，社交能力强，那这个选择的健康期望值就是正的；反之，对于一个极其恋家、内心脆弱的人，强行出海可能意味着巨大的身心健康损耗</p><ul><li><strong>金钱</strong></li></ul><p>这里需要算两笔账。一是直接的成本和收益，学费、生活成本与未来可能收入之间的概率。别光看 “华尔街高薪” 或 “硅谷大包” 这种小概率事件，也得算算找不到工作、或者只能找到一份普通工作的概率和收益。二是个人的宏观策略，其实就是前面提到的 “<strong>通胀国攒钱，通缩国花钱</strong>” 的概念；<span class="exturl" data-url="aHR0cHM6Ly93d3cuemhpaHUuY29tL3F1ZXN0aW9uLzE5MTE3MTIxODIxNzA4MDU1MzEvYW5zd2VyLzE5MTY0NDUzMTQ3NDA2MjMwNTM=">这个回答<i class="fa fa-external-link-alt"></i></span>针对这一点也给出了一些观点</p><blockquote><p>所谓生活、所谓移民，就是一个赚钱、一个花钱问题，这俩问题不解决其他都是次要</p><p>你问题中没谈美国，但我最熟美国，先拿它举例：美国物价最高、移民难度最高最折腾、而且这国家细想也很奇葩，但移民来的最多尤其中国人和印度人。因为容易赚钱，对就因为容易赚钱这么简单就这一个因素，导致美国最大的优势是即使有一天不想在这住了随便去世界哪里都觉得便宜，带着攒的钱跑路去哪里不是吃香喝辣</p><p>我个人认为，如果类比起来：中国三线城市之于北京，便如北京之于美国 —— 消费低、通缩等</p><p>按 “渡边太太” 理论，确实更好的策略是：钱出去，人留下，钱跟着通胀去，人享受通缩去</p><p><strong>说得简单点，人生需要钱时要卷起来时，去通胀国 / 地区打工；人生开始走下坡路准备退场时，已有的资源就得加倍呵护因为是 “有限资源”，回通缩国 / 地区消费</strong></p></blockquote><ul><li><strong>体验多样性</strong></li></ul><p>这一点上，“出海” 绝对能给你提供一种全新的体验，你被迫用另一种语言生活，理解另一套社会规则和新的文化，也许让你看到，生活不止一种活法。这种价值，无法用短期金钱衡量。却能在你出海期间，甚至未来几十年的人生里，提供看问题的不同角度和解决问题的不同思路。这种体验本身就是一张未来可以兑换其他机会的彩票</p><p>生活，最终还是活的一个体验的多样性。可以问一下自己，当前的这一次出海的机会如果放弃了，后续是否还会再有？到那时候对自己而言，是否还会是一个出去的好时机？如果都没有这样的机会，10年后自己会后悔当初的这个抉择么？</p><ul><li><strong>复利性</strong></li></ul><p>如果说中国的企业出海是未来，那未来大量的岗位必然对语言甚至海外经历有一定的要求。如果这个趋势是必不可挡的，那最好的选择也许是及早拥抱这个趋势</p><p>抓住这个 “没有选择” 的环境，去真正掌握语言、建立跨文化的适应能力、构建在全球范围内都具备竞争力的专业技能，那么这种能力就是带复利的。它能在你未来的人生里，像滚雪球一样，持续带来新的机会和增长</p><p>但如果你只是去混个文凭或者只是赚两年的快钱，把自己封闭在华人圈子里，重复国内的生活模式，那复利效应很弱</p><p>那么，努力在出海里又扮演什么角色？</p><p>当你基于这个模型，做出了出海的选择后，努力的方向就变得无比清晰：<strong>你的所有努力，都应该服务于最大化这个选择中具有复利效应和体验价值的维度，同时管理好健康和金钱维度的风险</strong></p><p>需要谨记的是，你的努力不是去赌场里试图破译轮盘的规律 —— 比如幻想靠一次投机就能实现阶层跃迁。而是要<strong>最大化你能力的概率，让你成为那个在 “能力和随机性共同决定” 的游戏中，能力占比更高的人</strong></p><p>你的努力，是清晰地认识到 “通胀国攒钱” 的阶段目标。在这个阶段，你需要的是卷起来，是把你的专业技能和汗水，高效率地兑换成未来的筹码和选择权。此时的辛苦，如果是指向明确的能力提升和资本积累，那就是有意义的努力</p><p>你的努力，是构建你的 “复利引擎”。学好语言，建立有价值的专业网络，培养跨文化解决问题的能力。这些能力，无论你未来是选择继续留在 “通胀国”，还是带着筹码去 “通缩国” 享受生活，都是你赖以生存和发展的根本</p><p>你的努力，是主动跳出舒适区，去最大化 “体验多样性”。不是把自己活成一个孤岛，而是强迫自己去和当地人交流，去理解他们的文化，去参加那些看起来 “没什么用” 的社交活动。这正是在为你未来的 “选项价值” 充值</p><p>这是个需要花力气做出改变的过程，过程中必然是会有痛苦的。但人生嘛，<strong>宁吃自己的苦，不吃生活的苦</strong>。有得选的时候尽量做选择，虽然苦点累点，不要没得选了开始内耗。比如选读书的苦，不选无业的苦；选运动的苦，不选生病的苦</p><h1 id="没有弯路">没有弯路</h1><p>虽然《杀鹌鹑的少女》把选择这个命题描述的比较沉重，但真的是所有选择都会影响巨大么？我们没法回答这个问题，因为 “未选择的道路” 就如同反事实数据一样，我们永远无法得知那条未选择之路的好坏，虽然我们常常会去美化这条所未曾选择的道路，然后觉得自己走了 “弯路”</p><p>这种选择的沉重感，归根结底是源于三件事：</p><p>（1）<strong>人生的有限性</strong>。“我走这条路是不是多浪费一两年的时间？”“我会不会走弯路？”这是人生的有限性在摆弄你<br>（2）<strong>未来的不确定性</strong>。“我要如何准备才能胜出？”“我会失败吗？”这是未来的不确定性在你的内心敲打<br>（3）<strong>过去的不可更改性</strong>。“我的选择是不是错了？”“这么大的投入最后回报得来吗？”，你们患得患失，因为没有后悔药可以吃。</p><p>我们之所以在选择的时候有这些焦虑、恐慌、敏感的情绪，害怕走 “弯路”，很多时候就是源于这三个因素。但吊诡之处在于，<strong>如果你感到的恐惧是由人生某些不可改变的特点带来的，那么即使你拼命想抓住写什么，甚至于你终于完成了一个目标、得到了一块暂时的喘息之地，你仍然无法解决内心的痛苦</strong></p><p>这也许就是我们这一生都在实现目标中挣扎着度过的原因：上初中的时候，老师告诉你，中考的淘汰率是最高的，只要闯过去，上了高中一切就好了。但上了高中的时候，高中老师又说了，考上大学就进了天堂。当你考上了大学，依然空虚迷茫，父母老师又告诉你，找到工作就好了。工作之后发现烦恼和忧虑依然都在，大家都告诉你等你事业有成就好了……</p><p>我们这一生似乎都在试图让自己走在社会告诉我们的 “正道” 上，少走 “弯路” 是朋友、老师、父母告诫我们要避免的，可是，这个 “弯路” 又该怎么定义？排除掉那些明显不合法的伤害他人、伤害自己的行为，又有多少的路是真正的 “弯路”</p><p>每每这时，我都会想起 Steve Jobs 的那个我非常喜欢的 connect the dots的故事，虽然已经是 20 年前的<span class="exturl" data-url="aHR0cHM6Ly9uZXdzLnN0YW5mb3JkLmVkdS9zdG9yaWVzLzIwMDUvMDYveW91dmUtZ290LWZpbmQtbG92ZS1qb2JzLXNheXM=">演讲<i class="fa fa-external-link-alt"></i></span>，但我一直奉为圭臬，每次重听也总能激励到我</p><blockquote><p>None of this had even a hope of any practical application in my life.But ten years later, when we were designing the first Macintoshcomputer, it all came back to me. And we designed it all into the Mac.It was the first computer with beautiful typography. If I had neverdropped in on that single course in college, the Mac would have neverhad multiple typefaces or proportionally spaced fonts.</p><p>If I had never dropped out, I would have never dropped in on thatcalligraphy class, and personal computers might not have the wonderfultypography that they do. Of course, it was impossible to connect thedots looking forward when I was in college. But it was very, very clearlooking backwards, ten years later.</p><p><strong>Again, you can’t connect the dots looking forward. You canonly connect them looking backwards, so you have to trust that the dotswill somehow connect in your future.You have to trust in something: yourgut, destiny, life, karma, whatever. Because believing that the dotswill connect down the road will give you the confidence to follow yourheart, even when it leads you off the well-worn path. And that will makeall the difference.</strong></p></blockquote><p>事实上，真正的人生不是一场竞赛；至少也不是一场跑向同一终点的竞赛。那条笔直的、被无数人验证过的 “跑道”，其实是高考给我们养成的思维惯性。一旦进入大学、迈入社会，这套逻辑就渐渐失灵了</p><p>如果你去读大多数成就一番事业之人的传记，会发现他们的人生轨迹，极少是一条昂扬向上的直线，反而充满了意想不到的波折与迂回，有的甚至是几起几落</p><p>比如说比如说奥巴马和克林顿都是穷小子，好不容易考上了个东部的常青藤，结果毕业后一个回老家干社区工作，一个回老家在名不见经传的大学教书；比如说如今被誉为 “寿司之神” 的小野二郎，年轻时曾在市场鱼贩那里做了多年的学徒，每天只是处理鱼货、打扫卫生；比如说爱因斯坦在提出划时代的相对论时，只是瑞士专利局里一个默默无闻的三级技术员。他的研究工作与他的本职工作几乎毫无关系，完全是在 “业余时间” 进行的。按照前面的逻辑，他们都 “走了弯路”</p><p>可是从后往前看，哪里又有什么弯路？</p><p>你当过社区工作者，深入了解了基层的脉搏与民众的真实诉求，这份独特的阅历，是那些直接进入精英机构的同学所没有的。几十年后，当你需要展现对民生的深刻理解与共情能力时，这就成了你无可替代的优势；你曾在鱼市里磨砺过，对每一种食材的时令、质地、处理方法了如指掌。几十年后，当你追求极致的料理时，这段经历便化作了你区别于所有厨师的、最深厚的底蕴；你在专利局里安静地演算，避开了学术界的浮躁与成见。恰恰是这份 “孤独”，保护了你最颠覆性的思想得以孕育成型</p><p><u>当你从后往前看，把人生的点连成线，会发现所有的努力和经历都不会白费，在哪个领域、哪个岗位努力都可能在未来产生回响。那些看似八竿子打不着的知识和技能，不知在哪个命运的拐角，就会悄然融合，迸发出惊人的力量</u></p><p>当你从后往前看，你会发现，<strong>真正的弯路从来不是哪一次具体的方向选择，而是内心的怨天尤人与行动上的停滞不前。是那种不断回头张望、懊悔 “如果当初”，却让 “现在” 和 “未来” 在无尽的内耗中白白流逝的状态</strong></p><p>人生的路，不是规划出来的直线，而是一步步走出来的轨迹。</p><p>我很喜欢这句话：“<strong>没有什么事情或节点，能把我们的人生分成两段</strong>”</p><p>我们总是不自觉地给人生划分阶段，并寄望于某个里程碑之后，生活能焕然一新：考上大学就好了，找到工作就好了，结婚生子就好了，财务自由就好了…… 仿佛人生是一部可以分集的连续剧，过了某个关键情节，基调就会彻底改变</p><p>但现实是，从出生到生命尽头，生活是一条连绵不绝的河流。它不会因为你拿到了某个学位、某份聘书，或戴上了某枚戒指，就从湍急变得平缓，从浑浊变得清澈。<strong>生活的每一个阶段都自带其独特的痛苦与焦虑，它们周而复始，只是换了一副面孔出现</strong>。你不会因为考上大学，就告别了青春的迷茫；不会因为事业有成，就消除了中年危机的阴影；更不会因为迎娶了女神，就免疫了婚姻中琐碎的摩擦与漫长的磨合</p><p>反过来，每一个阶段也镶嵌着独属于那个时期的、无法复刻的快乐。二十岁时，和兄弟们在夏夜操场打完篮球，瘫坐在场边，汗水淌进眼里有些刺痛，仰头猛灌一口冰可乐，那气泡在喉咙里炸开的简单酣畅，是你未来坐在米其林餐厅里，从容品鉴一杯复杂红酒时所无法体会的。年轻时可以为了一个灵感通宵达旦，可以来一场毫无计划、说走就走的 “特种兵” 旅行，那种由充沛精力和对世界的好奇所驱动的纯粹快乐，与中年后精心规划的、追求舒适与品味的旅行，是两种截然不同的生命体验</p><p><strong>每一段岁月都有它存在的价值，没有高低贵贱之分，都不应该被辜负</strong>。试图用未来的某个 “黄金时代” 来否定当下的 “青铜岁月”，或者沉溺于过去的 “美好时光” 而逃避眼前的现实，都是对生命本身的浪费</p><p>因此，你要记住，没有弯路，因为<strong>“发生在你身上的事，要么是个好事，要么是个好故事”</strong>。顺利的成功，自然是 “好事”；而那些看似失败的、痛苦的经历，在事后回望，往往会沉淀为你人格的一部分，成为你酒桌上、文字里、与晚辈交谈时，那个最有力量的 “好的故事”。它定义了你的韧性，丰富了你生命的层次</p><p>当然，这话听起来，在某种程度上确实有点阿 Q 精神的嫌疑。它似乎轻描淡写地忽略了过程中真实存在的、甚至对一些人而言是生命无法承受之重的苦难</p><p>我非常喜欢《<span class="exturl" data-url="aHR0cHM6Ly9tb3ZpZS5kb3ViYW4uY29tL3N1YmplY3QvMzc5MzAyMy8=">三傻宝大闹宝莱坞<i class="fa fa-external-link-alt"></i></span>》这部电影，十多年前第一次看的时候被电影的观点震撼到，这次国庆重新看的时候依旧觉得获益良多，电影里有个情节是这样的</p><p>当 Raju 在对繁重学业和即将到来的期末考试而焦虑不安时，Rancho告诉他，尝试把手放到自己的胸口对自己说 “All isWell”，并说<u>我们的心是很容易动摇的，你得学会哄它</u>，无论遇到多大的事情都可以对自己这么说。Raju反问到 “这能解决问题么”。Rancho说并不能，但是这<strong>能够给你解决问题的勇气和决心</strong></p><p>这句简单的 “All is Well”，和我们在播客《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9wb2RjYXN0LzYxMTcxOWQzY2IwYjgyZTFkZjBhZDI5ZQ==">无人知晓<i class="fa fa-external-link-alt"></i></span>》里都听到的 “咒语” 这一概念一样，它们不是解决问题的具体工具，而是一种 “心法”</p><p>比如说《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY0MmI3ZmQ2NjZlNGMwMGM2YTIzMjZmYQ==">此时此刻<i class="fa fa-external-link-alt"></i></span>》中提到的 “刺激和回应之间存在一段距离，成长和幸福的关键就在那里”，“平静是意识到世界并非我们想象的那样”，还是《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY0NjJlZjllMzA2NTEzMTg0YzEyYWJhYw==">哦<i class="fa fa-external-link-alt"></i></span>》中提到的“内心自我否定、攻击、怀疑，99%都是假的”、“最重要的就是走，往哪走都行”</p><p>我想，这些 “咒语” 和 “All isWell” 一样，它们或许不能像螺丝刀一样直接拧紧松动的零件，也无法像导航一样为我们规划出最优路径。但<strong>它们能为我们疲惫的心灵 “充电”，在我们踏入未知的黑暗时，像一支火把，虽不能照亮整个前程，却足以给予我们迈出下一步的勇气和决心，让我们能够轻装上阵</strong></p><h1 id="不确定的赌局与我们的下注">不确定的赌局，与我们的下注</h1><p>聊了这么多，从日本出海的宏观叙事，到个人抉择的微观权衡，我们仿佛在迷宫中绕了一大圈，最终却回到了那个最原始、也最核心的困惑前：在一个由能力、努力与巨大随机性共同主宰的世界里，我们究竟该如何自处？</p><p>回望日本出海的历程，它并非一份精心绘就的宏伟蓝图，更像是一个经济体在撞上内需天花板后，被逼出来的一种集体生存智慧。企业与个人在时代的巨浪中扑腾，摸索出 “工作、商业、投资” 三条路径，其底层逻辑出奇地一致：将<strong>自身已有的技能、资本或头脑，与海外市场更早期、更饥渴的发展阶段相嫁接，从而兑换一份 “时间差” 带来的溢价</strong>。这背后，是 “通胀国攒钱，通缩国花钱” 的冷静算计，也是对全球资源进行朴素配置的直觉</p><p>当我们把这份宏观的镜子转向自身，所谓的 “好选择”，从来不是那个能让你一劳永逸、开启人生简单模式的 “标准答案”。它更像是在信息不完备的牌局上，一次基于多维度期望值的下注。这个决策模型里，装着健康、金钱、体验的广度与能力的复利等重要的、千人千面的维度。<strong>一个 “好选择” 最关键的标志，在于你清醒地知道随机性在其中占了多大分量，并且，无论牌面如何翻转，你都能心平气和地摊开双手，接受任何结果</strong></p><p>而 “有意义的努力”，则是在你下注之后，不再沉溺于 “没有功劳也有苦劳” 的自我感动型的无效消耗，而是将所有的行动与心力，都聚焦于一件事：如何提升我们 “赢” 的概率。它是在<strong>基于前面 “好选择” 选定的方向上，对那些无法立即兑现、甚至漫长岁月里都看似石沉大海的事情，付出持久的专注与热情</strong>。无论是被迫掌握一门语言，还是构建一个能产生复利的能力网络，其价值都在于，它们让你在这个充满随机性的牌桌上，资格更老，筹码更多，活得更久，从而能等到那场属于你的、非线性回报的爆发</p><p>那么，回到最初那个纠缠我们的迷思 —— 关于 “出海”，关于所有人生十字路口的抉择：它们究竟是那 “命运的巨变”，还是我们当时所以为的 “生命中普通的一天”？</p><p>答案是：它两者都是，它取决于你站在哪个时间点回望</p><p>站在抉择的当下，它平凡、沉闷，甚至充满了患得患失的焦虑与自我怀疑。我们惧怕 “一步错，步步错”，恐惧有限的青春被 “浪费” 在弯路上，懊悔没有吃到后视镜里清晰可见的红利；这种感受，真实而具体。但当我们走过一段，回首来路，用 “连点成线” 的眼光去审视时，每一次选择，无论当时被贴上 “正确” 或 “错误” 的标签，都深深地编织进了我们独一无二的生命纹路里，构成了无法替代的路径。你会发现，那些所谓的 “弯路”，在生命的宏观图景中，恰恰提供了最独特的风景与给养</p><p>所以，<strong>人生这场游戏，或许根本就不存在一条被社会严格定义的 “正道”，也因此没有什么绝对的 “弯路”。真正的弯路，不是你在某个路口选择了左转而非右转，而是你因为恐惧而停留在原地，不停地抱怨与内耗</strong></p><p>就像《三傻大闹宝莱坞》里那句简单的 “All iswell”，它并不能解决实际问题，却能给你直面问题的勇气。在面对出海，或是任何人生命题时，我们最需要的，也正是这份勇气 —— <u>在计算之后行动的勇气，在行动中拥抱不确定性的勇气，以及在不确定性中始终相信 “发生在自己身上的事，要么是好事，要么是好的故事”</u></p><p>生命就在每天的生活里，不在某个遥远的、过了之后一切都会好起来的 “节点” 上。认真评估，果断下注，然后专注于打好你手中的牌</p><p>走上去，好好地走，本身就已经是一种精彩</p><hr><p>本文一些参考资料</p><ul><li><span class="exturl" data-url="aHR0cHM6Ly9jbi5jZWlicy5lZHUvbmV3LXBhcGVycy1jb2x1bW5zLzI1NTMw">日本企业 “出海” 启示录| 逐潮向海<i class="fa fa-external-link-alt"></i></span><br></li><li><span class="exturl" data-url="aHR0cHM6Ly9zcGFjZS5iaWxpYmlsaS5jb20vMzgzMzUwMTEwL2xpc3RzLzQxMjk4NzY/dHlwZT1zZWFzb24=">日本出海之路给我们的启示<i class="fa fa-external-link-alt"></i></span><br></li><li><span class="exturl" data-url="aHR0cHM6Ly9tcC53ZWl4aW4ucXEuY29tL3MvQmFlVWpuN3RlaGJEc3hHVzcwM3pMQQ==">泡沫破裂后，日本全民出海潮对普通人的借鉴<i class="fa fa-external-link-alt"></i></span><br></li><li><span class="exturl" data-url="aHR0cHM6Ly93d3cucHdjY24uY29tL3poL3NlcnZpY2VzL2RlYWxzLW0tYW5kLWEvcHVibGljYXRpb25zL21hLTIwMjMtcmV2aWV3LWFuZC1vdXRsb29rLmh0bWw=">2023 年中国企业并购市场回顾与前瞻<i class="fa fa-external-link-alt"></i></span><br></li><li><span class="exturl" data-url="aHR0cHM6Ly9tcC53ZWl4aW4ucXEuY29tL3MvVERqclFTazlWLTNSTTdFR0dRY19qUQ==">高度内卷下，日本全民出海潮中普通人的抉择与借鉴<i class="fa fa-external-link-alt"></i></span><br></li><li><span class="exturl" data-url="aHR0cHM6Ly9tcC53ZWl4aW4ucXEuY29tL3MvYndFVXZoNlY1eFo1cmNyd3NVRnZLUQ==">我们也会有如同日本一样的全民出海潮吗？<i class="fa fa-external-link-alt"></i></span><br></li><li><span class="exturl" data-url="aHR0cHM6Ly9tcC53ZWl4aW4ucXEuY29tL3MvSUJjSk9xM1dOc2tQeGZheXNIdWtVQQ==">复盘中国 2024 出海之路，对比日本出海潮，我们走到了哪一步？<i class="fa fa-external-link-alt"></i></span><br></li><li><span class="exturl" data-url="aHR0cHM6Ly9tLmh1eGl1LmNvbS9hcnRpY2xlLzM4OTE1OTUuaHRtbD90eXBlPXRleHQ=">泡沫破裂后，日本全民出海潮中普通人的机遇<i class="fa fa-external-link-alt"></i></span><br></li><li><a href="https://wulc.me/2015/11/20/%E6%88%91%E4%BB%AC%E8%BF%99%E4%B8%80%E4%BB%A3%E4%BA%BA%E7%9A%84%E5%9B%B0%E6%83%91">我们这一代人的困惑</a><br></li><li><a href="https://wulc.me/2015/11/18/%E5%86%99%E7%BB%99%E5%A4%A7%E5%9B%9B/">写给大四</a><br></li><li><span class="exturl" data-url="aHR0cHM6Ly9uZXdzLnN0YW5mb3JkLmVkdS9zdG9yaWVzLzIwMDUvMDYveW91dmUtZ290LWZpbmQtbG92ZS1qb2JzLXNheXM=">Connectthe Dots<i class="fa fa-external-link-alt"></i></span></li></ul>]]></content>
    
    
    <summary type="html">&lt;p&gt;许多人大概都读过这段充满宿命感的话：&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;当你老了，回顾一生，就会发觉：什么时候出国读书、什么时候决定做第一份职业、何时选定了对象而恋爱、什么时候结婚、其实都是命运的巨变。只是站在三岔路口，眼见风云千樯，你作出抉择的那一日，在日记上，相当沉闷和平凡，当时还以为是生命中普通的一天&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;这段自出《&lt;span class=&quot;exturl&quot; data-url=&quot;aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8xMTUwNTkzMC8=&quot;&gt;杀鹌鹑的少女&lt;i class=&quot;fa fa-external-link-alt&quot;&gt;&lt;/i&gt;&lt;/span&gt;》的文字，具象化了选择的厚重感。而事实上，很多 “当时只道是寻常” 的瞬间，确实会这个名为 “人生” 的游戏开辟很多新的分支。最近几天在玩
&lt;span class=&quot;exturl&quot; data-url=&quot;aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvRGV0cm9pdDpfQmVjb21lX0h1bWFu&quot;&gt;Detroit:
Become Human&lt;i class=&quot;fa fa-external-link-alt&quot;&gt;&lt;/i&gt;&lt;/span&gt;
这款游戏，通过三个仿生人（androids）徐徐展开讲述了一个有关人工智能、科技、伦理、人性的故事，而故事的结局是由你在游戏中的种种抉择所决定的，你的一个不经意的选择，可能会掀起一场人类与仿生人的流血革命&lt;/p&gt;
&lt;p&gt;&lt;img data-src=&quot;https://wulc.me/imgs/life_paths.jpeg&quot; height=&quot;50%&quot; width=&quot;50%&quot;&gt;&lt;/p&gt;
&lt;p&gt;都说选择大于努力，我们特别擅长拿着后视镜去度量一个选择的 “好” 与 “坏”。因为我们没有上帝视角去获取整个游戏的
FlowChart，去看到那些未选择之路种种；更要命的是，我们在当前已选择的道路上的任何操作无法撤销或回滚，当最终的结果不太如人意时，就会在事后复盘时被打上一个 “走了弯路” 的标签，然后幻想那条未选择的道路所拓展出来的分支&lt;/p&gt;
&lt;p&gt;最近就面临着一个关于出海的选择，一直觉得出海是国内企业发展的未来，但是真正面临这样的选择时，也少不了瞻前顾后、忧心忡忡，总想小心翼翼地迈出下一步，希望少走 “弯路”。脑子里的各种观点打架打了好多天，我觉得是时候写一篇文章来梳理一些这个迷思了。本文是关于出海和选择的一些碎碎念，祝开卷有益～&lt;/p&gt;</summary>
    
    
    
    <category term="闲话几句" scheme="https://wulc.me/categories/%E9%97%B2%E8%AF%9D%E5%87%A0%E5%8F%A5/"/>
    
    
    <category term="闲话几句" scheme="https://wulc.me/tags/%E9%97%B2%E8%AF%9D%E5%87%A0%E5%8F%A5/"/>
    
  </entry>
  
  <entry>
    <title>Attention Is All You Have</title>
    <link href="https://wulc.me/2025/10/03/Attention%20Is%20All%20You%20Have/"/>
    <id>https://wulc.me/2025/10/03/Attention%20Is%20All%20You%20Have/</id>
    <published>2025-10-03T08:51:23.000Z</published>
    <updated>2026-02-28T05:01:22.920Z</updated>
    
    <content type="html"><![CDATA[<p>2017 年，《<span class="exturl" data-url="aHR0cHM6Ly9hcnhpdi5vcmcvYWJzLzE3MDYuMDM3NjI=">Attention IsAll You Need<i class="fa fa-external-link-alt"></i></span>》悄然问世，带来了 Transformer的架构，这个此后被搜广推领域广泛应用、并成为后来掀起新一轮 AI 革命的 LLM的基石。Transformer让机器拥有了某种 “超级注意力”：一种可以并行处理全局信息、计算序列中所有元素关联权重的强大机制。它不需要像人类一样逐字逐句地阅读和理解，而是可以一瞬间 “看到” 全部，并找出其中最关键的连接</p><p>但是一个巨大的悖论和困境正在上演。人类创造了看似拥有 “无限可扩展注意力” 的机器，但人类自身所拥有的，却是一套古老而有限的生物注意力系统。<u>机器的核心是 “更多、更快、更全局”，而人类的核心是 “选择、聚焦、做减法”。我们正用着自己这套需要休息、会疲劳、极易分心的心智系统，去对抗一个由 “超级注意力” 算法驱动的、旨在无限捕获我们注意力的科技环境</u></p><p>对于碳基生物而言，更加残酷的一个事实是 "Attention Is All YouHave"。因为对人类来说，注意力是与生俱来、且每日额度恒定的核心生命资产。而这唯一的货币投向何处，你的生命就投资何处，最终也将到达何处。我们一直在说 “人是环境的产物”，究其原因，也许是人在某个环境中，不得不将其的注意力倾注到这个环境设定的规则里最关注的事情，进而决定了人将变为何种产物</p><p>如果说注意力是人最宝贵的财富，那如何保护自己的注意力便是一个值得探讨的命题。本文尝试对这部分展开一些探索，包括人的注意力为何是有限的，这少得可怜的注意力在当下的注意力经济中是如何被各种争夺，以及如何构建自己的注意力框架。本文是笔者最近感觉自我工作效率低下后的一次寻根问底求法的过程，祝开卷有益～</p><span id="more"></span><h1 id="有限的注意力预算">有限的注意力预算</h1><h2 id="看不见的大猩猩">看不见的大猩猩</h2><p>1999 年，心理学家克里斯托弗・查布里斯和丹尼尔・西蒙斯设计了一个堪称经典的 “看不见的大猩猩”(<span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvVGhlX0ludmlzaWJsZV9Hb3JpbGxh">The InvisibleGorilla<i class="fa fa-external-link-alt"></i></span>) 实验。这个看似简单的实验设计，却揭示了一个令人不安的真相：我们对自己感知能力的自信，很大程度上是一种错觉</p><p>在这个实验中，参与者被要求观看一段视频，数一数身穿白色球衣的队员一共传球多少次。视频中间，一个穿着大猩猩服装的人走入镜头，捶打胸膛，然后缓缓离开。结果却令人震惊：超过一半的参与者全神贯注于计数，完全没有看到那个明显的大猩猩。而当被告知真相时，许多参与者坚决不相信，甚至怀疑实验者更换了视频。他们对自己的观察能力如此自信，以至于无法接受如此明显的事物竟从自己的意识中完全消失</p><p>这个实验生动地揭示了注意盲视（<span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvSW5hdHRlbnRpb25hbF9ibGluZG5lc3M=">InattentionalBlindness<i class="fa fa-external-link-alt"></i></span>）：<u>当我们的注意力高度集中于某一事物时，会对其他显而易见的信息视而不见。这不是粗心，而是我们大脑信息处理能力的根本瓶颈</u>。后续研究进一步证实，即便是飞行员、放射科医生等经过严格专业训练的人员，在专注执行特定任务时，同样会错过显而易见的关键信息。比如在一项医学影像研究中，83% 的放射科医师在寻找特定病灶时，竟未注意到图像角落处一个明显的外星人贴图</p><p>我们的注意力就像一个聚光灯，光柱之外的一切，都会沉入黑暗。大脑的前额叶皮层就像专业的灯光师，为了确保主要任务的完成质量，会有意抑制次要信息的处理</p><p>认知心理学中的有限容量理论（<span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvTEM0TVA=">Limited CapacityTheory<i class="fa fa-external-link-alt"></i></span>）指出，人类的注意力是一种有限的认知资源。当同时进行多项任务时，如果总需求超过资源总量，整体的表现就会下降。这个其实跟 “心智带宽” 的概念也有点像，人的注意力通道是一条带宽受限的通道，在执行一项任务时消耗的带宽越多，可用于执行其他任务的带宽就越少，从而导致整体性能下降。这通常通过双任务范式 (Dual-TaskParadigm) 的实验来证明：让参与者同时执行两项不同的任务（主任务和次任务）来研究认知负荷对任务执行能力的影响。比如一边记忆单词一边做数学题，他们的表现通常会比只做一件事时差</p><h2 id="注意力的反向塑造">注意力的反向塑造</h2><p>在这个信息爆炸的时代，我们每个人的注意力都成为了一种稀缺资源。但比这更深刻的真相是：<strong>注意力不仅是资源，更是一把雕刻刀</strong>。你持续关注什么，你的心智、能力甚至大脑结构，就会朝着那个方向演化；这种塑造发生在多个层面，从即时的认知表现到长期的个人发展，背后有坚实的心理学和神经科学依据</p><p>心理学家威廉・詹姆斯在《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8xNTEyMzQ3Lw==">心理学原理<i class="fa fa-external-link-alt"></i></span>》中提到：“我的经验是由我选择注意的东西决定的”。我们并非体验世界的全部，我们只体验我们关注的那部分。你的注意力过滤器，决定了哪些信息能进入你的意识，从而构建你的个人现实</p><p>伦敦大学学院的神经学研究显示，不同领域的专业训练会诱导特异性的脑结构改变，在这篇文献中《<span class="exturl" data-url="aHR0cHM6Ly93d3cucG5hcy5vcmcvZG9pLzEwLjEwNzMvcG5hcy4wNzAwMzk1OTc=">Navigation-relatedstructural change in the hippocampi of taxidrivers<i class="fa fa-external-link-alt"></i></span>》指出，通过脑扫描研究，发现伦敦出租车司机大脑中负责空间记忆的海马体后部显著更大，因为这些司机们需要花费数年时间持续将注意力集中在记忆伦敦复杂的街道网络上。这就像健身增肌，只不过他们锻炼的是大脑中负责导航的特定区域。</p><p>类似的神经可塑性现象在不同领域的专家身上都有体现：</p><ul><li>钢琴调音师的左侧听觉皮层灰质密度显著增高，他们的耳朵能分辨出常人无法察觉的微小音高差异<br></li><li>品酒师的嗅觉皮层与眶额叶皮层连接增强，能构建出复杂的风味地图<br></li><li>专业棋手的顶叶皮层更为活跃，能在脑海中预演数十步棋局的演变</li></ul><p>这些结构性改变印证了<span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvSGViYmlhbl90aGVvcnk="> Hebbian theory<i class="fa fa-external-link-alt"></i></span>中提出的 "神经元同步放电则连接增强" 原则，当你持续将注意力投入某个领域，相关神经元回路就会被反复激活，最终物理性地强化这些连接，就像小径因频繁行走而变成康庄大道</p><p>然而，这种强大的神经可塑性是一把双刃剑。哲学家尼尔・波兹曼在《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8yNjMxOTczMC8=">娱乐至死<i class="fa fa-external-link-alt"></i></span>》中发出的警告，在今天这个算法时代显得尤为紧迫：<strong>媒介的形式本身会潜移默化地塑造我们的思维方式和认知习惯</strong></p><p>在电视时代，一切信息都必须以娱乐的方式出现，碎片化、图像化、追求瞬时刺激的特性，则塑造了浮躁和浅薄的文化。今天的我们身处一个由算法驱动的、比电视强大无数倍的超注意力捕获网络中，如果我们放任自己的注意力被无限切割、被廉价娱乐填满，我们就在主动重塑一个不利于深度思考的大脑。神经科学研究显示，持续的多任务处理和碎片化注意力会：<u>1）强化大脑对快速反馈的依赖，削弱前额叶皮层的抑制控制能力2）减少默认模式网络的激活，而这一网络正是创造性思维和深度整合的发生地3）导致注意力残留效应，即使切换任务后，大脑仍有一部分资源被先前任务占用</u></p><p>如同在《<a href="https://wulc.me/2025/05/03/%E5%B7%A5%E4%BD%9C%E3%80%81%E4%BD%93%E5%88%B6%E5%8C%96%E4%B8%8E%E8%87%AA%E7%94%B1/">工作、体制化与自由</a>》一文中提到的，短视频带来的高频、短期的刺激，代价是词汇量、语义精度和表达能力的下降，是阅读长内容的耐心和能力的丧失，是系统性思考与推理能力的衰退，也是空虚感的重要来源</p><h1 id="无限的注意力争夺战">无限的注意力争夺战</h1><p>在这个信息过载的时代，我们每个人的注意力都成了各方势力争夺的战场。正如经济学家赫伯特・西蒙所预言：“<strong>信息的丰富导致了注意力的贫乏</strong>”。我们正生活在这个预言的实现中，每个人的认知预算都在被精心设计的系统持续透支</p><h2 id="注意力经济下你才是被售卖的商品">注意力经济下，你才是被售卖的商品</h2><p>我们每日有限的 “注意力币”，已经成为当今世界最炙手可热的商品，由此催生了 “注意力经济（<span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvQXR0ZW50aW9uX2Vjb25vbXk=">Attentioneconomy<i class="fa fa-external-link-alt"></i></span>）”。这个价值数千亿美元的注意力经济，其商业模式异常清晰：<strong>将用户的海量注意力聚合起来，然后 “打包” 卖给广告商</strong>。如同在《<span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvVGhlX1NvY2lhbF9EaWxlbW1h">The SocialDilemma<i class="fa fa-external-link-alt"></i></span>》中发出的发人深省的警告：If you're not paying for theproduct, you are the product</p><p>这个系统的精妙之处在于，它不再是被动地等待你的关注，而是主动地捕捉你的意识。收割我们注意力的武器，正是由《AttentionIs All YouNeed》所启发的技术架构。社交媒体、短视频平台、新闻资讯 App 的背后，是复杂精密的推荐算法系统，它们的优化目标极其单纯：最大化用户停留时长和互动率。它们就像永不疲倦的角斗士，为了争夺你的 “注意力币” 而疯狂角力</p><p>这些系统巧妙地利用了人类大脑的进化弱点：</p><ul><li><strong>对不确定性的痴迷</strong>：下拉刷新机制与老虎机的 "可变奖励" 模式同出一辙，每一次刷新都在激活我们大脑中的多巴胺系统，创造着 "下一次会有更好内容" 的期待；如同<span class="exturl" data-url="aHR0cHM6Ly9iYWlrZS5iYWlkdS5jb20vaXRlbS8lRTYlOTYlQUYlRTklODclOTElRTclQkElQjMlRTclQUUlQjEvNTM3ODk2MQ==">斯金纳箱<i class="fa fa-external-link-alt"></i></span>里那只不断按压开关期待得到奖赏的小白鼠一样<br></li><li><strong>对负面信息的警觉</strong>：坏消息、冲突、八卦往往能获得更多点击，因为我们的生存本能要求我们时刻警惕潜在威胁<br></li><li><strong>对社交认同的渴望</strong>：点赞、评论、转发的通知提示，，触发了我们大脑中与社会接纳相关的奖励回路</li></ul><p>"无限滚动"、"自动播放"、"个性化推荐"—— 这些都不是中性的功能设计，而是精心计算的 "注意力捕获装置"。它们像是一条永不停止的传送带，让你在无意识中持续消耗着宝贵的认知预算</p><h2 id="深度工作-vs-碎片化响应">深度工作 vs 碎片化响应</h2><p>在 "注意力经济" 的持续冲击下，我们正在丧失一种至关重要的核心能力：深度工作（DeepWork）。这其实也是计算机科学家卡尔・纽波特在同名的书籍《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8yNzA1NjQwOS8=">深度工作<i class="fa fa-external-link-alt"></i></span>》中提出的概念，指的是 “在无干扰的状态下专注进行的职业活动，使个人的认知能力达到极限。这种努力能够创造新价值，提升技能，且难以复制。”如程序员编写复杂的核心代码、作家撰写书籍章节、科学家推导关键公式、设计师构思核心创意等；与之相反的是那些对认知要求不高的、逻辑性的事务性任务，通常在受到干扰的情况下开展的工作</p><p>从神经学和心理学角度出发，深度工作都是具备巨大价值的</p><ul><li><p>从神经学角度出发，专注力是一种需要训练的能力。从上面的注意力反向塑造的理论可知，行为会重塑大脑，而深度工作能够强化专注相关的神经回路，从而变得更擅长专注和思考。反之，不断分心会永久性地削弱这种能力</p></li><li><p>从心理学的角度出发，深度工作中所达到的理想状态，其实这也是我们常说的心流状态 (<span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvRmxvd18ocHN5Y2hvbG9neSk=">Flow<i class="fa fa-external-link-alt"></i></span>)，其特点往往是需要高度专注、创造价值、有门槛，其关键点之一是不受到外界的过多干扰。心流是幸福感、满足感和意义感的重要来源。高质量的工作生活本身就是一种巨大的回报，如果乔帮主在<span class="exturl" data-url="aHR0cHM6Ly9uZXdzLnN0YW5mb3JkLmVkdS9zdG9yaWVzLzIwMDUvMDYveW91dmUtZ290LWZpbmQtbG92ZS1qb2JzLXNheXM=">Stanford那场著名的演讲<i class="fa fa-external-link-alt"></i></span>中的提到的一样</p></li></ul><blockquote><p>I’m convinced that the only thing that kept me going was that I lovedwhat I did. You’ve got to find what you love—and that is as true forwork as it is for your lovers. Your work is going to fill a large partof your life, and the only way to be truly satisfied is to do what youbelieve is great work. And the only way to do great work is to love whatyou do.</p></blockquote><p>然而事实是，我们已陷入集体性的 "碎片化响应" 模式。现代工作环境几乎是与深度专注为敌的。开放式办公空间虽然促进了表面上的协作，却成了持续干扰的温床。我们不断地在邮件、即时消息、会议通知和突发请求之间疲于奔命。更恐怖的是，我们似乎默许并推崇这种 "忙碌文化"，将碎片化的响应等同于工作效率。快速回复邮件、同时处理多个任务、频繁参与会议 —— 这些行为获得了组织的即时奖励，却让我们远离了那些真正需要深度专注才能完成的价值创造工作</p><p>但从生物学的角度出发，人类大脑的构造决定了我们本质上是序列处理器，而非并行处理器。所谓的 <strong>“多任务处理” 实际上是一个快速、耗能的 “任务切换” 过程，而每一次切换都伴随着显著的生物学代价</strong>（<span class="exturl" data-url="aHR0cHM6Ly9uZXdzLndmdS5lZHUvMjAyNC8wNC8xNi90aGUtc3dpdGNoLWNvc3Qtb2YtbXVsdGl0YXNraW5nLw==">switchcost<i class="fa fa-external-link-alt"></i></span>）</p><p>1）<strong>效率下降与时间浪费</strong>。虽然每次切换可能只需要十分之几秒到几秒钟来重新定向注意力，看似短暂，但在一天内成百上千次的切换中累积起来，就是个巨大的时间黑洞。另外就像一壶水每次烧到一半就关掉，重新再烧，整体煮沸的时间远大于一次性烧开</p><p>2）<strong>错误率增加与认知残留</strong>。当你从任务 A 切换到任务 B 时，关于任务 A 的思维碎片（<span class="exturl" data-url="aHR0cHM6Ly93d3cuc2NpZW5jZWRpcmVjdC5jb20vc2NpZW5jZS9hcnRpY2xlL2Ficy9waWkvUzA3NDk1OTc4MDkwMDAzOTk=">attentionresidue<i class="fa fa-external-link-alt"></i></span>）并不会立刻消失。它们会干扰你对新任务 B 的专注，导致你在 B 上犯更多错误，或者感觉思维 “粘滞”。在切换的缝隙中，大脑容易将不同任务的规则混淆。比如，你正在写邮件，然后去回了条微信，再回来写邮件时，可能会不小心把微信的缩写或表情符号用在邮件里，这就是典型的接口错误</p><p>3）<strong>加速心智疲劳与压力荷尔蒙</strong>。任务切换是一种高能耗的认知活动。每一次 “规则卸载与加载” 都需要消耗大量的葡萄糖（大脑的主要燃料）和氧气。这解释了<em>为什么没做什么 “正经事”，只是不停回邮件、看消息，一天下来也会感觉心力交瘁 —— 你的大脑一直在进行高强度的内部搬运工作</em>。持续的、不可预测的干扰（如 IM 软件消息、邮件）会激活大脑的“威胁监测” 网络杏仁核，引发低度的应激状态，分泌皮质醇等压力荷尔蒙。长期如此，会导致慢性疲劳、焦虑和创造力枯竭</p><p>4）<strong>对学习与长期记忆的深层损害</strong>。将短期记忆转化为长期知识，需要海马体的深度处理；深度、不受干扰的专注是这一过程的关键。频繁的任务切换会阻止信息进入深度处理流程，导致你感觉 “学了很多，但什么都没记住”。更可怕的是，<u>长期的多任务习惯会重塑我们的大脑神经回路。它会让我们的大脑习惯于寻求新奇和刺激，变得越来越不耐受无聊和沉默。最终，当你需要长时间专注于一本复杂的书籍或一份困难的报告时，你会发现自己已经失去了这种能力 —— 你的 “专注力肌肉” 已经萎缩了</u></p><p>我们正在用人类本质上的串行处理大脑，去拙劣地模仿机器并行处理的 "多头注意力" 机制。Transformer 模型可以真正地同时处理多个信息流并理解其复杂关联，而<em>人类的所谓 "多任务"，只是在浅层次事务上消耗注意力，牺牲了深度思考和创造性产出。我们试图成为机器，却在过程中丧失了身而为人的独特优势</em></p><h1 id="设计你的transformer">设计你的 Transformer</h1><p>在这个注意力被疯狂争夺的时代，我们需要从被动的注意力消费者转变为主动的架构师。就像Transformer模型通过精心的结构设计实现高效的信息处理，我们也需要构建属于自己的 "个人注意力架构"，从而帮助我们在信息洪流中保持清醒，将宝贵的注意力资源投入到真正重要的事物上</p><h2 id="定义核心-query">定义核心 Query</h2><p>在 Transformer 中，Query是主动发出的提问，它决定了模型要在海量信息（Key）中寻找什么。同样，管理注意力的第一步，是向自己发出一个清晰的Query：我当下最核心的目标和价值是什么？或者用更加大白话来说，我到底要什么？</p><p>说实话要回答这个问题并不容易，<em>知道自己要什么、想成为什么样的人、这一生要怎么过，本身就是一个极度非标的、需要花费大量时间和心力、持续做自我探索才能得到答案，又或者终其一生都没有答案的问题</em></p><p>虽然长期的目标不那么好定义，单独短期的目标还是相对明确的。比如说每个季度初，可以写下1-3个最重要的 “灯塔” 目标。它们应像灯塔一样，指引你所有的努力方向，这有点像的不少互联网公司的okr 制度</p><p>另外，可以定义每日的 Query清单：每天清晨起床，可以拟定下 “我的注意力最需要投注在哪三件事上？”这能帮你设定一天的注意力基调</p><h2 id="优化-key-value-对">优化 Key-Value 对</h2><p>定义了 Query之后，就需要对输入的信息进行过滤和权重分配。这意味着需要强化高价值的 Key和弱化低价值的 Key</p><ul><li><strong>强化高价值 Key</strong>：主动寻找和增加与你的核心 Query相关的信息源。例如，如果你的 Query是 “提升专业技能”，那么专业的在线课程、行业报告、高质量的书籍就是高价值的Key。它们背后的 Value 是职业成长和核心竞争力<br></li><li><strong>弱化低价值 Key</strong>：勇敢地对那些与你核心目标无关的 Key说不。这相当于在计算注意力权重时，直接给它们乘以一个接近 0的衰减系数。无关的微信群、八卦新闻 App、无尽的推送通知，都应被纳入此列</li></ul><p>这需要我们对输入信息进行权重分配，建立一个精密的过滤系统。实战中有一个分级过滤策略值得尝试（其中不少理念出自上面的《深度工作》这本书）</p><p><strong>第一层：环境级过滤</strong></p><ul><li>卸载那些最消耗你时间的娱乐应用（尤其是短视频和社交媒体 App）。或者可以只在电脑端使用它们，增加使用门槛<br></li><li>减少用网络来消磨碎片时间：排队、等车时不要立刻刷手机获取碎片化，这会让你的大脑习惯于这种 “分心” 的模式。可以做一些连续性强的事情，如听播客<br></li><li>关闭所有非关键通知，只保留电话、短信和极少数重要通讯工具的通知，减少这些信息对你的中断</li><li>使用 Freedom、Cold Turkey 等工具在工作时段屏蔽干扰网站</li></ul><p><strong>第二层：内容级过滤</strong></p><ul><li>取消关注那些让你焦虑、或总是推送无用信息的公众号、博主和邮件列表<br></li><li>订阅 2-3 个高质量的输入信息源，关注少数几个领域内的顶尖专家，而不是被算法推荐牵着走<br></li><li>建立 "信息食谱" 概念：蛋白质（深度内容）、维生素（跨界知识）、碳水化合物（日常资讯）</li></ul><p><strong>第三层：时间级过滤</strong></p><ul><li>设定固定的工作时间，如每天在固定时间进行深度工作，形成一种习惯和节奏；设定固定的信息处理时段，比如上午 10-11 点处理邮件和企业IM 的消息<br></li><li>晚间 10 点后启动 "数字宵禁"，停止处理工作信息<br></li><li>每周日上午进行 "信息斋戒"，通过冥想等方式给大脑留出消化的时间和空间</li></ul><h2 id="multi-head-策略">“Multi-Head” 策略</h2><p>Transformer 的多头注意力（Multi-HeadAttention）机制，真正在硬件层面同步计算多个注意力函数，然后将结果拼接融合，它的每个head 都拥有独立的计算资源，来并行捕捉信息的不同方面</p><p>但对人类而言，如果前面提到，人类大脑的构造决定了我们本质上是序列处理器，而非并行处理器。所谓的 “多任务” 只是快速切换，并付出巨大的切换成本 —— 包括时间延迟、错误率增加和心智疲劳等</p><p>因此，我们的策略不是成为机器，而是<u>向机器学习其架构的 “专注” 与 “模块化” 思想，通过极致的规划，在时间线上模拟出并行的效果，从而最大化我们串行处理器的效能</u>。如果我们把注意力模块化地分配，可以粗略将注意力划分为4 种重要的 head：深度工作、日常事务、创意探索和恢复休息</p><ul><li><strong>“深度工作” 头</strong></li></ul><p>进入深度工作状态，本质是触发 “心流”(FLow)。心流状态下，大脑会释放去甲肾上腺素、多巴胺、内啡肽等神经化学物质，这些物质不仅能提升幸福感，还能显著增强专注力、模式识别能力和创造性思维。这是一种一旦中断就难以重建的高价值状态。</p><p>进入深度工作状态有一些可尝试的建议</p><p>1）<strong>设定启动仪式</strong>：在深度时间块开始前，进行一个简单的仪式（如泡一杯茶、整理桌面、深呼吸三次），告诉大脑 “准备进入状态了”。这能形成强大的条件反射</p><p>2）<strong>明确产出目标</strong>：不要只写 “写报告”，而是写 “完成报告引言部分和三个核心论点的初稿”。具体的目标能牢牢锁住你的注意力</p><p>3）<strong>环境设计</strong>：<strong>工作台极简主义</strong>，即保持桌面整洁，只留下当前任务所需的物品。多余的物品都是视觉上的干扰源；<strong>噪音管理</strong>，环境嘈杂下使用降噪耳机，播放白噪音、自然声音或专注音乐（如 Lo-fi），隔绝<span class="exturl" data-url="aHR0cHM6Ly9wbWMubmNiaS5ubG0ubmloLmdvdi9hcnRpY2xlcy9QTUM4MTYxNDQwLw==">auditorydistraction<i class="fa fa-external-link-alt"></i></span></p><p>4）<strong>番茄工作法</strong>：对于难以进入深度状态的人，可以从 25 分钟专注 + 5 分钟休息的 “番茄钟” 开始训练。当你深度工作能力增强后，可以尝试延长专注时间至 50 分钟或 90 分钟</p><ul><li><strong>“日常事务” 头</strong></li></ul><p>如同前面提到的 “注意力残留” 效应，当你从一项未完成的任务切换到另一项时，你的注意力资源并不会立刻完全转移，一部分会 “残留” 在之前的任务上。而<em>批量处理琐事，就是为了将这些残留效应集中并最小化，避免它们污染你的深度工作时间</em></p><p>具体的建议，<u>可以安排 1-2 个固定时间（如上午 11 点，下午 4 点），批量处理邮件、回复消息、报销等琐碎事务。其他时间绝不查看</u>；同时也为这个时间块设置一个倒计时（如 45 分钟）。时间压力会迫使你更快地决策和行动，避免在琐事上过度完美主义</p><ul><li><strong>“创意探索” 头</strong></li></ul><p>当你停止专注思考，进入放松、漫无目的的状态时，大脑的 “默认模式网络”会被激活。这个网络并非在休息，而是在后台进行信息整合、连接不同记忆、并孵化创意。许多 “<span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvRXVyZWthX2VmZmVjdA==">Aha!moment<i class="fa fa-external-link-alt"></i></span>” 都发生在此刻，因为它<em>连接了意识思考未能触及的遥远节点</em></p><p>关于创意探索，也有一些具体的方法论</p><p>1）主动安排 “无聊” 时间：刻意在日程中留白，不安排任何活动，允许自己发呆、散步、望窗外</p><p>2）跨界刺激：阅读与你专业完全无关的书籍、杂志或纪录片。<em>异质性的信息是创意的最佳催化剂</em></p><p>3）创意捕捉：在 “创意探索” 时间后，安排一个简短的（5-10 分钟）记录时间，将脑海中浮现的任何想法记录下来，无论它们当时看起来多么不靠谱</p><ul><li><strong>“恢复休息” 头</strong></li></ul><p>这里说的恢复休息，不是上了一周的班之后身心俱疲后，通过胡吃海喝，通宵打游戏追剧等来缓解表层焦虑的行为。高质量的休息不是一个纯被动的接收过程，而是一系列主动为大脑做的优化：<u>系统性清理与重置（睡眠）、硬件升级与优化（运动）、软件调试与抗干扰训练（冥想正念）</u></p><p>1）睡眠：睡眠远非简单的休息。它将你的大脑从信息收集模式切换到关键的维护模式。在此期间，大脑会进行深度清理，清除白天积累的代谢废物（如 β- 淀粉样蛋白），巩固记忆，并将知识从海马体转移到皮层，形成长期记忆。<strong>将睡眠视为非协商性投资</strong>，如同对待 “深度工作” 头一样，在日历上锁定睡眠时间，保证睡眠的时长和质量；除了夜间睡眠，中午 20 分钟左右的短睡能有效清空工作记忆，为下午的深度工作块重启认知资源。关于睡眠的原理和重要性，可以参考这期播客<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY0MTA0ODJmMDkyZWI2M2NiMDk4NTJmNQ==">《我们为什么要睡觉》：情商和心理治疗都靠睡觉？<i class="fa fa-external-link-alt"></i></span></p><p>2）运动：身体活动是最高效的健脑术。有氧运动能直接促进脑源性神经营养因子（BDNF）的释放，这种物质如同为大脑神经元 “施肥”，能促进神经细胞生长、增强连接，直接提升学习效率、记忆力和专注力的 “硬件基础”。定期运动就是在为你的整个认知系统进行硬件升级</p><p>3）冥想正念：如果说睡眠是清理缓存，运动是升级硬件，那么冥想就是对注意力这款 “核心软件” 的调试和优化。<u>每天 10-15 分钟的正念冥想，其核心价值不在于增加注意力时长，而在于极大地提升你的“元认知” 能力 —— 即觉察到注意力涣散（<span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvTWluZC13YW5kZXJpbmc=">Mind-Wandering<i class="fa fa-external-link-alt"></i></span>）</u>并将其温和而坚定地拉回的能力。这就像是每日为注意力进行的 “健身操”，长期练习能显著增强你对心智的控制力</p><h2 id="正向传播与反向传播">正向传播与反向传播</h2><p>如果我们把上面构建的注意力系统视为一个需要训练的神经网络。没有反馈的练习只是重复，无法带来精进。唯有通过 “反向传播” 计算误差并调整参数，模型才能变得更聪明。个人的注意力系统也需要持续的训练和迭代优化</p><p>正向传播比较直观，就是在每个规划好的时间块内，心无旁骛地执行单线程的 “正向传播”，即按照上面提到的Multi-Head策略，实现 “认知闭合”，屏蔽一切干扰，让思维在单一任务上深度推进</p><p>反向传播是最关键的一步。你需要一个反馈回路，可以粗略将其分为每日回顾与每周回顾</p><ul><li><strong>每日回顾</strong></li></ul><p>每天结束后可以花几分钟回顾一下当天的注意力分配情况，问自己一些关键性问题</p><p>1）一致性分析：<u>“我计划的注意力投向与实际投向一致吗？” →如果不一致，是计划不切实际，还是执行时意志力溃散？</u></p><p>2）漏洞溯源：<u>“今天最大的注意力‘漏洞’是什么？” →不要笼统地归咎于 “手机”。追问下去：是微信消息？是突如其来的邮件提醒？还是内心的焦虑感让你主动去寻找分心？</u></p><p>紧接着的问题就是 “明天如何堵上这个漏洞？”。这里的方法说实话会比较多样，需要针对性地制定微策略，同时也是因人而异。比如说如果是微信，能否将其放入定时开关的 “专注模式”？如果是邮件，能否关闭桌面通知？如果是内心焦虑，能否先花 5 分钟用纸笔梳理焦虑来源？</p><ul><li><strong>每周回顾</strong></li></ul><p>每周的回顾也是一个阶段性的回顾，比如说设定在工作日的最后一天如周五下午，可以从以下方面来梳理清楚过去一周的精力花费在了哪些方向上</p><p>1）审视 “注意力预算” 的分配：回顾过去一周的时间记录或日程表。你投入在不同 “注意力头”（深度、事务、创意、休息）上的时间比例是否健康？是否在低回报的浮浅工作上超支？</p><p>2）识别高价值活动：过去一周，哪些 “正向传播” 带来了最大的成就感和实际产出？下周如何复制并扩大这类活动？</p><p>3）优化日程模板：根据本周的洞察，为下一周设计一个更合理的 “串行多头” 日程模板。例如，发现下午 3 点后精力难以集中，就把 “深度工作头” 全部调整到上午</p><p>记录的工具比较多，市面上有比较多的 APP，对于 Mac笔记本的用户，笔者推荐的其实是自带的日程软件，跟 <span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY1N2Q1M2FhMjBkNzc5YjQ5ZDg2ZDI5OQ==">《时间贫困》：一个人的时间花在哪里，是看得见的<i class="fa fa-external-link-alt"></i></span>里提到的时间记账法比较类似</p><h1 id="你是你所有注意力的总和">你是你所有注意力的总和</h1><p>从《Attention Is All You Need》到 “Attention Is All YouHave”，这不仅仅是一次文字的戏仿，更是一个时代命题的转换。我们见证了机器如何凭借 “超级注意力” 崛起，也亲历了自身有限注意力在洪流中的飘摇。但本文的目的，并非制造如同纺织工人面对蒸汽机时、我们面对已经或即将取代大量工作岗位的AI时的那份焦虑和恐惧，是揭示一个更为根本的真相：<u>你的注意力流向何处，你的生命就走向何处</u></p><p>Transformer模型通过精妙的架构，将有限的算力精准投注于最有价值的信息关联上。这恰恰是我们最需要向机器学习的智慧 —— 不是学习它的 “无限”，而是学习它的 “专注” 与 “效率”。我们无法扩展注意力的总量，但可以像优化一个精密模型那样，去设计它的分配</p><p><strong>你定义的核心目标，是你向世界发出的Query；你精心筛选的信息环境，是你为自己构建的 Key-Value仓库；而你模块化管理的日程与精力，则是你独一无二的 Multi-Head策略。每日的反省与每周的复盘，就是你这个系统的反向传播算法，在误差中学习，在迭代中进化</strong></p><p>我们守护和优化注意力，不是为了更高效地完成工作，而是为了更清醒地度过这一生。你的注意力，是你用来雕刻自我和塑造现实的唯一刻刀。你将它持续投向哪里，哪里就会在你生命中生长、壮大。你关注知识，便成为智者；你关注创造，便成为创造者；你关注所爱之人，便构筑了深厚的关系</p><p>在这个万物都在争夺你注意力的时代，能够清醒地决定自己要看什么、想什么、爱什么，或许就是我们这个时代最珍贵的自由与最大的力量。毕竟<strong>Attention is all you have, and finally all you are</strong></p><hr><p>本文的一些参考内容</p><ul><li>《<span class="exturl" data-url="aHR0cHM6Ly9hcnhpdi5vcmcvYWJzLzE3MDYuMDM3NjI=">Attention Is All YouNeed<i class="fa fa-external-link-alt"></i></span>》<br></li><li>《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8xNTEyMzQ3Lw==">心理学原理<i class="fa fa-external-link-alt"></i></span>》<br></li><li>《<span class="exturl" data-url="aHR0cHM6Ly93d3cucG5hcy5vcmcvZG9pLzEwLjEwNzMvcG5hcy4wNzAwMzk1OTc=">Navigation-relatedstructural change in the hippocampi of taxi drivers<i class="fa fa-external-link-alt"></i></span>》<br></li><li>《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8yNjMxOTczMC8=">娱乐至死<i class="fa fa-external-link-alt"></i></span>》<br></li><li>《<a href="https://wulc.me/2025/05/03/%E5%B7%A5%E4%BD%9C%E3%80%81%E4%BD%93%E5%88%B6%E5%8C%96%E4%B8%8E%E8%87%AA%E7%94%B1/">工作、体制化与自由</a>》<br></li><li>《<span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvVGhlX1NvY2lhbF9EaWxlbW1h">TheSocial Dilemma<i class="fa fa-external-link-alt"></i></span>》<br></li><li>《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8yNzA1NjQwOS8=">深度工作<i class="fa fa-external-link-alt"></i></span>》</li><li><span class="exturl" data-url="aHR0cHM6Ly9uZXdzLnN0YW5mb3JkLmVkdS9zdG9yaWVzLzIwMDUvMDYveW91dmUtZ290LWZpbmQtbG92ZS1qb2JzLXNheXM=">‘You’vegot to find what you love,’ Jobs says<i class="fa fa-external-link-alt"></i></span><br></li><li><span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY0MTA0ODJmMDkyZWI2M2NiMDk4NTJmNQ==">《我们为什么要睡觉》：情商和心理治疗都靠睡觉？<i class="fa fa-external-link-alt"></i></span><br></li><li><span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY1N2Q1M2FhMjBkNzc5YjQ5ZDg2ZDI5OQ==">《时间贫困》：一个人的时间花在哪里，是看得见的<i class="fa fa-external-link-alt"></i></span><br></li><li><span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvVGhlX0ludmlzaWJsZV9Hb3JpbGxh">TheInvisible Gorilla<i class="fa fa-external-link-alt"></i></span><br></li><li><span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvSW5hdHRlbnRpb25hbF9ibGluZG5lc3M=">InattentionalBlindness<i class="fa fa-external-link-alt"></i></span><br></li><li><span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvTEM0TVA=">Limited CapacityTheory<i class="fa fa-external-link-alt"></i></span></li><li><span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvSGViYmlhbl90aGVvcnk=">Hebbiantheory<i class="fa fa-external-link-alt"></i></span><br></li><li><span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvQXR0ZW50aW9uX2Vjb25vbXk=">Attentioneconomy<i class="fa fa-external-link-alt"></i></span><br></li><li><span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvRmxvd18ocHN5Y2hvbG9neSk=">Flow<i class="fa fa-external-link-alt"></i></span></li><li><span class="exturl" data-url="aHR0cHM6Ly93d3cuc2NpZW5jZWRpcmVjdC5jb20vc2NpZW5jZS9hcnRpY2xlL2Ficy9waWkvUzA3NDk1OTc4MDkwMDAzOTk=">AttentionResidue<i class="fa fa-external-link-alt"></i></span></li></ul>]]></content>
    
    
    <summary type="html">&lt;p&gt;2017 年，《&lt;span class=&quot;exturl&quot; data-url=&quot;aHR0cHM6Ly9hcnhpdi5vcmcvYWJzLzE3MDYuMDM3NjI=&quot;&gt;Attention Is
All You Need&lt;i class=&quot;fa fa-external-link-alt&quot;&gt;&lt;/i&gt;&lt;/span&gt;》悄然问世，带来了 Transformer
的架构，这个此后被搜广推领域广泛应用、并成为后来掀起新一轮 AI 革命的 LLM
的基石。Transformer
让机器拥有了某种 “超级注意力”：一种可以并行处理全局信息、计算序列中所有元素关联权重的强大机制。它不需要像人类一样逐字逐句地阅读和理解，而是可以一瞬间 “看到” 全部，并找出其中最关键的连接&lt;/p&gt;
&lt;p&gt;但是一个巨大的悖论和困境正在上演。人类创造了看似拥有 “无限可扩展注意力” 的机器，但人类自身所拥有的，却是一套古老而有限的生物注意力系统。&lt;u&gt;机器的核心是 “更多、更快、更全局”，而人类的核心是 “选择、聚焦、做减法”。我们正用着自己这套需要休息、会疲劳、极易分心的心智系统，去对抗一个由 “超级注意力” 算法驱动的、旨在无限捕获我们注意力的科技环境&lt;/u&gt;&lt;/p&gt;
&lt;p&gt;对于碳基生物而言，更加残酷的一个事实是 &quot;Attention Is All You
Have&quot;。因为对人类来说，注意力是与生俱来、且每日额度恒定的核心生命资产。而这唯一的货币投向何处，你的生命就投资何处，最终也将到达何处。我们一直在说 “人是环境的产物”，究其原因，也许是人在某个环境中，不得不将其的注意力倾注到这个环境设定的规则里最关注的事情，进而决定了人将变为何种产物&lt;/p&gt;
&lt;p&gt;如果说注意力是人最宝贵的财富，那如何保护自己的注意力便是一个值得探讨的命题。本文尝试对这部分展开一些探索，包括人的注意力为何是有限的，这少得可怜的注意力在当下的注意力经济中是如何被各种争夺，以及如何构建自己的注意力框架。本文是笔者最近感觉自我工作效率低下后的一次寻根问底求法的过程，祝开卷有益～&lt;/p&gt;</summary>
    
    
    
    <category term="闲话几句" scheme="https://wulc.me/categories/%E9%97%B2%E8%AF%9D%E5%87%A0%E5%8F%A5/"/>
    
    
    <category term="闲话几句" scheme="https://wulc.me/tags/%E9%97%B2%E8%AF%9D%E5%87%A0%E5%8F%A5/"/>
    
  </entry>
  
  <entry>
    <title>搜索相关性：从建模到排序机制</title>
    <link href="https://wulc.me/2025/07/20/%E6%90%9C%E7%B4%A2%E7%9B%B8%E5%85%B3%E6%80%A7%E6%A6%82%E8%BF%B0/"/>
    <id>https://wulc.me/2025/07/20/%E6%90%9C%E7%B4%A2%E7%9B%B8%E5%85%B3%E6%80%A7%E6%A6%82%E8%BF%B0/</id>
    <published>2025-07-20T08:51:23.000Z</published>
    <updated>2026-02-28T05:01:22.859Z</updated>
    
    <content type="html"><![CDATA[<p>最近一段时间在研究搜索的相关性问题，一个颇有搜索特色的问题。搜索场景下的相关性，指的是展示给用户的内容，跟用户输入的query必须满足一定的关联关系，比如说搜 “肯德基”，就不应该出现 “麦当劳” 的内容</p><p>不同于在 feed 场景下，用户对内容基本无预期，feed场景的推荐算法可以基于用户历史浏览兴趣、最近热点内容等做exploit，或是通过探索用户的一些新兴趣做 explore。但在 search场景下，用户主动搜索输入的 query往往是有强意图的，出的内容也是要符合用户的这个预期的，否则这些搜索就是无效的，进而会造成搜索留存（LT）的损失。而在用户视角下，如果平台搜索的算法做得足够好，应该在第一页就能够找到自己想要的内容，而这这其实也导致了单pv 下 search 浏览深度会远比 feed 要低</p><p>场景上的差异，会导致 search 相较于 feed的优化目标也有不小差异。比如说搜索 LT的度量中，时长并不是最重要的指标；从排序角度，增加了相关性的约束，导致特定query 下可被用来排序的候选有限（相较于feed），同时排序公式中往往也要加入相关性因子来达成相关性目标，对最大化原目标（如广告就是收入）的效率造成干扰</p><p>排序的相关性约束，也是导致了很多在 feed 下有效的 ranking 迭代，在search 中效果不优甚至无效的原因，比如说这个问题里提到的现象 <span class="exturl" data-url="aHR0cHM6Ly93d3cuemhpaHUuY29tL3F1ZXN0aW9uLzYyNjM0MzIzNg==">为什么搜索系统技术文章很少，但推荐系统技术文章很多？<i class="fa fa-external-link-alt"></i></span>，一个很重要的原因是给定query，相关性候选不足导致了 ranking 搜索空间不足，而 ranking本身的收益应该是随着候选量增加的边际效率是递增的</p><p>本文主要探讨下搜索场景下的相关性问题的解决思路。如果粗略地划分，相关性往往会涉及到两部分：<u>相关性的建模，以及相关性模型预估分的作用机制</u>，本文尝试对这部分的内容详细展开做一些讨论</p><span id="more"></span><h1 id="相关性建模">相关性建模</h1><p>如何判断 query 与内容是否相关？直观来看可以分为主观和客观两类指标</p><ul><li>客观指标：就是看一些可基于用户行为来统计的客观指标，如用户搜索后的点击率（一般叫 “有点比”，越大越好）、或者在同一个搜索意图下是否频繁换query（一般叫 “换 q 率”，越小越好）、以及用户的搜索行为是否在减少 (搜索LT30)<br></li><li>主观指标：就是偏人工评估的指标，一般依赖约定好的标准，定义某个 query下不同内容的相关联的程度，然后人工定期抽检判断当前的搜索的内容的整体相关情况；但这个标准一般在不同APP 是不一样的，即使在同一 APP 内这些标准也是会频繁发生变化的</li></ul><p><u>这里说的相关性建模，针对的是主观指标的建模</u>，而主观指标其实也可以理解为是客观指标的一类中间指标，因为往往是由于搜索结果的相关性不足，导致了用户不点击或频繁换query 重新搜索，甚至离开平台不再搜索</p><h2 id="演进路线">演进路线</h2><p>从技术视角来看，判断 query 与 doc内容是否相关，也经历了几个阶段变化，在文章《<span class="exturl" data-url="aHR0cHM6Ly96aHVhbmxhbi56aGlodS5jb20vcC81Mzg4MjA1Njk=">大众点评搜索相关性技术探索与实践- 美团技术团队的文章<i class="fa fa-external-link-alt"></i></span>》中就提到了这相关性建模的演进路线</p><p><strong>阶段一：文本匹配</strong>。仅考虑 query 与 doc的字面匹配程度，通过 <span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvVGYlRTIlODAlOTNpZGY=">TF-IDF<i class="fa fa-external-link-alt"></i></span>、<span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvT2thcGlfQk0yNQ==">BM25<i class="fa fa-external-link-alt"></i></span> 等基于 term的匹配特征来计算相关性。这种方式计算效率高，但是泛化性比较差，匹配规则比较硬，没法处理一次多义或多词一义的问题</p><p><strong>阶段二：传统语义匹配模型</strong>。这种做法不像文本匹配那么粗暴了，而是对于原始的query 和 doc 做一个映射，映射到一个隐式的向量空间，然后在这个空间内计算query 和 doc 的相似性；最常见的做法就是把 query 和 doc 都映射成一个embedding，然后基于 embedding计算向量距离或空间相似度作为得分（实际上双塔 DNN模型隐式地做了这个事情）。比如说 <span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvUGFydGlhbF9sZWFzdF9zcXVhcmVzX3JlZ3Jlc3Npb24y">PartialLeast Square Regression<i class="fa fa-external-link-alt"></i></span>这一类方法；或者是将 Doc 映射到 Query 空间后进行匹配或计算 Doc 翻译成 Query 的概率，典型的方法可以参考这篇paper <span class="exturl" data-url="aHR0cHM6Ly93d3cubWljcm9zb2Z0LmNvbS9lbi11cy9yZXNlYXJjaC93cC1jb250ZW50L3VwbG9hZHMvMjAxNi8wMi9jaWttMTEwOC1kcmFmdC5wZGY=">Clickthrough-BasedTranslation Models for Web Search: from Word Models to PhraseModels<i class="fa fa-external-link-alt"></i></span></p><p><strong>阶段三：深度语义匹配模型</strong>。这里相较于阶段二引入了深度神经网络模型DNN。同时可以被粗略分为两种范式：<u>基于表示（Representation-based）的方法及基于交互（Interaction-based）的方法</u></p><ul><li> Representation-based 方法</li></ul><p>最常见的例子是类似 DSSM这一类双塔模型，也是召粗环节最常见的建模范式，基于 Bert 等 encoder结构，将原始的文本等特征映射至向量空间，再通过余弦相似度或点积计算最终相关性。在微软的Bing 搜索的 NRM 模型中，doc 的特征除了基础的标题和内容，还考虑了其他多源(Field) 信息，如外链、用户点击这个 doc 的历史 query 等；所以在 Doc中有多个 Field，每个 Field 内又有多个Instance（文本，如 Query 词）。模型首先学习 Instance 向量，将所有 Instance 的表示向量pooling 得到一个 Field 的表示向量，将多个 Field 的表示向量 pooling得到最终 Doc 的向量，如下图所示</p><p><img data-src="https://wulc.me/imgs/representation_based_rel.jpg" height="50%" width="50%"></p><p>Representation-based 方法的好处是 doc的向量可离线计算并缓存，线上服务时仅需计算 Query 向量并进行简单的相似度计算，性能好，延迟低，但缺点是Query 和 Doc在编码过程中缺乏直接的交互信息，仅依靠最终向量进行相似度计算，可能会丢失一些细粒度的匹配信号，表达能力有一定上限</p><ul><li>Interaction-based 方法</li></ul><p>这种方法没有显式将 Query 和 Doc 分开来直接学习 Query 和 Doc的语义表示向量，而是在底层输入阶段就让 Query 和 Doc 进行交互，如果说前面的双塔是召粗常用的范式，这里的模型是精排常用的范式。<span class="exturl" data-url="aHR0cHM6Ly9hcnhpdi5vcmcvcGRmLzE2MDkuMDYwMzg=">ESIM<i class="fa fa-external-link-alt"></i></span>是预训练模型引入之前被业界广泛使用的经典模型，首先对 Query 和 Doc 进行编码得到初始向量，再用 Attention 机制进行交互加权后与初始向量进行拼接，最终分类得到相关性得分</p><p>而引入预训练模型如 BERT 后，通常将 Query 和 Doc拼接作为 BERT 句间关系任务的输入，然后输入模型得到最终的相关性得分，如这篇paper 的做法就是这样的 <span class="exturl" data-url="aHR0cHM6Ly9hcnhpdi5vcmcvcGRmLzE5MTAuMTQ0MjQ=">Multi-Stage Document Rankingwith BERT<i class="fa fa-external-link-alt"></i></span>。</p><p><img data-src="https://wulc.me/imgs/interaction_based_rel.jpg" height="50%" width="50%"></p><p>这种方法的优劣刚好跟 representation-based方法相反了了，优点是匹配精度高，能捕捉非常细粒度的词语交互关系和深层语义信息；但同时计算开销巨大。线上服务时需要将Query 和 Doc实时拼接并送入大型模型进行前向计算，延迟高，对性能挑战大</p><h2 id="多阶段训练">多阶段训练</h2><p>建模需要解决几个基础问题，包括训练样本获取、特征构造、模型指标等。而在相关性建模任务中，直接的领域打标数据获取是有不小成本的，所以需要考虑因此会通过多阶段训练尽量在成本可控的情况下，提升模型效果</p><ul><li>训练样本获取</li></ul><p>由于相关性标准是平台制定且会频繁变化的，因此相关性训练样本的 label不像 ctr、cvr 这类任务有明确的 groundtruth，而是依靠人工标注。且相关性标准如果有变化，label也可能会有变化，因此实际中<em>针对某个特定领域，相关性模型训练样本的获取的成本是比较高的</em></p><p>因此在实际的训练过程中，往往是结合预训练模型 + 大量容易获取 label的相关领域数据先做一轮数据，然后再利用上面提到的人工标注的数据来做进一步的finetune。以上面大众点评的文章为例（其他的领域其实大同小异），会<u>先采用用户点击和负采样数据进行第一阶段领域适配的预训练（ContinualDomain-AdaptivePre-training），然后采用人工标注数据进行第二阶段训练（Fine-Tune）</u></p><p><strong>第一阶段训练</strong>：这个阶段将用户是否点击来作为 “是否相关” 的label，这种做法能够低成本获取很多训练样本。但如果<strong>直接将点击样本用于相关性判断会存在较大噪声</strong>，因为用户是否点击后受到很多信息的影响（最常见的就是位置信息，越靠前的越容易被点击，靠后的不被点击，但这并不是因为相关性问题），所以做法是引入了多种特征和规则来提高训练样本的准确率。具体规则如下</p><p><u>对于正样本获取，通过统计是否点击、点击位次、最大点击商户距用户的距离等特征筛选候选样本，将曝光点击率大于一定阈值的作为正例；对于负样本的获取，将位于点击doc 之前且点击率小于阈值的 doc才做为负样本，同时采用随机负采样的方式可以为训练样本补充简单负例，但考虑随机负采样时也会引入一些噪声数据，所以利用人工设计的规则对训练数据进行降噪：如当Query 的类目意图与 doc 的类目体系较为一致时或者与 doc名高度匹配时，则将其从负样本中剔除</u></p><p><strong>第二阶段训练</strong>：第二阶段就是常见的 fine-tune训练了，固定住底层参数，利用人工标准的更准确的 label来对顶层参数做微调。但是不同样本被标注的价值也是不太一样，如模型本身就能很好判断的easy pair，不如那些模型判断不清楚的 hardpair，因此在人工标注上，点评不是随机送一批样本给人工去标注的，而是通过<strong>难例挖掘和对比样本增强</strong>方式生产大量高价值样本交给人工去标注</p><ul><li><strong>难例挖掘</strong>：包括<u>1）将用户点击过但线上旧版模型判定为不相关的作为难例；2）通过边缘采样的方式挖掘具有较高不确定性的样本，如抽取模型预测得分在阈值附近的样本；3）模型或人工识别困难的样本，用当前模型预测训练集，将模型预测结果与标注标签不一致的样本，及人工标注标签有冲突的样本类型重新送标</u><br></li><li><strong>对比样本增强</strong>：借鉴对比学习的思想，为一些高度匹配的样本生成对比样本进行数据增强，并进行人工标注确保样本标签的准确率。通过对比样本之间的差异，模型可以关注到真正有用的信息，同时提升对同义词的泛化能力，这里给了一个这样的例子</li></ul><p><img data-src="https://wulc.me/imgs/contrasive_sample.jpg" height="50%" width="50%"></p><p>这里 query “榴莲蛋糕” 与推荐的 “榴莲千层、黑森林蛋糕” 是相关的，但 query“鹅肝汉堡” 与 “铁板鹅肝、芝士牛肉汉堡” 是不相关的，为了<strong>增强模型对这类高度匹配但结果相反的case的识别能力</strong>，文章的方法是构造了 “榴莲蛋糕” 与 “榴莲千层”、“鹅肝汉堡” 与 “铁板鹅肝” 这两组对比样本，去掉了与query在文本上匹配但对模型判断没有帮助的信息，让模型学到真正决定是否相关的关键信息，同时提升模型对 “蛋糕” 和 “千层” 这类同义词的泛化能力</p><ul><li>特征</li></ul><p>由于相关性是一个相对客观的标准（即给定一个 query 和 doc，后验的 label是明确的），受 context信息影响比较小（如位置信息、上下文信息），或者说在 query 和 doc不会因为换了位置等信息，相关性就会发生变化。因此相关性模型使用的特征相对来说也比较简单，query特征一般是原始的 query 文本，doc 特征一般是 doc 的多模态信息（如title、image）和 meta 信息（如 doc 所属的类别、类目等）</p><p>而随着大模型的广泛使用，也发展出了利用大模型来构造额外的 query 和 doc特征的路线。以 query 为例，基本的做法就是<u>基于 query 构造prompt（如基于 query和各个平台搜索出来的结果），然后让大模型总结输出更准确和详细的 querysummary，然后把这个 query summary 作为额外的 query特征输入给相关性模型</u></p><p>在业界上一般是基于 RAG（Retrieval-AugmentedGeneration）来完成这个步骤，RAG结合了检索（Retrieval）和生成（Generation）两种技术。基本的工作原理是当模型接收到一个query时，首先在一个大型的索引中检索相关的文档或信息片段，检索是基于相似性度量完成的，目的是找到与query最相关的信息，然后模型使用检索到的文档作为额外的上下文信息输入来生成内容，生成的这一步通常是由大模型来完成。如下图所示是一个基础的流程</p><p><img data-src="https://wulc.me/imgs/RAG_demo.jpg" height="50%" width="50%"></p><p>RAG 技术通过给 LLM 更详细的输入，能缓解 LLM的幻觉问题，也通常被应用在特定的垂直搜索的领域。关于 RAG更详细的介绍，可以进一步参考这篇文章 <span class="exturl" data-url="aHR0cHM6Ly93d3cuemhpaHUuY29tL3RhcmRpcy96bS9hcnQvNjc1NTA5Mzk2">大模型 RAG（检索增强生成）含高级方法<i class="fa fa-external-link-alt"></i></span></p><h1 id="排序机制">排序机制</h1><p>有了相关性预估分后，需要考虑的就是在线上如何应用这个预估分了。在系统中往往通过以下两个手段来保证相关性：相关性门槛和排序公式增加相关性项</p><ul><li>相关性门槛：固定值，用于过滤低相关性广告候选<br></li><li>排序公式增加相关性项：动态变化值，控制投后相关性目标达标</li></ul><p>搜索的相关性根本的目标是保证约定的 badcase 率约束不超，而相关性分的label 如果定义为是否 badcase，那预估分的物理含义即为是否 badcase的概率，就成了一个很常规的二分类任务了。则<u>当模型预估准确的时候，通过控制投后的预估均值等于某个目标，即可控制badcase 率在固定值附近</u>。如 badcase 目标是5%，相关性预估值准确情况下，让相关性预估均值保持为0.95，即可达成这个目标</p><p>那这个在系统中的排序机制应该是怎么样的，下面会针对这个问题提供一个解决思路</p><h2 id="最优排序公式">最优排序公式</h2><p>首先是最优排序公式的推导，通过下面的推导把问题形式化，这里以广告场景最大化ecpm 为例</p><p>假设有 <span class="math inline">\(n\)</span> 条请求，第 <span class="math inline">\(i\)</span> 条请求曝光的广告的相关性预估分位 <span class="math inline">\(predict\_rel\_score_i\)</span>，广告价值为 <span class="math inline">\(ecpm_i\)</span>，相关性均值的目标为target。则需要求解的问题的可形式化表达为如下形式（其中决策变量 <span class="math inline">\(x\)</span> 为广告选择策略）</p><p><span class="math display">\[\begin{align}\max_x &amp;\sum_{i=0}^{n-1} ecpm_i \\s.t. \frac{1}{n} &amp;\sum_{i=0}^{n-1} predict\_rel\_score_i=target\end{align}\]</span></p><h3 id="问题建模">问题建模</h3><p>由于每条请求往往会有多条广告，上述问题可进一步细化到如下形式</p><p>假设每个请求 <span class="math inline">\(i\)</span> 有 <span class="math inline">\(m_i\)</span> 个候选广告。对于广告 <span class="math inline">\(k\)</span> 在请求 <span class="math inline">\(i\)</span> 上，定义：</p><ul><li><span class="math inline">\(ecpm_{ik}\)</span>：广告的 eCPM 值<br></li><li><span class="math inline">\(s_{ik}\)</span>：广告的相关性预估分数（即 <span class="math inline">\(predict\_rel\_score\)</span>）<br></li><li><span class="math inline">\(x_{ik}\)</span>：引入二元决策变量，<span class="math inline">\(x_{ik}=1\)</span> 表示在请求 <span class="math inline">\(i\)</span> 上选择广告 <span class="math inline">\(k\)</span>，否则<span class="math inline"> \(x_{ik}=0\)</span></li></ul><p>则问题可表述成如下形式</p><p><span class="math display">\[\begin{align}\max &amp;\sum_{i=0}^{n-1} \sum_{k} x_{ik} \cdot ecpm_i \\s.t.  &amp;\sum_{i=0}^{n-1} \sum_{k} x_{ik} \cdot s_{ik} =(\sum_{i=0}^{n-1} \sum_{k} x_{ik}) \cdot target \\&amp; x_{ik} \in \{0,1\} \quad \forall i,k\end{align}\]</span></p><h3 id="问题求解">问题求解</h3><p><strong>1. 拉格朗日松弛</strong></p><p>由于约束是等式且全局，使用拉格朗日乘数法将约束融入目标函数。引入拉格朗日乘数<span class="math inline">\(\lambda\)</span>，构造拉格朗日函数 <span class="math inline">\(L\)</span>：</p><p><span class="math display">\[\begin{align}L(\mathbf{x}, \lambda)&amp;= \sum_{i=0}^{n-1} \sum_{k} x_{ik} \cdot \text{ecpm}_{ik} + \lambda\left( \sum_{i=0}^{n-1} \sum_{k} x_{ik} \cdot s_{ik} - (\sum_{i=0}^{n-1}\sum_{k} x_{ik}) \cdot \text{target} \right) \\&amp;= \sum_{i=0}^{n-1} \sum_{k} x_{ik} \cdot (\text{ecpm}_{ik} +\lambda \cdot (s_{ik} - \text{target}))\end{align}\]</span></p><p>这里的 <span class="math inline">\(\lambda\)</span>可以解释为相关性约束的 “影子价格”，表示每单位相关性分数变化对总 eCPM的边际影响，则最大化 <span class="math inline">\(L\)</span>等价于最大化</p><p><span class="math display">\[\begin{align}\max L(\mathbf{x}, \lambda) \iff \max \sum_{i=0}^{n-1} \sum_{k} x_{ik}\cdot (\text{ecpm}_{ik} + \lambda \cdot (s_{ik} - \text{target}))\end{align}\]</span></p><p><strong>2. 问题分解</strong></p><p>对于每个请求 <span class="math inline">\(i\)</span>，最大化 <span class="math inline">\(\sum_{k} x_{ik} \cdot (\text{ecpm}_{ik} + \lambda\cdot (s_{ik} - \text{target}))\)</span>，等价于选择广告 <span class="math inline">\(k\)</span> 使得 <span class="math inline">\(\text{ecpm}_{ik} + \lambda \cdot (s_{ik} -\text{target})\)</span> 最大</p><p><span class="math display">\[\begin{align}k_i^* = \arg\max_{k} (\text{ecpm}_{ik} + \lambda \cdot (s_{ik} -\text{target}))\end{align}\]</span></p><p>因此，最优决策是对于每个请求 <span class="math inline">\(i\)</span>，独立选择广告 <span class="math inline">\(k\)</span>以最大化以下线性组合，同时也是每条请求的排序公式</p><p><span class="math display">\[\begin{align}score_{ik}=\text{ecpm}_{ik} + \lambda \cdot (s_{ik} - \text{target})\end{align}\]</span></p><p><strong>3. <span class="math inline">\(\lambda\)</span> 求解</strong></p><p>在数学上，<span class="math inline">\(\lambda\)</span> 是拉格朗日乘数，通过求解约束方程获得。实际系统中，<span class="math inline">\(\lambda\)</span>可以通过迭代方法调整（如二分搜索、梯度下降或在线学习），如可以使用二分搜索方法（因为<span class="math inline">\(s_i(\lambda)\)</span> 是关于 <span class="math inline">\(\lambda\)</span> 是单调递增的函数），步骤如下</p><ol type="1"><li>初始化 <span class="math inline">\(\lambda_{low}\)</span> 和 <span class="math inline">\(\lambda_{high}\)</span></li><li> 对于每个 <span class="math inline">\(\lambda\)</span>，计算所有请求的选择（最大化 <span class="math inline">\(\text{ecpm}_{ik} + \lambda \cdot s_{ik}\)</span>)并计算平均 <span class="math inline">\(s_i\)</span></li><li> 如果平均 <span class="math inline">\(s_i &gt;\text{target}\)</span>，则减小 <span class="math inline">\(\lambda\)</span>（降低相关性权重）；反之增大 <span class="math inline">\(\lambda\)</span></li><li> 重复直到平均 <span class="math inline">\(s_i\)</span> 收敛到target</li></ol><p>上述方法需要我们获取的所有的流量和候选才能执行，相当于<strong>回放过去一段时间的流量得到的历史最优兑换比<span class="math inline">\(\lambda\)</span></strong>。但这跟最优出价比较类似，实际中比较难直接应用。因为这里有两个前提：<u>（1）获取到当天所有流量的数据（2）改变实际竞胜的广告不会影响竞价环境。在实际中这俩往往是难以满足</u></p><p>更常见的实际做法是基于过去一段时间搜集的相关性预估值均值，然后基于pid 来做实时调控调整 <span class="math inline">\(\lambda\)</span>的值，pacing 的目标就是相关性均值等于target。这部分其实跟出价调控比较类似，与计划最优出价类似，这也导致了实际的兑换比与理论最优兑换比有gap，需要通过各种手段逼近理论最优的兑换比</p><h2 id="逼近理论最优">逼近理论最优</h2><p>如果进一步分析，会发现实际通过 pid等控制器调控的方式，相较于流量回放直接解决最优化问题，<strong>差异在于调控过程中是否感知到了流量价值即ecpm</strong></p><p>因为在解决最优化问题时，有最大化 ecpm这一目标在约束求解过程，会去寻找刚好满足 target 达成的 <span class="math inline">\(\lambda\)</span>。但在实际的控制器调控中，只能感知到当前相关性均值是否达标了，当相关性不达标的时候会把<span class="math inline">\(\lambda\)</span> 调得非常大，导致 ecpm项在排序中发挥的作用非常小，这就导致了 ecpm 非最优</p><p>比如说在两个连续的时间片内，前一个时间相关性是不达标的状态，但有高ecpm 的候选，这个时候只考虑相关性，会把 <span class="math inline">\(\lambda\)</span> 调的很大，导致高 ecpm候选出不去（因为相关性项占了主导），而接着下一个时间片相关性有缓解了（因为前一个时间片出了高相关性广告），但候选没有高ecpm 的，此时降低相关性项的权重，但出的广告 ecpm也不是最优的了；但如果反过来，在前一个时间片降低 <span class="math inline">\(\lambda\)</span> 后一个时间片升高 <span class="math inline">\(\lambda\)</span>，是可以做到打平相关性最大化 ecpm的，而这需要的就是调控感知流量价值</p><p>在调控 <span class="math inline">\(\lambda\)</span>过程中感知到流量价值即 ecpm，最直观的就是用过去一段时间 <span class="math inline">\(t\)</span>内搜集到的流量和广告候选，然后直接通过上面提到的二分法直接求解这个最优化问题，求得最优的兑换比<span class="math inline">\(\lambda^*\)</span>，用作下一个时间片的兑换比。但这里<u>有一个比较强的假设是过去过去一段时间<span class="math inline">\(t\)</span>的流量和候选分布，跟下一个时间片的类似（或者说差异不大），才能有效</u>，否则约束比较难达成</p><p>除了上面的方法，还有一种更直观的方法，就是在调控过程中直接基于流量价值动态调整兑换比。如果把流量按照价值和相关性两个维度划分，可以划分为如下四个象限</p><p><img data-src="https://wulc.me/imgs/value_relevance_classifcation.jpg" height="50%" width="50%"></p><p>对于这四类流量，如果直观来看，可以先验给出如下的兑换原则</p><p>（1）高价值高相关性的流量，降低兑换比，尽可能多出高 ecpm 广告<br>（2）低价值高相关性的流量，提高兑换比，尽可能多出高相关性广告来填补高相关性<br>（3）高价值低相关性的流量，降低兑换比，但兑换比要比（1）更高，防止相关性不达标<br>（4）低价值低相关性的流量，提高兑换比，兑换比（2）要更高，尽量不出广告</p><p>这里的做法跟前面的理论最优推导出来的结论 “全局最优的兑换比是一个固定的<span class="math inline">\(\lambda\)</span>” 有点矛盾。因为这里相当于是给高价值流量和低价值流量不同的兑换比，而不是全局统一的；但事实上理论最优的假设（看到所有流量）是没法满足的，而我们当前本身就是在做理论最优解的逼近，所以不一定要遵循理论最优的固定的<span class="math inline">\(\lambda\)</span> 的这个结论</p><p>另外这个方法有效也有两个重要假设:<strong>1）高价值流量损失的相关性可以从低价值流量上找补回来；2）单位相关性在高价值流量上的兑换效率比低价值流量的更高</strong>。1）比较好理解，因为如果找补不回来那相关性就无法达成，而2）指的是 ecpm和相关性分数的分布在高低价值是不一样的，或者更直观地说：<u>在高价值流量上获取单位相关性损失的<span class="math inline">\(\Delta ecpm\)</span>会比低价值流量更大</u>，而这其实取决于实际的库存分布（即 ecpm和相关性分的分布），从实际系统来看，这个假设成立的概率还是不小的</p><p>另外，<em>在实际调控中，需要考虑对这些兑换比调整后，大盘的 target是能达到的</em>。从这个角度来看，其实方案 2 比方案 1是更能达成这一点的，因为可以基于统一的调控系数来做扰动。方案二的解决思路类似出价中的 “保浅优深” 的扰动策略，在保证大盘target 目标达成的前提下，基于流量价值对 <span class="math inline">\(\lambda\)</span>做扰动；但是与出价不同的是，出价往往是在计划维度做这个事情，但相关性是大盘维度的，没法做在计划维度，一是target是大盘约束，没法很好拆解到各个计划上，二是做在计划维度上也不是最优的，因为做在计划上要求每个计划都有一个target，这样计划之间就不好做兑换了，或者说要约束更多了，求解空间更小了。关于出价问题上类似的解决思路，可以参考这篇文章《<a href="https://wulc.me/2020/07/19/%E3%80%8ABid%20Optimization%20by%20Multivariable%20Control%20in%20Display%20Advertising%E3%80%8B%E9%98%85%E8%AF%BB%E7%AC%94%E8%AE%B0/">BidOptimization by Multivariable Control in Display Advertising</a>》</p><h1 id="小结">小结</h1><p>本文从搜索与推荐场景的差异出发，探讨了相关性建模的技术演进与排序机制中的最优控制策略，试图为这一经典问题提供系统性的解决思路。搜索场景的强意图特性决定了相关性问题的特殊性：与推荐场景的 “无目的性浏览” 不同，用户搜索带有明确预期，这要求结果必须精准匹配查询意图。从技术视角上可以分为相关性建模和排序机制两部分</p><p>在相关性建模中，基本的迭代经历了从文本匹配到深度语义匹配的演进。当前主流方法可分为基于表示（Representation-based）和基于交互（Interaction-based）两类范式，两者在精度与性能间各有权衡。而引入预训练模型及 RAG 技术后，模型对语义的理解深度和泛化能力得到了显著提升。关于相关性建模有两点值得关注，一是基于大模型的语义理解与生成：大语言模型（LLM）在语义理解、意图推理和内容生成方面展现出强大能力，未来有望深入应用 LLM 进行查询意图的深层解析、扩展与归一化，甚至直接生成或增强相关内容摘要，进一步提升相关性判断的准确性和可解释性；二是个性化相关性理解：搜索意图有群体共性，但亦存在个体差异；虽然当前的相关性与context不相关，但未来的相关性模型可能需要更好地融合用户个性化上下文（如历史行为、实时偏好），在保证基础相关性的前提下，提供更契合个体需求的精准结果</p><p>在排序机制中。通过最优化问题形式化推导了带相关性约束的排序公式 <span class="math inline">\(score =\text{ecpm} + \lambda \cdot\text{rel_score}\)</span>。其中的拉格朗日乘数 <span class="math inline">\(\lambda\)</span>可视为相关性约束的 “影子价格”，通过调控 <span class="math inline">\(\lambda\)</span>可实现相关性目标的达成与 ecpm 最大化间的平衡</p><p>当前 <span class="math inline">\(\lambda\)</span>调控多基于大盘均值，难以感知流量价值差异。理想状态应实现分流量价值层的精细化调控，对高价值高相关性流量降低<span class="math inline">\(\lambda\)</span>以提升 ecpm，对低价值高相关性流量提高 <span class="math inline">\(\lambda\)</span>以保证相关体验。同时需要考虑在不破坏大盘目标的前提下实现这种动态调控</p><p>搜索广告的相关性，归根结底是在用户意图、广告主诉求和平台价值三者间寻求最佳平衡的艺术与科学。它既需要深入的技术建模与算法优化，也离不开对用户搜索心理和广告主业务目标的深刻洞察。未来的搜索广告系统，或许将更加智能与自适应，能够动态感知不同场景、不同用户对相关性的差异化期望，并精准调控商业与体验的平衡点</p>]]></content>
    
    
    <summary type="html">&lt;p&gt;最近一段时间在研究搜索的相关性问题，一个颇有搜索特色的问题。搜索场景下的相关性，指的是展示给用户的内容，跟用户输入的
query
必须满足一定的关联关系，比如说搜 “肯德基”，就不应该出现 “麦当劳” 的内容&lt;/p&gt;
&lt;p&gt;不同于在 feed 场景下，用户对内容基本无预期，feed
场景的推荐算法可以基于用户历史浏览兴趣、最近热点内容等做
exploit，或是通过探索用户的一些新兴趣做 explore。但在 search
场景下，用户主动搜索输入的 query
往往是有强意图的，出的内容也是要符合用户的这个预期的，否则这些搜索就是无效的，进而会造成搜索留存（LT）的损失。而在用户视角下，如果平台搜索的算法做得足够好，应该在第一页就能够找到自己想要的内容，而这这其实也导致了单
pv 下 search 浏览深度会远比 feed 要低&lt;/p&gt;
&lt;p&gt;场景上的差异，会导致 search 相较于 feed
的优化目标也有不小差异。比如说搜索 LT
的度量中，时长并不是最重要的指标；从排序角度，增加了相关性的约束，导致特定
query 下可被用来排序的候选有限（相较于
feed），同时排序公式中往往也要加入相关性因子来达成相关性目标，对最大化原目标（如广告就是收入）的效率造成干扰&lt;/p&gt;
&lt;p&gt;排序的相关性约束，也是导致了很多在 feed 下有效的 ranking 迭代，在
search 中效果不优甚至无效的原因，比如说这个问题里提到的现象 &lt;span class=&quot;exturl&quot; data-url=&quot;aHR0cHM6Ly93d3cuemhpaHUuY29tL3F1ZXN0aW9uLzYyNjM0MzIzNg==&quot;&gt;为什么搜索系统技术文章很少，但推荐系统技术文章很多？&lt;i class=&quot;fa fa-external-link-alt&quot;&gt;&lt;/i&gt;&lt;/span&gt;，一个很重要的原因是给定
query，相关性候选不足导致了 ranking 搜索空间不足，而 ranking
本身的收益应该是随着候选量增加的边际效率是递增的&lt;/p&gt;
&lt;p&gt;本文主要探讨下搜索场景下的相关性问题的解决思路。如果粗略地划分，相关性往往会涉及到两部分：&lt;u&gt;相关性的建模，以及相关性模型预估分的作用机制&lt;/u&gt;，本文尝试对这部分的内容详细展开做一些讨论&lt;/p&gt;</summary>
    
    
    
    <category term="计算广告" scheme="https://wulc.me/categories/%E8%AE%A1%E7%AE%97%E5%B9%BF%E5%91%8A/"/>
    
    
    <category term="计算广告" scheme="https://wulc.me/tags/%E8%AE%A1%E7%AE%97%E5%B9%BF%E5%91%8A/"/>
    
    <category term="机器学习" scheme="https://wulc.me/tags/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/"/>
    
    <category term="搜索" scheme="https://wulc.me/tags/%E6%90%9C%E7%B4%A2/"/>
    
  </entry>
  
  <entry>
    <title>工作、体制化与自由</title>
    <link href="https://wulc.me/2025/05/03/%E5%B7%A5%E4%BD%9C%E3%80%81%E4%BD%93%E5%88%B6%E5%8C%96%E4%B8%8E%E8%87%AA%E7%94%B1/"/>
    <id>https://wulc.me/2025/05/03/%E5%B7%A5%E4%BD%9C%E3%80%81%E4%BD%93%E5%88%B6%E5%8C%96%E4%B8%8E%E8%87%AA%E7%94%B1/</id>
    <published>2025-05-03T03:43:52.000Z</published>
    <updated>2026-02-28T05:01:22.741Z</updated>
    
    <content type="html"><![CDATA[<p>最近一段时间很忙，忙到整个大脑带宽被打满、回到出租屋只想躺平放空，或是忍不住无意义的刷短视频；忙到觉得自己工种变了（变成了一个消防员，天天在救火）；忙到甚至没有没时间去做更长期规划；能明显感觉到自己的词汇量、语义精度、表达能力和表达欲在迅速下降，同时自我对知识、对他人、对世界的好奇心和热情，似乎正在被浇灭。人身处其中的时候也许并不觉得有什么大碍，因为已经被 “体制化” 了，但一旦有更长的空闲时间，开始做 “上帝会发笑” 的行为，就能愈发感觉到了这种状态的恐怖之处，我觉得可能是时候给自己做个诊断了，于是有了这篇文章</p><p>本文主要是对最近一些经历和疑惑的碎碎念，以及试图求得其中的破解之法；涉及工作、情绪、短视频、以及自由的追求，文章极度发散，内容极度主观，就是一个情绪出口和以及写给自己的心理按摩，如果你愿意看，那祝开卷有益～</p><span id="more"></span><h1 id="工作与情绪">工作与情绪</h1><p>如果说这一切的开端，也许是工作及其带来的情绪变化</p><blockquote><p>世人慌慌张张，不过图碎银几两。偏偏这碎银几两，能解世间万种慌张</p></blockquote><p>为了 “碎银几两”，我们不得不去工作，除了极少数的幸运儿能从工作中获得满足感与成就感，达到理想中的<span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvSWtpZ2Fp">Ikigai<i class="fa fa-external-link-alt"></i></span>状态。对于绝大部分的 “世人” 来说，工作带来的也不仅仅是 “慌张” 的情绪，反刍过去、灾难化未来、他人眼中期待的自我与内心真实声音的矛盾，这些行为会迅速让人陷入我们称之为 “内耗” 的状态：瞻前顾后，忧心忡忡地迈出每一步，还得时刻担心着自己明天会不会被裁了，进而迅速消耗掉一个人的生命力</p><p>该用何种心态面对工作、以及在工作中衍生出来的种种情绪，也许是每一个职场人的必修课，尤其是对于那批度过了懵懂的新手期、工作了几年开始建立了一些职场认知、对未来有一些期待但现状有不太符合预期、处于burntout 阶段的职场人</p><h2 id="内耗自我他人规训">内耗：自我、他人、规训</h2><p>内耗是最近几年在职场特别流行的一个词语；在心理学上，内耗并不是一个专业术语的，它描述的是一种心理状态，在这个状态当中内心充满的是挣扎和冲突的感觉</p><p>内耗的人一般会有的两种特质：<strong>反刍和灾难化思维</strong>。顾名思义，反刍就是把过去不好的体验、情绪和经历，反复在脑海里重演，回味那种尴尬的情绪和氛围，犹如吃苦耐劳的老牛一样，让那些本来应该消化掉的情绪一遍遍重复折磨自己；灾难化思维则是把一件事情的结果和未来都想象成最差的结果，在自己的脑子里当了一回灾难片的导演，自己来恐吓自己；这两种负面的情绪导致了一个人会把一件事情的结果或者过程过度强化，所以ta内心就很焦灼，那这个过程就发生了很多的挣扎和冲突，消耗了大量的心理能量，或者说生命力</p><p>在工作中导致内耗的直接的原因，《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY3YjQ3Y2FlMDVhOTBkZmQwZDRjNjQ2Mg==">职场心累真相：90% 的疲惫和焦虑都来自这 3 种隐形内耗<i class="fa fa-external-link-alt"></i></span>》中指出有 3个：<u>（1）过度的自我批评（2）过度的关注他人的评价（3）限制性思维：即你 “应该” 这么做</u></p><p>前两者的关键词在与 “过度”，因为过犹不及，在其他语境下，这两点的描述的可能就是善于自省、共情能力强的这类偏 “褒义” 的特质了；第三点则是常说的社会时钟和社会规训，我们做的很多事情，也许并不是自己想做的，而是到了某个年龄，身边的亲人、朋友、媒体都在无一例外告诉自己应该去这么做的（比如说买房、结婚、生子）；在工作中，这几个原因的外显，就是当一个任务没能很好地完成时，会过度归因到自己身上，担心自己在其他人眼中会是一个 “没能力” 的员工，或者说日常的工作被一些自己不感兴趣但不得不去做的事情，工作的意义感荡然无存</p><p>另外，在生活中也许可以不在意其他人的眼光、不在乎社会给你打的标签；但是在工作中这并不容易，因为<em>工作就是一个需要关注他人评价的过程，是一个被公司规训的过程</em>：你需要关注合作方的评价、需要关注上级的评价、需要遵守公司的规章制度，做什么、不做什么都是有白纸黑字写着的，你需要交付好你的价值，以此来得到一个工作机会，以及可能的一个还不错的绩效。因此在工作中，第2 点和第 3点基本就是难以避免的，我们总得关注其他人的评价，总得去做公司让我们做的事情，当然，这里的 “度” 还是可以控制好的，但大部分的人是没法很好控制的，这其中也包括笔者</p><p>所以在工作中，更可操作的往往是第一点，即我怎么看待工作、看待我自己，或者说该用什么心态去应对工作及其衍生出来的一系列人和事，毕竟如同《<span class="exturl" data-url="aHR0cHM6Ly9tb3ZpZS5kb3ViYW4uY29tL3N1YmplY3QvMzYxNzE4MTQv">男孩、鼹鼠、狐狸和马<i class="fa fa-external-link-alt"></i></span>》里提到的 “<strong>我们只能看到外在，但一切发生在内在</strong>” 一样，如同《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8yMzQwMTAwLw==">遇见未知的自己<i class="fa fa-external-link-alt"></i></span>》中提到的 “<strong>外面没有别人，所有的外在事物都是你内心投射出来的结果</strong>” 一样，我们在内心塑造了世界，然后这个世界又塑造了我们，或者大白话说，同样一件事，心态会极大地影响我们的情绪和动作</p><h2 id="工作只是交换意义感和爱并非题中应有之义">工作只是交换，意义感和爱并非题中应有之义</h2><p>对于完美主义者而言，在工作的很多时候是在演绎一个期待的自我，所以也会极度在意自己的行为，以及其他人的看法；虽然这种期待往往是不现实的</p><p>这种演绎会让一个人在工作进展不顺利时，会反复想是不是因为自己不够努力，而导致了结果不符合预期，而忽略了这个事情其实还跟上下游的合作方的配合有关、跟老板的方向判断有关、跟当前的市场环境有关；会让一个人反复猜测自己是不是领导心里那个最好的候选，如同小时候想的 “我是否父母心里最好的孩子”，进而会怀疑自己是不是做得够了，是不是要做得更多（这里面多多少少有一些讨好型人格在里面了）</p><p>为什么会这样？在上面的关于职场心累真相的那一期播客，以及《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY3YjIxMTRjMDVhOTBkZmQwZGRkN2E1NQ==">每个人都有至暗时刻，其实你并不孤单<i class="fa fa-external-link-alt"></i></span>》中都提到了类似原因，心理学上有一个概念叫 <u>“价值条件化”：只有符合其他人的期望才能等到其他人的爱</u>（有条件的爱），这种一般来自早年的经历，作为儿童的我们会有一种默许的规定：如果我能够被别人爱，能够被别人肯定，那是因为我按照权威对我的评价和指点去做了某些事，这个爱是有条件的，这些条件就是我只有按照他这么做我才有价值。这里又涉及到了老生常谈的 “原生家庭”、“东亚小孩” 的问题，社交媒体每每讨论到这一类话题，似乎都演变成了停滞在原地不动的、对原生家庭的批斗，《被讨厌的勇气》中把这种行为成为<em>目的论而非原因论</em>，即<u>当前的不幸不是因为原生家庭导致的，而是因为先入为主相信了自己就是不幸的，不想改变而去找的原因</u>；而我们需要谨记的一点是：<strong>人是有选择权的，是有能力选择自己的生活，不需要、也不应该用过去的经历来解释自己的一生</strong></p><p>扯远了，工作很重要，但是意义感和爱并未题中应有之义，如果你是极少数能在工作中获得这两者的幸运儿，那么恭喜你；但对于绝大部分的人来说，工作就只是单纯的交换，用自己的时间精力、专业知识技能、指哪打哪的服从能力，去换取让自己维持生计的工资，仅此而已；在工业化程度越来越高的社会里，我们所做的事情会越来越螺丝化和单一化，这种标准化带来的结果是系统的鲁棒性和可持续性，因为螺丝坏了，替换一个就好，系统能够简单而快速地自我修复；而这也注定了工作对于个人的意义和价值在当今是一个奢侈品。打扮精致、穿行于灯火璀璨的高档写字楼的白领，跟流水线上、码头工地上重复着单一劳作的人，也许并无二样，即使是对于从事着看起来高大上的 “智力行业” 的程序员，不禁想到了大刘在《<span class="exturl" data-url="aHR0cHM6Ly93ZXJlYWQucXEuY29tL3dlYi9ib29rRGV0YWlsLzE5MzMyZmIwNzFhMjcyNzUxOTM0NzFh">2018 年 4 月 1 日<i class="fa fa-external-link-alt"></i></span>》那段让人拍案叫绝却、如同预言家一般的描述</p><blockquote><p>程序员网络工程师、数据库管理员这类人构成了 IT 共和国的主体，这个阶层是 19 世纪的产业大军在 21 世纪的再现，只不过劳作的部分由肢体变成大脑，繁重程度却有增无减</p><p><strong>在浩如烟海的程序代码和迷宫般的网络软硬件中，他们如两百多年前的码头搬运工般背起重负，如妓女般彻夜赶工</strong></p><p>信息技术的发展一日千里，除了部分爬到管理层的幸运儿，其他人的知识和技能很快过时，新的 IT 专业毕业生如饥饿的白蚁般成群涌来，老的人（其实不老，大多三十出头）被挤到一边，被代替和抛弃，但新来者没有丝毫得意，这也是他们中大多数人不算遥远的前景…… 这个阶层被称作技术无产阶级</p></blockquote><p>对于意义感，《每个人都有至暗时刻，其实你并不孤单》中提到，对于刚入职场的年轻人，因为对工作的新鲜感和热度还没褪去，也许还能通过给自己洗脑，赋予自己所做的事情以一些意义感，但是随着被职场毒打了几年，经历了更多的人和事后，对工作和职场看得更清楚、认知越来越清晰、再也没法给自己洗脑装睡后，会发现<strong>工作它不提供意义，它主要提供工资</strong>。但是播客也提到，一个人如果到了40岁再往后，或许可能会发现自己在做的事情会和这个世界某一部分的人群产生一些深层次的连接，ta能感受到一些召唤或者使命，即意义感这个东西可能是到了中年以后会慢慢浮现出来，或者至少对一部分幸运儿它会浮现出意义感，有种 “看山还是山，看水还是水” 的感觉</p><p>同样的，<strong>工作很重要，但不值得和爱挂钩</strong>；没必要把自己在原生家庭或者小时候某种没有被满足的需要投射到了职场当中；如果你太多的把工作等同于你的个人价值，等同于你有没有被爱、被尊重，等同于有没有成为 “父母眼中最喜欢的孩子”，会把个人的很多边界模糊掉（比如说生活和工作），而模糊带来的后果是很多动作会变形，心态也会变形</p><p>工作只是交换，为了交换我们不得不接受规训、做一些自己没那么喜欢但也没那么讨厌的事情，那在这个过程中，<strong>工作时候的 “我” 并不是真实的我，同样的，由于工作而导致别人喜欢或讨厌的 “你”，都不是真实的你</strong>。心理学上有两个词跟自我有关，一个是ego（客体的自我），另一个是self（主体的自我），前者更多指的是别人眼中的 “我”，包括 “我是不是一个被爱着的人”、“你是否能从我身上看到我有能力、我有价值” 这些都是跟ego有关的，它是一个跟自尊、自我评价，甚至有的时候是跟自负有关的一个自我；后者则是跟自我实现有关，“我要去创造什么”、“我要做什么样的事情”，都是跟self 有关的</p><p>职场中的 “自我实现” 的自我，往往指的是前者ego，而这其实是有点碍事的，因为工作就是去完成一个社会化的过程，去扮演一个 “拧螺丝” 的角色，但这个角色跟真实的自我self其实关系并不大，我只是去完成一个交换，在这个交换过程中，也许会让一些人喜欢，也会让一些人讨厌，但这并无大碍，因为这个角色并不是真实的自我</p><p>所以，不要在职场寻求爱，给予爱与被爱对大部分的人来说都很重要，你可以从你的朋友圈子、从你的爱人身上、从你的家庭中寻找和体会，但不要在工作当中去感受，因为不值得，套用李松蔚老师的话是这么说的：“对于一个有一定工作经验的人来讲，工作是很简单的。工作可能会涉及到计划、涉及到执行，有时候会涉及到创造，但是跟你的 ego，跟你的自我它没有那么大的关系，就是你在你的岗位上边做这个岗位应该去做的事情。这么说起来好像有点冷酷，但是在我心里边，其实我觉得有时候我们抱着冷一点的态度去面对一份工作的时候，有可能会让他做得更准确，然后你自己更轻松”</p><h2 id="刀刃向内给思想做一场手术">刀刃向内，给思想做一场手术</h2><p>侃侃而谈这么多，最终还是要寻求一些破解之法的，否则就成了烂大街的那些没有勺子的鸡汤一般</p><p>如同前面所说，我们在内心塑造了世界，然后这个世界又塑造了我们，破解之法的关键，也许就是刀刃向内，为自己的思想做一场手术，改变自己的一些认知和想法，毕竟他人的评价和公司的规训，在职场中我们确实是不得不关注的</p><p>（1）<strong>觉察并接纳</strong><br>能够察觉到自己的思维模式（反刍、灾难化思维等）和行为（过度自我批评、关注他人想法等）是导致了自己内耗的重要原因，有时候只是 “看见”，就能让自己的焦虑下降不少，因为再也不是如同无头苍蝇一般恐慌；其次是能够接纳真实的自己，接纳自己现状就是这么一个人，接纳事实是自己过去的经历塑造成自己就是这么一个人，但需要注意的是接纳并不是摆烂，人是有主观能动性的，是可以尝试去解决当下遇到的问题的</p><p>（2）<strong>课题分离</strong><br>这里的 “课题” 指的是人能控制的事情，可能粗略分为个人课题和他人课题</p><ul><li>个人课题（PersonalTopics）：指个人可以控制和改变的行为、想法和情绪。例如，一个人可以决定自己要学习什么、如何安排时间、如何应对压力等<br></li><li>他人课题（Other-PeopleTopics）：指他人的行为、想法和情绪，这些是个人无法直接控制的。例如，你不能控制别人对你的看法或者他们的行为方式</li></ul><p>课题分离指的就是，<strong>别人怎么看带我是他们的课题，我无法干预；我们不必不干涉他人的课题，也不被他人的课题干涉</strong>（雅俗共享版就是 “关你屁事” 和 “关我屁事”）；因为我们需要意识到一点，自己不用让所有人的满意，一是因为无论你怎么做，都没办法做到让所有人都满意，二是他人其实也没那么在意你，很多你以为的 “别人眼中的你”，其实是你再给自己的大脑制造幻想，自己给自己加戏</p><p>（3）<strong>角色扮演</strong><br>如同前面提到的 “工作只是交换，意义感和爱并非题中应有之义”，工作最重要的过程是交换，某种程度上我们只是在扮演一个社会化的角色，而在这个过程中，意义感和爱并不是必须之物，如果能找到那当然很好，找不到其实也是非常正常的</p><p>可以把自己想象成游戏中扮演的角色一样，上班就是游戏启动了，下班了退出登录回到现实世界中，游戏中的那个你，并不是真实的你；别人喜欢或讨厌的你，也不是真实的你；真实的你是回到现实生活的那个你</p><p>（4）<strong>保持 “初” 心</strong><br>在《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY3NmMwMGU4MWU4MjNlNzJkM2I5ZTExYw==">心理学博士怎么发疯？和李松蔚聊情绪：职场、东亚小孩、内耗、嫉妒和愤怒<i class="fa fa-external-link-alt"></i></span>》中提到，职场中往往是新人的心态会比较好，因为刚工作，心里没太多负担，同时觉得未来是有盼头的；但新工作一段时间，晋升困难，努力的边际收益在初步递减，这个时候容易青黄不接，进而产生内耗等种种负面情绪，某种程度上，这是因为有了一年的工龄后，对自己的预期变得过高导致的</p><p>保持 “初” 心，或者说保持年轻的心态，意味着需要保护好自己的好奇心，时刻提醒自己 “<strong>我的认知是有限的、需要持续学习，工资少点没关系我也是在学习中的</strong>”；而不要过度关注自己的实际年龄（社会时钟规训的在外在表现）</p><p>（5）<strong>用好老板</strong><br>需要意识到，老板是你的 “资源”，是协助你把事情做好的 “工具”；不要害怕去使用这个工具，或者麻烦到老板，因为老板的职责之一就是要协助你拿到目标的</p><p>虽然上面提到很多不要过度在意他人评价的原因和方法，但在职场老板的评价还是重要的，因为这决定了你的晋升和绩效等你希望交换得到的东西；但在这个过程<strong>不要去猜老板的预期，而是需要跟老板做好阶段性汇报</strong>，主动把一些进展披露给老板，老板也需要知道你的情况，同时应该根据你的情况给出建议和支持，老板真正害怕的是你一声不吭给他一个大的surprise</p><p>另外，不要压力过大，一个事情做不好，你老板也需要担责，老板有可能是误判了这个事情的预期，才把事情分配给你</p><p>（6）<strong>多样的参考系</strong><br>不要让自己的生活只有工作这一个参考系，当你生活的支点越多，你的内核就越稳定，如同在《<a href="https://wulc.me/2024/10/03/%E7%88%AC%E8%BF%87%E7%AC%AC%E4%BA%8C%E5%BA%A7%E5%B1%B1/">爬过第二座山</a>》中提到的一样</p><blockquote><p>当一个人评价自己的标准过于单一，比如只有工作业绩或者是财富数字；如果有一天这个唯一的参考系崩塌了，这对TA 来说，无疑是一种毁灭性的打击；这点也许对那些工作狂的一种诅咒</p></blockquote><p>上面这 6个方法，篇幅很短，但是要真正做起来，其实很难，因为要在大脑中植入新的想法，要改变自己过去几十年养成的习以为常的习惯，需要我们长时间持续的刻意练习</p><h1 id="短视频与体制化">短视频与 “体制化”</h1><p>工作压力大、极度焦虑的时候，总忍不住刷短视频。犹如精神吗啡一般，短视频 “治愈” 着北上广深的钢筋丛林里被工作折磨了一天的打工人的身心灵，手指翻飞间，奇闻异事、家国天下，都缓缓流淌在那巴掌大的屏幕上，刺激着人的多巴胺分泌，让人流连忘返，忍不住往下刷，甚至于深夜不眠；然后第二天精神萎靡地回到工位，身心灵被工作暴揍一天后回到出租屋，继续刷着短视频疗伤，日复一日，仿佛一个无限的循环</p><p>这个现象在很多人身上都有，包括笔者，长期在这种 “好想逃却逃不掉” 的习惯下，也会让人不禁会问：到底是什么操控着我们做这个事情，这样到底会有什么影响，以及有什么方式能打破这种恶性循环（如果真的想打破的话）</p><h2 id="体制化">“体制化”</h2><p>在知乎的<span class="exturl" data-url="aHR0cHM6Ly93d3cuemhpaHUuY29tL3F1ZXN0aW9uLzQzNjA3MDg3L2Fuc3dlci8yNjkzNjU1Mzc5">这个回答<i class="fa fa-external-link-alt"></i></span>中，提到一个很有意思的现象 “早酒文化”</p><blockquote><p>很多码头城市都有 “早酒文化”，也就是在早上喝几杯白酒，搭配高碳高脂的早餐，吃完以后再回家睡觉。形成这种文化的主要原因是，码头城市有很多以卸货为生的工人，而卸货通常是在晚上进行，在苦熬了一个通宵之后，已经身心俱疲，为了能睡个好觉，只好在早餐时喝点高度白酒，时间长了就形成了一种文化</p><p>这种生活是很伤身体的，这一点码头工人肯定也知道，但喝早酒的习惯却根深蒂固。原因也很简单：不这样做日子是要过不下去的。在充满苦的环境中，早上的几杯劣质白酒是唯一可以确定的甜，是生活唯一的 “正反馈” 来源。这也就是为什么有人劝他们戒酒，他们就会来一句 “这是我唯一的爱好，戒了活着还有什么劲”</p></blockquote><p>仔细想想，其实我们和码头工人也没什么区别，<u>大部分人的工作都是没有正反馈可言的，基本上就是枯燥任务的反复循环，犹如被惩罚的西西弗斯，一次又一次地推石头上山</u>。人如果长期呆在这种负反馈的环境之中，生命力很快就会耗尽，不得不依靠 “低级娱乐” 来输入正反馈。这也就是为什么很多人下班以后，选择刷短视频，而不是学习的原因</p><p>为什么是短视频而不是长视频呢？因为在高压社会下，个人精力被工作的过度耗竭，让个人难以拿出足够的时间精力接受整块信息，被迫在碎片化的摸鱼休息时间中，做一些不动身体也不走脑的低功耗行为</p><p>但吊诡之处在于，<strong>当工作中的负反馈和业余时间 “低级娱乐” 带来的正反馈达到某种平衡以后，所有尝试打破这种平衡的行为，都会变得难以忍受</strong>。比如你打算告别短视频，尝试在业余时间学习新技能，容易导致工作中的负反馈无法消解。与此同时，进入陌生领域也会带来新的负反馈，两者叠加在一起，人就很难坚持下去（大多数人自我提升计划的失败，基本上都是这个原因）</p><p>长期如此，人就会被环境 “体制化”，也就是身体、大脑、认知，甚至是性格，都会往融入当前环境的方向发展，以适应让自己不那么痛苦；毕竟 “人是环境的反应器”，毕竟 “与恶人居，如入鲍鱼之肆，久而不闻其臭，亦与之化矣”</p><p>事实上，人的适应性是很强的，无论是对于上面的痛苦还是生活的愉悦；而这也许就是可乐只有在第一口是快乐的原因，体验过、适应了这种快感，就会觉得平平无奇，需要更强的刺激和体验才能够重新体验到新的快乐，<strong>我们追求的是 “加速度” 而不是速度本身</strong>。柯立芝效应也是在说这个事情，七年之痒，无非就是新鲜感全然殆尽，又没能发展出比新鲜感更深的维系双方关系的联结（我们往往管这叫亲情）</p><p>扯远了，人是适应性很强的动物，但在这种情况下的适应的代价就是灵气的消失，以及学习能力的退化，简称为 “体制化”。从某种角度来说，被 “体制化” 好像也没什么不好，最起码痛苦的感受没那么强烈了。但<u>人所有的行为都是被情绪驱使的，所有的努力都是对当下的不满，如果痛苦的不再让你感到的痛苦，难受的不再让你难受，就会选择安于现状，人生的可能性也就消失殆尽了</u>。就如同影史经典《肖申克的救赎》对 “体制化” 的阐述：</p><blockquote><p>这些围墙很有趣，开始，你恨它，接着你适应了它们。时间久了，你开始离不开它们，那就是被体制化了（Institutionalized）</p></blockquote><p>如果你不幸被 “体制化” 了，从里面爬出来可能要花费很大力气，因为这是一个很深的泥潭，靠自己的力量挣扎出来会很难。如何避免被体制化，回答里也给了一些建议</p><blockquote><p><strong>用低功耗维持工作运转</strong>。具体来说就是，把工作当成工具而不是目的，在心理上与工作脱节，不主动辞职，但也不追求进步，更不和同事争抢。把老板、上司、同事在内心 “NPC 化”，也就是不把他们当人看，无论他们多么傻 x，都不与他们发生冲突，但也不多干活</p><p><strong>把节省出来的精力，专注于提升自己和扩展 “弱联系”</strong>，避免认知和人脉被 “体制化”</p><p>弱联系是什么意思？微弱的联系，比如说逢年过节群发的消息，可以理解为朋友圈的点赞之交，也就是互相知道对方是做什么的，但在生活中几乎没有什么来往。然而这种关系的作用，往往比生活中经常见面的 “强联系” 要大的多。可能在未来的某个瞬间，这种弱关系就能帮助到你</p><p><u>熟人社交是无效社交</u>。人们通常只能从 “强联系” 中获得表达性支持，简单来说就是熟人只有情绪价值，你不开心了，能抚慰你，并和你一起吐槽让你不开心的人；而从 “弱连接” 中则更容易获得工具性支持，能产生更多实质性的价值</p></blockquote><h2 id="斯金纳箱的奖赏">斯金纳箱的奖赏</h2><p>在这一期关于<span class="exturl" data-url="aHR0cHM6Ly93d3cuYmlsaWJpbGkuY29tL3ZpZGVvL0JWMWN2NDExYjdLQS8=">抽卡的视频<i class="fa fa-external-link-alt"></i></span>中，提到 “斯金纳箱实验（SkinnerBox Experiment）”，deepseek 给出的这个概念和实验过程如下</p><p><img data-src="https://wulc.me/imgs/Skinner_Box.jpg" height="50%" width="50%"></p><p>斯金纳箱实验，给我们呈现的事实是：小白鼠在一个有一定概率产生正反馈的系统中，会不断重复尝试某一个动作，以期望能够得到正反馈，即使这个过程中的也会出现负反馈（惩罚），小白鼠还是会乐此不疲得去重复这个动作，<u>因为ta期待的是下一次未知的、有可能会出现正反馈的、持续分泌多巴胺让小鼠沉醉其中的奖赏</u></p><p>这跟巴浦洛夫的狗还不太一样，斯金纳箱里的小白鼠是自发学会了不断重复尝试某个动作；前者是经典条件反射（被动关联刺激与反应），后者主动行为与结果的联系</p><p>为什么现在但凡是个游戏都加入了抽卡机制？是因为游戏抽卡就是一个大型的斯金纳箱实验，在一次次游戏抽卡行为中，我们都在渴望着下一次的抽卡能够出现金光、能够抽到稀有角色、能够获得 “欧王” 的奖赏</p><p>斯金纳箱的原理，也被应用在了各种短视频 app中，小白鼠按压开关的行为变成了我们每一次的下拉刷新，以及在下拉刷新后期待得到的概率的奖赏：经过提纯的高浓度片段。没错，短视频是经过提纯的高浓度片段，将过去需要花大量时间去观看和思考的长视频碎片化成更纯粹的刺激、每次划屏就是换内容、算法还能记住你的偏好的提纯片段；每一次的下拉刷新，都是一次未知的奖赏或惩罚，如果是前者，会让我们在屏幕上疯狂点小红心，享受这个内容的同时开始期待下一次的奖赏，如果是后者，那也没关系，只需要轻轻一划，便能够重新拥有获取这种奖赏的期待，并且短视频推荐算法的考核机制，决定了你划到奖赏的概率会越来越高</p><p>所以，在深夜中一次次下滑屏幕刷短视频的我们，跟那只在斯金纳箱中重复按下按钮的那只小白鼠，也并无二样</p><h2 id="那代价是什么">那代价是什么</h2><p>我很喜欢《<span class="exturl" data-url="aHR0cHM6Ly9tb3ZpZS5kb3ViYW4uY29tL3N1YmplY3QvMzQzMDE2OS8=">钢之炼金术师 FA<i class="fa fa-external-link-alt"></i></span>》这部动漫，以及里面提到的 “等价交换” 的概念：你如果想得到一些东西，必须要付出一些东西；因为 “命运所有馈赠的礼物，早已在暗中标好了价格”</p><p>不可否认的是，刷短视频的时候，人是快乐的，虽然这个快乐有点短期，也没法回味（仔细想想刷了几十个短视频的你，还记得这些短视频的内容么）；那么，这些快乐的代价是什么</p><ul><li><strong>表达能力</strong></li></ul><p>如果你花了大部分时间来观看短视频，你会发现，在日常生活中，不借助常用的网络用语，而是用自己的语言把一件事情描述的足够清晰，也会变成一件很困难的事情；你会发现过自己说话时如鲠在喉，想说但又说不出来，因为自己的词汇储备量，已经是很匮乏了</p><p>短视频平台的推荐算法考核目标，就是是内容快速传播、用户时长和完播率等，在这种模式下天然收到追捧的内容，是那些时间短、文本简洁、充斥着猎奇的观点的内容，同时导致短视频为了为了简洁，会使用大量的 “梗”，或者极度简化其中的事实与逻辑</p><p>这个<span class="exturl" data-url="aHR0cHM6Ly93d3cuemhpaHUuY29tL3F1ZXN0aW9uLzY1NTE0NTY0MC9hbnN3ZXIvMzUwMzQ4NTAxNA==">回答<i class="fa fa-external-link-alt"></i></span>就提到了，长时间的过度感知劣质样本集（在短视频的喜好推送中很容易重复出现）的结果有两个</p><p>（1）<strong>降低你的词汇量和语义精度，而这两点是思考、学习和认知的基础</strong><br>（2）对感知的取样模式变得单一化 / 简单化，并且调整脑部的功能区用于对这种拟合的计算和思考，从而挤占了进行其他计算（比如中心路径的深入思考）的功能区</p><ul><li><strong>阅读长内容能力</strong></li></ul><p>仔细想想，短视频刷多了后，你还有耐心坐下来把一部电影完整看完吗？你在阅读长文本的时候，还有足够的耐性和时间去把文字完整读完吗？还是说在期待有一个短视频帮你把电影内容或者这本书的内容给总结了？</p><p>短视频通常以 15 秒到 1 分钟的短时长呈现，内容快速切换且充满视听刺激（如音乐、特效、高频率剪辑）。这种设计让大脑逐渐适应了 “快速反馈” 模式，触发大脑多巴胺的快速释放，形成 “观看 — 愉悦 — 更多观看” 的循环。<u>这种即时满足机制降低了对延迟回报（如长视频的剧情铺垫或长文本的逻辑推导）的耐受性。长期来看，大脑对低刺激、需深度思考的内容失去兴趣，转而追求更易获得快感的短平快信息，导致注意力难以长时间集中于单一任务</u></p><p>沉迷这种快速反馈模式后，容易失去阅读长文字处理的功能，或者失去看内容深刻的长视频的功能。这时候再去进行阅读或者一些深度学习行为就会由于功能区被转移，而导致剧烈的不适感</p><ul><li><strong>系统性思考与推理能力</strong></li></ul><p>短视频的内容多为孤立片段，缺乏系统性，用户被动接受信息而无需主动整合逻辑。这种碎片化输入模式导致思维连贯性下降</p><p>另外，短视频篇幅过短，基本上只支持作者抛出观点和结论，但没有时间来论述这个结论或观点的推理过程，即只有 “是什么”，没有 “为什么”，而这又是验证观点是否合理的很重要的一环，同时也是能够延伸出很多其他话题的的重要过程，是锻炼思考能力的很重要的一个过程，如下图就是一个比较具体的过程</p><p><img data-src="https://wulc.me/imgs/ask_why_process.png" height="50%" width="50%"></p><p>而当我们长期在这种只追求一个简短精炼的结论的阅读中，造成的后果是我们不再关注观点是否有支撑，<strong>大部分人只关注观点是不是合自己的胃口，同时对于各类社会现象，更多以感性的情绪输出为主</strong></p><p>长期以往，你的知识体系会变得支离破碎，缺乏辩证思考能力，对于各类社会现象，更多以感性的情绪输出为主，久而久之，人就失去了识别真知的能力</p><ul><li><strong>空虚感</strong></li></ul><p>你是否会有过这种感觉，连续刷了几个小时的短视频后，会让人感觉特别空虚；与这种空虚相对反的，是用几个小时来专注做一件事情的充实感</p><p>这个<span class="exturl" data-url="aHR0cHM6Ly93d3cuemhpaHUuY29tL3F1ZXN0aW9uLzYyNDMyNTExNS9hbnN3ZXIvMzIzOTc2NDQ4OA==">回答<i class="fa fa-external-link-alt"></i></span>就提到了这个原因，即人觉得充实与否取决于<strong>人的意识是否和时间的流逝所匹配</strong></p><p>几个小时的短视频，起码得有几十个，但由于<u>短视频本身是毫无规律可言的，所以短期记忆里没有留下什么值得大脑分析的东西；留不下东西，自然没有可分析的结论；相当于花了好几个小时，但是大脑只有大致印象，所以你的意识认为和时间流逝不匹配</u></p><p>但如果在做同一件事，大脑就会不停地强化有关这件事的记忆，并且由于同一件事的普遍规律性较强，人会很快分析到一些结论，对于人的感受来说，就是记得做了什么，并且知道做了什么，也得到了一些经验，感觉就很充实</p><h2 id="我知道应该但真的做不到">我知道应该，但真的做不到？</h2><p>上面提到的短视频对人的危害的观点，其实早就在各种媒体上被广泛传播过，但效果就有点像烟盒上印着” 吸烟有害健康” 一样，被烟瘾者习惯性的忽视了。为什么我知道应该，但就是做不到？</p><p>除了上面提到的 “体制化” 现象中，需要通过这类有短期 “正反馈” 的行为应对无聊的工作带来的生命力的耗损外；在《问题不大》的<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY0ZWFmNjU0ODBjOWVjNGM1ZjYxYTI3NA==">这期播客<i class="fa fa-external-link-alt"></i></span>，就从心理学上分析了，报复性熬夜、持续刷短视频这种 “我知道应该，但真的做不到” 的现象的原因；播客内容很不错，推荐一听，这里就只摘录一些核心内容</p><p>在心理学的图式治疗中，认为人的体内有三类角色：<u>内在的小朋友，内在的父母，应对者</u></p><p>小朋友跟弗洛伊德的本我有点像，小朋友也有很多类型，比如说脆弱的，焦虑的，愤怒的（这其实也是人很多情绪的映射）；而最常见的是脆弱的小朋友，与脆弱的小朋友同时出现的往往还有一个惩罚性的，或者叫高标准的父母</p><p><u>脆弱的小朋友代表个体内心未被满足的情感需求</u>，通常与童年创伤（如被忽视、虐待、情感剥夺）相关。有点像一个受伤的、需要被保护的孩子，承载着<em>恐惧、孤独、羞耻</em>等原始情绪；脆弱的小朋友会在我们的内心发出这样的声音：“没有人会真正爱我”、“我永远不够好”、“我需要别人照顾我才能生存”</p><p><u>高标准的父母则是我们童年时期父母或重要他人的负面声音的具象化</u>，这里面有分为两种类型：惩罚性父母（PunitiveParent）：象征严厉的批评和道德压迫；要求性父母（DemandingParent）：象征过高的标准和不现实的期望；我们心里很多自我攻击的声音，其实就是高标准的父母说的：“你活该被惩罚”、“你必须完美”、“你真没用”、“你不配被爱”</p><p><u>应对者则是为了逃避 “内在小孩” 的痛苦或满足 “内在父母” 的要求，发展出的防御策略</u>；面对体内的矛盾，一般出现的应对者行为有三种：屈从（Surrender）、回避（Avoidance）、过度补偿（Overcompensation）</p><ul><li><strong>屈从型应对者</strong>：认同 “内在父母” 的批判，自我贬低（如：“我就是个失败者”）。行为上的表现被动接受虐待关系，不敢争取权益<br></li><li><strong>回避型应对者</strong>：<em>逃避触发痛苦的情境</em>（如拒绝亲密关系、用娱乐、忙碌来麻痹自己）。行为上的表现就是情感麻木、社交隔离<br></li><li><strong>过度补偿型应对者</strong>：用相反行为掩盖脆弱（如：通过控制他人对抗 “被抛弃” 的恐惧）。行为上的表现就是傲慢自大、过度竞争、讨好他人</li></ul><p>为什么明知应该早睡，却熬夜刷手机？套用上面内在角色，可以在内心演化出这么一出戏</p><p>（1）内在父母激活：“你必须早睡！熬夜会变丑变笨！”（严苛要求）<br>（2）内在小孩反抗：“工作一整天已经很累了，我就想放松！”（需求未被看见）“早睡计划失败过那么多次，我肯定做不到……”（恐惧失败）<br>（3）应对者行动：用刷手机转移对焦虑的注意力（回避）</p><p>此时回避型的冷漠应对者为了屏蔽掉这些感受声音，会采取一种麻痹的方式，即机械地刷短视频，但此刻已经不是为了开心才这么做，单纯就是回避那种心里面很焦虑的感觉：不想再听小孩和父母吵了，然后就会用刷短视频的方式麻痹自己（有多少人中枪了）</p><p><u>“我知道应该，但真的做不到” 的本质，是内在父母用恐惧驱动改变，而内在小孩用抗拒保护自我</u>，那我们能做些什么，来缓解这种矛盾，播客里提到方法可以总结为：识别出三类声音，然后引入一个健康的成年人角色，来疗愈内在小孩、修正内在父母，并做出循序改变</p><p><strong>第一步：识别三类角色的声音</strong></p><p>写下冲突时的内心对话，一般的模式是这样的</p><blockquote><p>内在父母：“你应该……”<br>内在小孩：“可是我害怕 / 累 / 不想……”<br>应对者：“算了，先玩会儿手机吧。”</p></blockquote><p><strong>第二步：引入一个健康的成年人角色，修正内在父母，疗愈内在小孩</strong></p><p>对内在父母，可以告诉他，你的做法是想个人过得更好，但也许你用这种非常苛责的口吻说话会适得其反。你可能会让脆弱的小朋友、焦虑的小朋友，他们都更不安，而他们的需求跟你的需求同样的重要，而当他们的需求没被满足时，可能个人也没能过得更好</p><p>对于内在的脆弱小孩，可以告诉 ta说你的这种需求是完全正当和合理的，你想要休息，你现在的日程表对任何人来说都是难以承受的，他就是会很累，就是你感到累，你想要休息这个需求我完全的认可、尊重和理解</p><p>但当我们表达对脆弱的小孩的理解和共情后，焦虑的小朋友可能在旁边就坐不住了，他可能会说 “你怎么能这样？你不会真的同意了吧？你不会真的让他休息一整天吧？那么考试就要通不过了？也学习不到新知识了”</p><p>那这个时候健康的成年人可以对焦虑的小孩这么说，我能够感觉到你现在很自责，虽然你已经做了这么多，但你好像觉得你还不够努力，你好像觉得你还可以做得更多。好像说休息一会就会让你觉得非常的自责，会让你觉得我怎么能这样，好像拉了很多的进度。<u>我能理解你现在感觉到的这些着急、紧张，甚至是有点自责，但我想告诉你，他们不是真的。不管发生什么，不管你是不是去学习，不管你是休息了，你这个考试通过还是没有通过，你将来成为一个什么样的人。我想告诉你，我永远爱你，我会永远支持你。我是一个成年人了，我可以保护好你了。哪怕有一天周围的人对你都很生气，你爸爸对你很生气，他会指责你，但是没有关系，因为我是一个健康的成年人，我有能力保护你，你要相信我有能力保护你</u></p><p><strong>第三步：设计 “微小行动” 替代应对策略</strong></p><p>将 “应该” 拆解为可操作的步骤：比如说，原目标：“每天健身 1 小时” →新目标：“每天做 5 个深蹲”；允许渐进改变</p><h1 id="自由">自由</h1><p>被无意义的工作束缚和折磨的打工人们，孜孜不倦地追求的一个目标，便是 “自由”：财富自由，时间自由，生活自由...</p><p>如果工作是罪魁祸首，引发了我们的种种情绪，消耗了我们的生命力，导致我们不得不通过 “低级趣味” 来获得正反馈，陷入这个死循环后，进而伴随着被 “体制化” 了</p><p>那是否不工作，就能够规避以上种种情绪及其衍生出来的问题；是否不工作，便能够自由？</p><h2 id="不上班就好了">不上班就好了？</h2><p>说实话，作为一个前二十多年努力读书，毕业后就勤勤恳恳的在大厂上班，也不敢gap 的做题家，并没体会过不上班的感觉</p><p>但是在一些时间比较长的节假日，在疯玩了几天后，会有一种很强烈的空虚感，一种如同前面提到的刷短视频一般的空虚感；不上班所给予的巨大的自由，在此刻似乎化身成摄魂怪，吸走一切，只剩下空虚和无聊</p><p>在《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY0OTdmZGE3M2ZiMWEwOTZjNDE0N2JhMg==">欲望可以有界，意义必然无穷<i class="fa fa-external-link-alt"></i></span>》，就讨论到了类似问题，大致就是每天睁眼起来不用上班很自由，但同时你要面临的是海量的选择，这些选择需要消耗的是你的大量的精力；并且人还是需要意义感，如果所做的事情没有太多意义感，你很快也会觉得无聊和枯竭，即使你一天什么也不做，或者在花了一天在玩游戏刷视频</p><p>后来看到了<span class="exturl" data-url="aHR0cHM6Ly93d3cuemhpaHUuY29tL3F1ZXN0aW9uLzY2NDI4OTI5My9hbnN3ZXIvMTUzNjE2NTEzNTU=">这个回答<i class="fa fa-external-link-alt"></i></span>，感觉很好地解释了这个现象，关键点总结起来就是：<strong>要有产出 (作品)，不能只看不做</strong></p><p>不上班，宅在家中，玩游戏、刷视频、想吃吃想睡睡，似乎是很多被上班折磨了很久的人的想象中的快乐；但吊诡之处在于，<u>人类没有任何一种娱乐经得起长时间纯输入而不让人感到厌倦</u>，比如说看小说、看动漫，只看完全不创作；或者玩游戏只玩，没有什么白金成就之类的游戏目标，没有写游评、写攻略的想法，纯玩，你很快就会腻（笔者对这一点可以说深有体会）</p><p>产出很重要，这里的产出，可以是你看完一部电影、一部动漫后，写的一小段的感悟和感受，可以是通关游戏后、录的视频发到B站（即使只有个位数的播放量），可以是去一段旅游后在小红书写下的一个体验或攻略。因为<u>产出会不断强化你 “在做一件有意义的事” 的认知，同时产出也是一种即时反馈，它极大的帮助人保持积极的心理状态和乐观的预期</u>；如果你隐居在你的小公寓里坚持写小说，可能到最后都没多少人看，但你一定会在写小说这件事上不断获得满足感。因为产出是一种价值锚定，是区别于 “爱好” 和 “随便玩玩” 的重要依据；产出某种程度上替代了工作给人带来价值感的部分，如果你干的足够好，也可以替代工资这部分</p><p>但<strong>产出不一定要变现，也不一定要别人的认可，甚至可能是对你以外的其他人都没啥意义</strong>（笔者写的很多文章就是如此）；最近比较喜欢听的一个播客栏目《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9wb2RjYXN0LzY3NjE2MzVhODQ0NDdiMWJkMDlkY2UwYg==">远行者与破冰匠<i class="fa fa-external-link-alt"></i></span>》，猫草老师说的一句话令笔者印象深刻，那就是 “创作给人第二次的生命”，无论是写作、录播客、做视频，都是创作；甚至养育一个小孩，也是创作。而其中的关键点，还是要有产出，有一个你能看得见摸得着的、经过你的构思和规划、未来能够被你重新看到并想起当时创作的过程的产出</p><p>或许其实这也是短视频与长视频的很大区别之一，短视频提炼不出有效的观点，但是长视频对人有启发的点在于，看完后能够提炼出一些观点（产出）</p><p>在《心理学博士怎么发疯？和李松蔚聊情绪：职场、东亚小孩、内耗、嫉妒和愤怒》这一期播客里提到，<u>快乐是紧张感的解除，需要有一个过程和转变</u>，如同前面提到的可乐是第一口才是快乐的，一直不用上班，没有压力的生活，也许只有前几个月，甚至是前几周才是快乐的；因为人的适应性还是非常强的，因为快乐和自由的日子也跟 “与善人居，如入兰芷之室，久而不闻其香，则与之化矣” 一样</p><p>回到标题，不上班就好了吗？看起来并不是，也许可以不上班，但是在不上班的日子里，还是得找到自己的主线，来替换原来被工作驱使着去走的那条路径；而在新的主线上，你需要有产出的、需要有一个 “实现自我价值” 的机会</p><h2 id="我们与自由的距离">我们与自由的距离</h2><p>在孟岩的这一期播客里《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY1ZGQ4MzkwMDBjYTE5YTYwMDI5MjQ1NA==">E33与自由的距离<i class="fa fa-external-link-alt"></i></span>》，提到一个笔者非常喜欢的观点：<strong>附在身上的东西越少，就越自由</strong></p><p>这些附着，也许是他人和社交媒体给自己的标签、也许是公司和社会给自己的角色、也许是当时咬咬牙买房而背上的贷款、也许是奄奄一息的病人插在身上的五颜六色的管子</p><p>我很喜欢苏格拉底的这个故事，他去了集市逛了一圈后发出的感叹是：“Howmany things there are in this world that I do notwant”。这是另一种形式的自由，是让尽量少的东西附着在自己身上的自由，毕竟，<strong>notwanting something is as good as having something</strong></p><p>除了身体疾病产生的病痛，其他的痛苦的确都是我们内心给予自己的，所以在保持身体健康，不轻易负债的前提下，其实个人是可以很自由的；keepyour identitysmall，不要给自己加太多标签，不要往自己身上挂太多东西，没有什么是必须要做的</p><p>那为什么社会生产力在大力发展，但好像现代人越来越不自由了？在韩炳哲的《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zMzQ0MjI1OS8=">倦怠社会<i class="fa fa-external-link-alt"></i></span>》里提到 “世界成了一座巨大的百货商店”</p><blockquote><p>在现代世界，一切神性和节日已不存在。世界成了一座百货商店。所谓的共享型经济 (Sharing-Ökonomie) 把我们每个人变成了售货员，期待着顾客的到来。</p><p>我们用越来越劣质的快消品填满世界，世界在商品中窒息。这座百货商店和疯人院并无本质区别。看上去我们似乎拥有了一切，我们却失去了最根本之物，即世界。世界丧失了语言和声音。在交流的喧哗声中，宁静消失了。商品的堆积和大众化填满了一切空白。</p><p>商品占据了天空和地面。商品化的世界不再适于居住，它失去了和上帝、神圣、奥秘、无限、崇高的联结。我们亦失去了惊奇的能力，生活在一座透明的百货商店里，成为透明的顾客，时刻受到监视和操控。</p><p>逃离这座百货商店成为当务之急。我们应当把商店改造成一个庆典场所，在其中生命才能获得应有的意义。</p></blockquote><p>当世界沦为百货商店时，商品逻辑已渗透到存在的每个毛孔。共享经济的 "分享" 表象下，实则是将人性转化为可交易的 "服务人格"—— 民宿房东必须时刻保持微笑待客，网约车司机需要五星好评来维系生存。这印证了福柯的 "自我规训" 理论：<u>我们主动将自我包装成商品，在数字评分体系下进行永无止境的自我优化</u></p><p>百货商店的 "透明性" 实为全景敞视监狱的升级版 —— 大数据算法比边沁的圆形监狱更高效地完成规训:抖音的推荐算法精准操控注意力，外卖平台的送餐时间量化压榨配送员。当一切皆可数据化度量，荷尔德林 "诗意栖居" 的世界彻底沦陷，连星空都成为文旅地产的营销噱头</p><p><strong>在这座全球化的百货商店里，我们既是囚徒又是看守</strong>；而这也许就是为什么社会生产力在大力发展，但我们却越来越不自由了</p><h2 id="人群与羊群">人群与羊群</h2><p>那难道逃离这座钢筋城市，逃离被消费主义构筑起来的现代社会，逃到 “瓦尔登湖” 去过梭罗一样的生活才算真正自由么</p><p>年轻时听歌的时候只爱听曲，但是随着年龄渐长，开始逐渐关注那些藏在词里的故事，最近在听陈奕迅的《<span class="exturl" data-url="aHR0cHM6Ly9iYWlrZS5iYWlkdS5jb20vaXRlbS8lRTQlQkIlQkIlRTYlODglOTElRTglQTElOEMvODQzMDQzOQ==">任我行<i class="fa fa-external-link-alt"></i></span>》，也许能够某种程度上回答上面这个问题</p><p>如同前面提到的笔者很喜欢的一个概念 “等价交换”，那自由的代价是什么？这个代价可能是孤独、恐惧甚至是死亡</p><p>少年时天真地认为 “神仙鱼困于鱼缸不自由”，于是将其放归大海，却导致其死亡，才发现 “原来神仙鱼横渡大海会断魂”—— 过度的自由可能带来毁灭性后果；而 “冒险半夜上山” 却因无人分享自由而感到 “没趣”，亦是说明了孤独是自由的副产品</p><blockquote><p>天真得只有你 令神仙鱼归天要怪谁<br>以为留在原地不够遨游 就让牠沙滩里戏水<br>那次得你冒险半夜上山 争拗中队友不想撑下去<br>那时其实尝尽真正自由 但又感到没趣</p></blockquote><p>年少时也许渴望 “缤纷乐园任我行”，但成年后逐渐意识到 “没有同伴不行”；因为到了某个年纪，会发现自己没有了当年冒险的魄力和勇气，会发现自由的代价自己似乎承担不起，会发现曾经迷途过，那滋味并不好受，所以才会 “怕追不上满街赶路人”，然后开始 “忌讳空山无人”、开始 “怕遥望星尘”</p><blockquote><p>从何时你也学会不要离群 从何时发觉没有同伴不行<br>从何时惋惜蝴蝶困于那桃源 飞多远有谁会对牠操心<br>曾迷途才怕追不上满街赶路人 无人理睬如何求生<br>从何时开始忌讳空山无人 从何时开始怕遥望星尘</p></blockquote><p>而自由，其实是可以存在于日常生活的微小选择中，可以存在于 “抱住两厅双套天空海阔任你行” 中，也可以存在于 “马路戏院商店天空海阔任你行” 中，而非必须与世俗彻底割，与社会告别才能得到</p><p>歌词最后的结尾，“顽童大了别再追问” 既是对天真的告别，也暗含一种释然：<strong>真正的自由或许不是脱离群体的 “赤地独行”，而是在群体中保持内心的独立</strong></p><blockquote><p>顽童大了别再追问<br>可以任我走怎么到头来又随著大队走<br>人群是那么像羊群</p></blockquote><h1 id="做一只清醒的羊">做一只清醒的羊</h1><p>当我们尝试剖开工作的茧房、爬出短视频的泥沼，试图寻找自由的蛛丝马迹，而推导出来的所有解法，似乎都指向 “内心” 这一话题；《任我行》里的那句 “人群是那么像羊群” 轻轻叩击真相 —— 或许真正的自由，恰在于清醒地成为羊群中的一只羊</p><p>那些在写字楼里疲于奔命的我们，在短视频中机械刷屏的我们，在深夜焦虑内耗的我们，何尝不是被生存驱赶的羊群？但正如林夕在歌词中埋藏的辩证 —— 少年时执意离群索居的 “顽童”，最终发现 “马路戏院商店天空海阔任你行” 才是更深刻的自由。这并非对现实的妥协，而是在群体性生存中，学会与自己的孤独和解</p><p>被规训的日常里，我们依然可以保留 “神仙鱼困于鱼缸” 般的天真：在会议纪要的夹缝写下诗行，在通勤地铁戴上耳机筑起精神堡垒，在OKR的间隙喂养流浪猫时触摸生命的柔软。这些微小选择，恰似歌词中 “赤地踏过雪花”，是羊群中独属于你的足迹</p><p>不必为 “随大队走” 感到羞耻。西西弗斯推石上山的宿命里，加缪也能看见抗争的尊严；我们日复一日的 “体制化” 生活中，同样能开出自由的花。当你学会在晨会汇报时藏进一句聂鲁达的诗，在周报 PPT 里偷偷画一只跃出表格的鲸鱼，在团建聚餐后独自走向深夜亮着灯的便利店 —— 那一刻，你既是羊群中的一员，也是自己精神王国的君主</p><p>人群如羊群，但总有些羊在低头吃草时，眼睛始终望向远方的雪山</p><hr><p>本文的一些参考材料</p><ul><li>《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY3YjIxMTRjMDVhOTBkZmQwZGRkN2E1NQ==">每个人都有至暗时刻，其实你并非孤独<i class="fa fa-external-link-alt"></i></span>》<br></li><li>《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY3YjQ3Y2FlMDVhOTBkZmQwZDRjNjQ2Mg==">职场心累真相：90% 的疲惫和焦虑都来自这 3 种隐形内耗<i class="fa fa-external-link-alt"></i></span>》<br></li><li>《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY3NmMwMGU4MWU4MjNlNzJkM2I5ZTExYw==">心理学博士怎么发疯？和李松蔚聊情绪：职场、东亚小孩、内耗、嫉妒和愤怒<i class="fa fa-external-link-alt"></i></span>》<br></li><li>《<span class="exturl" data-url="aHR0cHM6Ly93ZXJlYWQucXEuY29tL3dlYi9ib29rRGV0YWlsLzE5MzMyZmIwNzFhMjcyNzUxOTM0NzFh">2018 年 4 月 1 日<i class="fa fa-external-link-alt"></i></span>》<br></li><li><span class="exturl" data-url="aHR0cHM6Ly93d3cuemhpaHUuY29tL3F1ZXN0aW9uLzQzNjA3MDg3L2Fuc3dlci8yNjkzNjU1Mzc5">人是怎么废掉的？<i class="fa fa-external-link-alt"></i></span><br></li><li><span class="exturl" data-url="aHR0cHM6Ly93d3cuYmlsaWJpbGkuY29tL3ZpZGVvL0JWMWN2NDExYjdLQQ==">“抽 卡？整 这个 没 用”<i class="fa fa-external-link-alt"></i></span><br></li><li><span class="exturl" data-url="aHR0cHM6Ly93d3cuemhpaHUuY29tL3F1ZXN0aW9uLzY1NTE0NTY0MC9hbnN3ZXIvMzUwMzQ4NTAxNA==">每天大部分时间都用于刷剧短视频，人容易满足于这种 “奶头热”，长此以往是否会影响人的智商，反应能力呢？<i class="fa fa-external-link-alt"></i></span><br></li><li><span class="exturl" data-url="aHR0cHM6Ly93d3cuemhpaHUuY29tL3F1ZXN0aW9uLzYyNDMyNTExNS9hbnN3ZXIvMzIzOTc2NDQ4OA==">连续几个小时时间用来刷短视频会让人感觉空虚，用来专注做一件事情会让人感觉充实。这种差别的感觉从何而来？<i class="fa fa-external-link-alt"></i></span><br></li><li><span class="exturl" data-url="aHR0cHM6Ly93d3cuemhpaHUuY29tL3F1ZXN0aW9uLzQxODgzMDc5MS9hbnN3ZXIvMjM5ODI3MzY1MQ==">为什么都说碎片化信息无用，我却感觉刷手机也可以学到很多东西？<i class="fa fa-external-link-alt"></i></span><br></li><li>《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY0ZWFmNjU0ODBjOWVjNGM1ZjYxYTI3NA==">我知道我应该，但我真的不想<i class="fa fa-external-link-alt"></i></span>》<br></li><li>《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9wb2RjYXN0LzY3NjE2MzVhODQ0NDdiMWJkMDlkY2UwYg==">远行者与破冰匠<i class="fa fa-external-link-alt"></i></span>》<br></li><li>《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY1ZGQ4MzkwMDBjYTE5YTYwMDI5MjQ1NA==">与自由的距离<i class="fa fa-external-link-alt"></i></span>》<br></li><li>《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zMzQ0MjI1OS8=">倦怠社会<i class="fa fa-external-link-alt"></i></span>》<br></li><li>《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY0OTdmZGE3M2ZiMWEwOTZjNDE0N2JhMg==">欲望可以有界，意义必然无穷<i class="fa fa-external-link-alt"></i></span>》<br></li><li><span class="exturl" data-url="aHR0cHM6Ly93d3cuemhpaHUuY29tL3F1ZXN0aW9uLzY2NDI4OTI5My9hbnN3ZXIvMTUzNjE2NTEzNTU=">没有经济压力、不婚不育不工作、每天睡到自然醒、爱干啥干啥，这样的人会烂掉吗？<i class="fa fa-external-link-alt"></i></span><br></li><li><span class="exturl" data-url="aHR0cHM6Ly93d3cuYmlsaWJpbGkuY29tL3ZpZGVvL0JWMVZNNDExaTdTby8/c2hhcmVfc291cmNlPWNvcHlfd2ViJnZkX3NvdXJjZT03YjcwZTBhOThkODFhYmE4YjVlMjkzYTczMjRjM2UyYQ==">任我行为什么能唱哭陈奕迅？<i class="fa fa-external-link-alt"></i></span></li></ul>]]></content>
    
    
    <summary type="html">&lt;p&gt;最近一段时间很忙，忙到整个大脑带宽被打满、回到出租屋只想躺平放空，或是忍不住无意义的刷短视频；忙到觉得自己工种变了（变成了一个消防员，天天在救火）；忙到甚至没有没时间去做更长期规划；能明显感觉到自己的词汇量、语义精度、表达能力和表达欲在迅速下降，同时自我对知识、对他人、对世界的好奇心和热情，似乎正在被浇灭。人身处其中的时候也许并不觉得有什么大碍，因为已经被 “体制化” 了，但一旦有更长的空闲时间，开始做 “上帝会发笑” 的行为，就能愈发感觉到了这种状态的恐怖之处，我觉得可能是时候给自己做个诊断了，于是有了这篇文章&lt;/p&gt;
&lt;p&gt;本文主要是对最近一些经历和疑惑的碎碎念，以及试图求得其中的破解之法；涉及工作、情绪、短视频、以及自由的追求，文章极度发散，内容极度主观，就是一个情绪出口和以及写给自己的心理按摩，如果你愿意看，那祝开卷有益～&lt;/p&gt;</summary>
    
    
    
    <category term="闲话几句" scheme="https://wulc.me/categories/%E9%97%B2%E8%AF%9D%E5%87%A0%E5%8F%A5/"/>
    
    
    <category term="闲话几句" scheme="https://wulc.me/tags/%E9%97%B2%E8%AF%9D%E5%87%A0%E5%8F%A5/"/>
    
  </entry>
  
  <entry>
    <title>一起这种艺术</title>
    <link href="https://wulc.me/2025/03/12/%E4%B8%80%E8%B5%B7%E8%BF%99%E7%A7%8D%E8%89%BA%E6%9C%AF/"/>
    <id>https://wulc.me/2025/03/12/%E4%B8%80%E8%B5%B7%E8%BF%99%E7%A7%8D%E8%89%BA%E6%9C%AF/</id>
    <published>2025-03-12T07:52:27.000Z</published>
    <updated>2026-02-28T05:01:22.818Z</updated>
    
    <content type="html"><![CDATA[<p>文章的源起，是在深入了解听过 n次但选择性忽略了歌词里所诉说的故事的《<span class="exturl" data-url="aHR0cHM6Ly9iYWlrZS5iYWlkdS5jb20vaXRlbS8lRTglQkYlOUMlRTUlOUMlQTglRTUlOTIlQUIlRTUlQjAlQkEvODI3MDkyOQ==">远在咫尺<i class="fa fa-external-link-alt"></i></span>》后，对最后那句 “一起这种艺术，若果只是漫长忍让，应感激终身的伴侣”颇有感触，把储藏在脑子里的很多零散的观点拽出来了，只是这些观点现在也是凌乱不堪，所以尝试通过这篇文章来connect the dots</p><p>本文尝试对 “爱情” 这一命题展开一些探讨，涵盖 “心动” 的源起、人来人往的 “投射与认同” 游戏、已经是标品的相亲流程、以及 “一起” 的这种艺术，内容依旧是随心所欲的发散，祝开卷有益～</p><span id="more"></span><h2 id="心动还是冲动">心动还是冲动</h2><p>当我们谈论 “心动”，脑海中刻板浮现的出来的往往是月色下的凝望、指尖不经意的触碰，或是灵魂共振的刹那。然而，心理学却揭示了一个看似 “煞风景” 却无比真实的真相：许多被我们奉为圭臬的 “心动” 瞬间，其根源可能仅仅是一场美丽的误会：“<span class="exturl" data-url="aHR0cHM6Ly9iYWlrZS5iYWlkdS5jb20vaXRlbS8lRTUlOTAlOEElRTYlQTElQTUlRTYlOTUlODglRTUlQkElOTQ=">吊桥效应<i class="fa fa-external-link-alt"></i></span>”（SuspensionBridge Effect）</p><p>想象你正身处一座高悬峡谷、随风摇晃的吊桥之上。脚下是深渊，耳边是呼啸的风声，心脏在胸腔里狂跳，手心渗出冷汗，呼吸也变得急促。此刻，生理上强烈的唤醒感（Arousal）—— 心跳加速、肾上腺素飙升、神经高度紧张 —— 正席卷你的全身。如果此刻桥的另一端走来一位陌生人，你望向 TA 的眼神，很可能被自己解读为 “一见钟情” 的火花。吊桥效应的核心在于：<u>你将因环境危险而产生的强烈生理反应（恐惧、紧张、兴奋），错误地归因于了对眼前人的 “爱慕” 之情</u></p><p>这并非臆测，而是根植于心理学的 “情绪双因素理论”（Two-Factor Theory ofEmotion）</p><blockquote><p><strong>情绪体验 = 生理唤醒 + 认知标签</strong><br>当个体经历不明原因的生理唤醒，如心跳加速、手心出汗、呼吸急促等，会本能地扫描环境，寻找一个合理的解释来 “贴标签”。如果此时环境中恰好存在一个潜在的 “情绪对象”，比如一位有魅力的异性，大脑便可能 “顺手” 将这阵生理风暴标记为 “心动”、“爱慕” 或 “性吸引”</p></blockquote><p>这解释了为什么很多人会在冒险、旅行、极限运动中更容易产生感情，也是很多 “恋爱教程” 中，提示在约会场景选择一些适度刺激的活动，如过山车、密室逃脱、夜游等，可能更容易激发彼此的好感背后的原理</p><p>攀登险峰后的精疲力竭与成就感、异国他乡的陌生与兴奋、长途跋涉的相互扶持... 这些环境往往都伴随着显著的生理唤醒。当两人共享这些高唤醒时刻时，彼此的存在便成了解释这份激动最 “合理” 的标签，情愫由此滋生；这也是为什么共同经历挑战（如完成艰难的徒步、参与惊险的漂流）的同伴更容易擦出火花。而看恐怖片、坐过山车、玩密室逃脱、夜探 “鬼屋” 或在氛围独特的酒吧小酌，正是在人为制造可控的生理唤醒环境，利用吊桥效应增加对方将这种 “刺激感” 与你本人关联起来的概率</p><p>吊桥效应告诉我们：<strong>人类即时的情感判断极易受到当下生理状态和环境的裹挟</strong>。在特定情境（刺激的冒险、浪漫的旅途、迷离的夜色）下产生的 “心动”，一旦脱离那个特定的 “场”，回归到日常的、平淡的语境中，那份被误读的激情可能如潮水般退去，露出底下真实的沙滩：可能是一片空白，也可能只是普通的友情或好感</p><p>进一步来看，吊桥效应所揭示的误读机制，不过是庞大 “爱情化学反应” 交响乐中的一个音符。从冷冰冰的科学视角看，爱情或许只是一场索然无趣却无比精妙的生物化学反应。现代神经科学告诉我们，爱情本质上是一场由多巴胺（愉悦与渴望）、苯乙胺（兴奋与眩晕）、去甲肾上腺素（心跳加速）、催产素（依恋与信任）、血清素（情绪调节）等多种神经递质和激素精密配合、此起彼伏演奏的交响曲。当外界刺激（如吊桥的惊险、伴侣的出现）以特定的方式触发了大脑中相应的奖赏回路和情感中枢，这套复杂的生化程序便被激活，我们称之为 “坠入爱河”</p><p>这不由得让人想起钱钟书在《围城》中借方鸿渐之口发出的冷峻调侃：“世间哪有恋爱？压根儿是生殖冲动。”彼时的方渐鸿正在读叔本华，而这句话的思想源头其实也可以追溯至叔本华原来的论断：<u>“所有两情相悦的情愫，不管表现得多么缠绵悱恻，都根源于性欲本能。”</u>吊桥效应在一定程度上为这种 “祛魅” 观点提供了现代心理学的注脚 —— 浪漫心动的火花，可能只是生理唤醒被错误地贴上了 “爱情” 的标签，而性吸引往往是这种误读最直接的出口</p><h2 id="人来人往终无果落花流水有温存">人来人往终无果，落花流水有温存</h2><h3 id="人来人往的投射游戏">人来人往的 “投射游戏”</h3><p>心动是容易的。哪怕没有吊桥效应，一个惊艳的回眸、一条 “今天第 xxx个心动女生” 的弹幕，甚至一丝朦胧的好感，都可能点燃火花。让两人靠近并不难，难的是此后的相知、相处与相守</p><p>情感初探期，双方往往会因为不熟悉带来的相当程度上的保留与节制，而小心翼翼地开放自己的私人领域，同时也好奇地探索对方。他们<strong>修饰着自己也美化着对方</strong>，同时因为相互接触与了解的程度不深，也可以较少地受到对方自身特质的干扰，迅速地把自己的早期理想的客体形象，投射到对方身上；而对方为维系这份甜蜜，也迅速戴上相应面具，扮演起恋人理想的角色</p><p><u>这是亲密关系最甜蜜的阶段，因为此时双方还没有很深的联结，还在憧憬自己构想的理想亲密关系中，还不被真正在一起之后各种鸡毛蒜皮的琐事所困扰。此刻的恋人就像是两个小孩子，围着一个神秘的果酱罐，一点一点地尝它，看看里面有多少甜</u>。然而，爱情并不只是甜的，当那个果酱罐被一点点地打开之后，当罐盖彻底揭开，它的神秘感与新鲜感都将消失，那时呈现在眼前的或许只是一只平凡无奇的小罐头，留给你的或许只有一地的鸡毛以及脏兮兮的双手，并不同于最初的想象，甚至，会让你失望</p><p>随着交往的加深，双方被压抑的真实自我在呼唤得到释放，他们无法再去扮演一个理想的恋人，而更想去做一个真实的恋人。因为持续扮演理想角色，如同穿着不合脚的水晶鞋跳舞，心力交瘁。那场支撑甜蜜的 “投射 — 认同” 双人舞，注定无法长久</p><p>但这也是亲密关系的真谛。人们之所以想组建亲密关系，之所以想爱与被爱，就是想获得一种亲密感：<strong>亲密感意味着需要把自我最深处的部分向他人也向自己呈现，卸除掉层层的伪装与防护，建立起真我与真我之间的连接感</strong>。在这个过程中，双方的信任感、依恋感开始建立，沟通的深度和广度也有所发展，开始牵涉到较深的情感卷入。<u>这是心与心之间相知的契机，但同时也是一场充满风险的赌博</u></p><p>每个人在 TA的成长多多少少都会经历一些伤痛，正因为这些伤痛的存在，所以人们发展出了保护层和种种防御机制，以守护脆弱的内核。在这场充满风险的赌博中，当恋人鼓起勇气跟对方坦露自己的经历、一层层地剥落掉自己充满防御机制的外壳时，也是在将自己的伤痛展示给对方看，这是痛苦的，必定会像剥洋葱皮一样，一边剥落一边掉泪</p><p>如果对方的反应是积极的、接纳的，那么恋人即便落泪痛苦，也会因为感受到情感上的陪伴与支持，而坚定地一层层剥落掉那些保护壳，直到露出完整的内核。倘若双方都能如此坦然地接纳对方，那么爱情就会发展到稳定交往阶段，琴瑟和鸣，风雨同舟</p><p>但很多时候，<strong>受限于自己的狭隘、缺陷，以及种种未处理完的情结，人们渴望亲密，又害怕亲密，宁愿相信坦露真实的自我只会招致他人的批判、拒绝和抛弃，也很难相信有人肯接纳自己内在的真实。于是，在关系发展到一定程度时，就会退缩、害怕、扮演角色，在操纵与受控之间游走，生出嫉妒与厌恶、逃离与背叛之心，将关系场演变成游乐场，上演出种种的闹剧与幻想</strong></p><p>写到这里，不禁想起陈奕迅的《<span class="exturl" data-url="aHR0cHM6Ly9iYWlrZS5iYWlkdS5jb20vaXRlbS8lRTQlQkElQkElRTYlOUQlQTUlRTQlQkElQkElRTUlQkUlODAvMjgwMzY1OA==">人来人往<i class="fa fa-external-link-alt"></i></span>》，这首唱尽了这城市里来来往往的爱情真相的歌曲，多少所谓的爱情，不过是贪恋那初遇时眉梢眼底的几分新奇。当那层薄薄的新鲜感如霓虹灯影般悄然褪色，所谓情愫便骤然失了支撑，只留下片片碎裂的虚空</p><p>歌中所唱 “感激车站里，尚有月台能让我们满足到落泪”，我们在人生经历中会上一列又一列的车厢，但每次停留的月台都象征着相遇的可能性和一个暂时停靠的港湾。此刻的朦胧为 “投射” 提供了完美画布 —— 恋人们将内心 “理想客体” 的幻影，浓墨重彩地投射于对方；对方为抓住心动，也迅速认同角色，戴上面具共舞于幻影之中。月台灯光柔和，果酱罐光泽诱人，满足感充盈如幻梦，尚未沾染现实尘埃</p><p>但 “爱若难以放进手里，何不将这双手放进心里” 却也早已预言了这游戏的脆弱。紧握虚妄的手，终将触到现实的棱角。当果酱罐见底，投射光环消散，被修饰的棱角显露，“真实自我” 的呼唤无法再被压抑。持续扮演，心力交瘁。这 “投射 — 认同” 游戏的能量本质是耗竭的，无法为真实关系提供永续动力</p><p><u>“闭起双眼你最挂念谁，眼睛睁开身边竟是谁”</u>，看似追问旧爱新欢的歌词，却精准刺穿了亲密关系初期那场盛大而脆弱的 “投射与认同” 游戏的核心 —— 我们闭眼挂念的，往往并非眼前真实之人，而是自身投射其上、精心雕琢的幻影；睁眼所见身边之人，与闭眼挂念的、由自我投射并经由对方扮演共同构筑的幻影，判若云泥。这巨大的落差，正是 “人来人往” 最直接的原因。许多人，在这幻灭的废墟前，选择了歌词中的结局：“拥不拥有也会记住谁，快不快乐留在身体里”，然后转身，再次投入人潮，寻找下一个可供投射的 “月台” 和愿意扮演新角色的 “演员”，重复那短暂而注定幻灭的投射游戏。这循环，正是<strong>人来人往最本质的写照：投射、扮演、幻灭、离场、再投射……</strong></p><h3 id="落花深处的温柔共振">落花深处的 “温柔共振”</h3><p>人来人往的欲望都市里，发生着无数始终停留在 “投射与认同” 的浅层游戏、从未真正启程前往那个需要勇气与坦诚才能抵达的 “真我相遇” 之地的故事。月台永远拥挤，果酱罐永远吸引着新的 “演员” 和 “导演”。许多人或许终其一生，都在不同的月台张望，在不同的罐子前浅尝辄止，或许 “记住” 了许多人，留下了许多 “快不快乐” 的瞬间碎片，却唯独缺席了那唯一值得风雨同舟的旅程 —— 两个真实灵魂的相遇与共生</p><p>然而，在这看似宿命般的 “人来人往” 循环与 “投射游戏” 的幻灭中，却也存在着歌曲末尾那 “<u>最美丽长发未留在我手，我也开心饮过酒</u>” 的洒脱。即使最终的结局看起来不是世俗意义上的美好，但至少也经历过，开心过，而不是像顾城的《避免》里那种习得性无助般的无力感</p><blockquote><p>你不愿意种花<br>你说：<br>“我不愿看见它<br>一点点凋落”<br>是的<br>为了避免结束<br>你避免了一切开始</p></blockquote><p>避免了一切的开始，也避免了一切的体验，如同《人间失格》文字透出来的遗憾一般：<u>“若能避开猛烈的狂喜，自然不会有悲痛来袭。我试着去绕开所有的悲痛，但同时也是失去了所有的欢喜”</u></p><p>陈奕迅的另一首歌《<span class="exturl" data-url="aHR0cHM6Ly9iYWlrZS5iYWlkdS5jb20vaXRlbS8lRTglOTAlQkQlRTglOEElQjElRTYlQjUlODElRTYlQjAlQjQvMzUwOTU2MA==">落花流水<i class="fa fa-external-link-alt"></i></span>》，仿佛就是《人来人往》的续集一样，为我们提供了另一种温柔而深刻的视角：过程也许比较比结果更重要。纵然两人的经历就如同落花和流水一样：最后 “水点蒸发变做白云花瓣飘落下游生根”，纵然两人最终也只是 “淡淡交会过，各不留下印”，但是 “这趟旅行若算开心，亦是无负这一生”，但是双方也 “经历过最温柔共振”，也许这也就足够了</p><p>这 “最温柔的共振”，恰恰可能发生在 “投射游戏” 的幕布偶尔被掀开一角的瞬间 —— 当双方在扮演的间隙，或因疲惫卸下心防，或因某个不经意的触动，短暂地、意外地瞥见了对方那未被修饰、未被投射覆盖的、真实的脆弱或光芒。即使这真实如惊鸿一瞥，即使它无法支撑两人走向长久的共生，但它确确实实发生过。这份 “共振”，不再是基于幻影的投射与认同，而是两个真实存在的灵魂，在生命长河的某一段交汇处，产生了片刻的、深刻的、无需扮演的共鸣与理解</p><p>这种共振，<u>或许是在一次深夜的倾谈中，当其中一人鼓起勇气袒露了某个深藏的伤痛，对方并非出于扮演 “理想恋人” 的责任感，而是发自本能地流露出心疼与理解，那一刻的静默与凝视，便是 “最温柔共振”；又或许是在共同面对一个突如其来的困境时，双方暂时抛开了精心维护的角色，以最本能的、甚至有些笨拙的方式相互扶持，那一刻的默契与依靠，便是 “最温柔共振”；又或许，仅仅是在某个平凡无奇的午后，两人都放下了 “应该怎样” 的期待，疲惫地、真实地 “存在” 在对方面前，没有修饰，没有投射，却意外地感到一种奇异的、平静的接纳感，那一刻的松弛与自在，亦是 “最温柔共振”</u></p><p>即使一段关系最终未能逃脱 “人来人往” 的循环，即使那初期的投射游戏终告幻灭，只要其中曾有过哪怕一瞬这样的 “最温柔共振”—— 那份剥落了伪装、超越了角色扮演、触及了彼此真实内核的深刻触碰。这段旅程便不再是徒劳或虚无的，它已然成为生命长河中一枚独特的印记，一次珍贵的体验。在层层投射与防御之下，真实自我的触碰与共鸣是可能的，哪怕它短暂如烟火。这份体验本身，或许也足以对抗 “人来人往” 的虚无感，它提醒着我们，爱情的珍贵，不仅在于最终是否 “拥有”，更在于那 “交会时互放的光亮” 中，是否曾照亮过彼此灵魂深处真实的角落</p><p>所以，在 “人来人往” 的月台上，在投射游戏不断上演又落幕的剧场里，或许我们不必执着于强行留住注定风化的 “前身”（投射的幻影），而是学着珍惜那如流水般清澈、如落花般偶然却美丽的 “交会”，珍视那曾发生过的、短暂却真实的 “最温柔共振”</p><h2 id="相亲婚姻与彩礼">相亲、婚姻与彩礼</h2><p>虽然人来人往的投射与认同游戏略有遗憾，但是也经历过最温柔的共振。但有过一段或弥足珍贵、或意难平，甚至是狗血荒诞的体验，在没对人造成实质性不可逆伤害的时候，不也是一段难忘的体验么。而人生，不就是由这样的一段段体验构筑而成的么</p><p>现实是并非所有人都有机会或勇气踏上这场 “投射与认同” 的勇敢者游戏，哪怕它短暂且充满幻灭的风险。当青春的潮水退去，而适婚年龄的礁石显露，更庞大的人群被推搡着涌向另一个截然不同的场域：相亲市场。《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY3YWYwNTg5MDVhOTBkZmQwZDc1OWMxNw==">欲望都市 1：爱情并非必须，但人类还是很好玩的<i class="fa fa-external-link-alt"></i></span>》里，猫草老师就针对相亲这个问题给了一个 “暴论”：<strong>相亲是一场有标准化流程的简历互筛，浪漫爱并非题中应有之义</strong></p><p>在相亲市场中，不再是朦胧月台与神秘果酱罐的浪漫想象，而是明码标价、寻求最大公约数的现实交易所：身高、学历、户口、收入，这些硬指标被置于聚光灯下，成为衡量 “匹配度” 的核心砝码。因为往往对于走到相亲这一步的恋人，<u>最有诚意的做法，是把大家的都关注的最大公约数（身高，学历，户口，收入）拿出来相互对比和匹配</u>，这是一种非常标准化的流程，而浪漫爱并非这种标准化流程中的应有之义，更像是锦上添花的、难以量化的附加项</p><p>在这里，“闭起双眼你最挂念谁” 的追问是显得那么的不合时宜，“眼睛睁开身边竟是谁” 的答案，往往直接指向一份经过精密计算的、条件适配的清单。校园恋情的非标性可能（哪怕基于投射），在此被高效、务实的 “标准化匹配” 所取代，校园关系里的双方是有可能因为爱情在一块的，但相亲不是</p><p>步入婚姻的门槛，则让这份现实感更为沉重，甚至处处透露出一种时代的 “拧巴”。从纯粹的经济理性看，对当代男女而言，婚姻的必要性正急剧下降，双方都有养活自己的能力，在经济上，其实不太需要婚姻来获得一张饭票的机会，甚至结婚在某种程度上会拉低双方生活水平：住房、育儿、责任捆绑，每一项都可能成为压垮骆驼的稻草。</p><p>然而，许多人依然觉得自己 “需要” 婚姻。这 “需要” 的源头复杂而矛盾：<u>或许是社会时钟滴答作响的规训，将 “成家” 刻入人生里程碑的焦虑；或许是深夜归家时一盏灯的温暖想象，驱散原子化社会冰冷的孤独；更深层地，是存在于人本身无法消解的那种孤独感</u></p><p>是的，人是孤独的。<strong>人与外物、社会乃至世界本质的分离，制造出一种令人窒息的 “监禁感”，迫使个体拼命寻求与他人深度的、制度化的连接（如婚姻）。但讽刺的是，这种源于孤独的连接渴望，却常常将爱情的重心异化为 “体验被爱”（寻求安全港、避风港），而非更主动、更具风险也更滋养灵魂的 “体验爱”（付出、理解、共振）。于是，婚姻的期待与现实的落差，不断酿制出失望与矛盾</strong></p><p>这种拧巴的破解之道，或许在于我们还是要清醒地意识到自己在玩一个什么样的游戏，需要付出什么样的代价。选择 “标准化匹配”（相亲）路径的人，需要想清楚婚姻这份契约 “暗中标好的价格”，这个价格，也许是周末再也没有自己时间的 “不自由”，也许是责任驱动下为自己背上各种压力，也许是无数次无可奈何的妥协、以及可能的利益捆绑或牺牲，我们都需要问清楚自己，是否真心愿意做这场 “等价” 交换？而对于内心仍有悸动、渴望更深刻连接的人，则需要穿透社会给予我们的噪声和规训，想清楚自己真正渴求的体验是什么，而非社会时钟或他人眼光所定义的 “需要”</p><p>而当恋人双方终于鼓足勇气步入这场名为 “婚姻” 的游戏时，横亘在前的往往是那张沉重的 “入门券”：彩礼。网络上的喧嚣与对立，常将其简化为 “态度” 的象征。然而，更残酷的现实是，真正需要 “天价” 彩礼的家庭，往往并非索要虚无的诚意，而是实实在在地需要这笔钱来改善困顿的生活（如为家中兄弟支付婚房首付、偿还债务等）。吊诡的是，能匹配这类需求的结婚对象，自身的经济能力往往难以负担这天价数字。世界的割裂在此赤裸呈现：一边是生存的刚性需求，一边是难以企及的门槛。<strong>网络空间激烈的性别对立与虚空对骂，正是这种深层次社会结构矛盾与经济断层在婚恋领域的扭曲映射与情绪宣泄</strong></p><p>最终，当我们审视这个时代，“爱” 与 “婚姻”，无论是基于投射幻影的勇敢游戏，还是基于现实考量的理性匹配，亦或是跨越经济鸿沟的制度结合，对绝大多数疲于奔命的年轻人而言，都显露着 “<strong>奢侈</strong>” 这两个字。在保守、收缩、低欲望的社会氛围下，在充满不确定性的经济环境中，生存与发展的压力已倾轧了太多空间。追求精神契合的 “爱”，需要充沛的精力、无畏的勇气和一定的经济底气；而承担 “婚姻” 的责任与成本，更是需要坚实的物质基础与强大的心理韧性。<strong>当点亮生活地图（工作、学习、看世界）已耗费了大部分心力与资源，当 “救公主”（建立深度亲密关系、步入婚姻）的成本高昂到令人却步，许多人只能无奈地选择延迟、观望，甚至放弃</strong></p><h2 id="一起这种艺术">一起这种艺术</h2><p>相爱是容易的，甚至步入婚姻的殿堂也不难，难的是在一起后面对生活的风刀霜剑严相逼。因为相爱或许源于刹那的激情与投射的幻梦，步入婚姻殿堂也可能基于现实的匹配或冲动的勇气，但难的，是在日复一日的柴米油盐、在生活给予的责任和压力之下，如何维系那份连接，如何让 “在一起” 不至于沦为一种麻木的忍受或遥远的观望</p><h3 id="红玫瑰与白玫瑰">红玫瑰与白玫瑰</h3><p>《<span class="exturl" data-url="aHR0cHM6Ly9iYWlrZS5iYWlkdS5jb20vaXRlbS8lRTglQkYlOUMlRTUlOUMlQTglRTUlOTIlQUIlRTUlQjAlQkEvODI3MDkyOQ==">远在咫尺<i class="fa fa-external-link-alt"></i></span>》以一个婚后男人的内心独白，跟我们重新诉说了一遍红玫瑰与白玫瑰的故事</p><p>当婚姻的蜜月期过去，当双方的新鲜感消失，当最初的吃喝玩乐变成了鸡毛蒜皮的日常小事，当浪漫的想象撞上现实的礁石，“一起” 的考验才真正开始。而这也正应对着前面提到的果酱罐被挖空见底、“投射与认同游戏” 无法再继续持续下去的时刻</p><blockquote><p>很短暂狂热留下得一杯冷水<br>认定是可歌可泣的一双一对<br>长时期吃喝玩乐新鲜感减退</p></blockquote><p>无论是恋爱还是婚姻，红玫瑰与白玫瑰、蚊子血与朱砂痣、白月光与饭黏子，都是一个永恒的困境，因为<strong>人这种动物特别擅长美化自己所不曾选择的那条道路</strong>。用张爱玲在《<span class="exturl" data-url="aHR0cHM6Ly9iYWlrZS5iYWlkdS5jb20vaXRlbS8lRTclQkElQTIlRTclOEUlQUIlRTclOTElQjAlRTQlQjglOEUlRTclOTklQkQlRTclOEUlQUIlRTclOTElQjAvOTUz">红玫瑰与白玫瑰<i class="fa fa-external-link-alt"></i></span>》那句脍炙人口的话是这么说的</p><blockquote><p>也许每一个男子都有过这样的两个女人，至少两个。娶了红玫瑰，久而久之，红的变了墙上的一抹蚊子血，白的还是 “床前明月光”；娶了白玫瑰，白的便是衣服上沾的一粒饭黏子，红的却是心口上一颗朱砂痣</p></blockquote><p>即使已与一人缔结婚约，心中仍可能为 “未得到” 或 “已失去” 的她预留空间，每个对婚姻失望的夜深人静的夜晚，也许都会在想 “贪恋她抛弃你，是否当初想法不对”，但也会转念想无论最后选择谁，可能都会有同样的问题。歌词道尽了人性的不知足与对 “未选择之路” 的永恒幻想，如果再来一次换成那条没走过的道路，如果跟那个曾经没能在一起的 “白月光” 或 “朱砂痣” 共同一起生活，是否还是 “同样会记挂她，身于咫尺心于千里”，这 “<strong>身于咫尺，心于千里</strong>” 的疏离感，是许多婚姻中无声的暗流：物理空间的 “在一起”，远不等于心灵的同在</p><blockquote><p>还是最尾我选择谁，同样背上这焦虑<br>同谐白首会是谁，这决定一边狠心一边又后悔<br>假使你是情侣 假使你共同一起生活里<br>同样会记挂她身于咫尺心于千里不可抑压像潮水</p><p>得不到多么好<br>当得到不知怎算好<br>奢侈的一声天荒地老<br>如何能抵挡当中诱惑 谁更好</p></blockquote><p>“最爱” 的人在哪里？人终其一生，情感需求复杂多变，“最爱” 可能并非唯一。在不断的 “闹情绪” 与 “依偎” 的循环中，在 “数伴侣像流水” 的迷惘里，个体对自身身份和情感归属的游离感暴露无遗。活了一生都不知道 “最爱” 是谁，或许才是许多人的真实写照</p><blockquote><p>一起会闹情绪 分开了为何依偎生命里<br>谁是我最爱的应该一个 应该三个 应该数到像流水<br>数数到尽头终此一生之旅 尚有几多新伴侣</p></blockquote><p>《远在咫尺》某种程度上，展示了 “投射游戏” 彻底落幕、新鲜感完全消散后，婚姻生活可能陷入的僵局、疏离与精神游离。它无情地撕开了 “从此幸福快乐” 的童话面纱，暴露出 “一起” 的复杂、艰难与人性固有的矛盾</p><p>那么，“一起” 是否注定走向这种无奈的疏离或永恒的遗憾？弗洛姆在《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zMDI2ODc5Lw==">爱的艺术<i class="fa fa-external-link-alt"></i></span>》中给出了否定的答案，并点明了症结与出路：我们错误地理解了 “爱”</p><h3 id="爱是一门艺术">爱是一门艺术</h3><p>归根结底，相爱容易，而相守不易，也是因为我们错误地理解了 “爱”</p><p>弗洛姆认为，爱不仅是一种情感，更是一种能力，一门需要学习和实践的艺术。它远非始于生理唤醒或 “投射 - 认同” 游戏后就能自然维持的状态。<strong>激情如同种子，而相依相伴的 “一起”，则需要在生活的土壤中，运用 “爱的艺术” 去精心培育</strong></p><p>这门艺术的核心要素是：</p><ul><li>关心(Care)：主动关注对方的需求与福祉，付出行动。这超越了最初的好奇与探索，是持续的关注与投入<br></li><li>尊重(Respect)：正视并接纳对方的独特性与真实存在，包括对方的缺点、局限和与你不同的部分（尊重意味着 “不利用”，让对方按其本性成长，而非强求其符合你的投射）<br></li><li>责任(Responsibility)：不仅仅是生活上义务的负担，也是对方精神成长、情感需求的一种积极回应和承担，这要求成熟与担当<br></li><li>认识(Knowledge)：持续、深入地理解对方，认清楚另一半核心的渴望、恐惧、伤痛与潜力。这是尊重与关心的基础</li></ul><p><strong>“一起” 的真谛，在于两个独立个体之间进行一场 “相互的驯化”，这不是控制或占有，而是在保持各自完整性的前提下，寻求 “不完整的融合”，是在亲密与距离之间寻找那个微妙的、动态的平衡点</strong>。它需要极大的耐心、时间，以及在漫长岁月中共同经历风雨、共同创造意义的能力。这绝非 “漫长忍让” 的消极消耗，而是主动运用爱的艺术去创造、去维系、去深化连接的过程</p><p>做到这一切确实艰难。爱有其生命，从萌芽、生长到最终凋零，是自然规律。但弗洛姆的精髓在于：即便结局注定，“用心呵护爱情生命” 的过程本身，就是抵御虚无、创造永恒价值的方式，因为一切终将黯淡，你的名声、财富、地位、甚至生命，所有一切终将黯淡，但是唯有被爱的目光镀过金的日子依然在岁月的深谷里闪耀着永恒的光芒，这份光芒，是爱的艺术赠予用心者的礼物</p><p>因此，当《远在咫尺》唱出<strong>“应感激终身的伴侣” 时，其深意并非仅仅感激对方的 “忍让”，而是感激在看清了人性的局限、经历了生活的磨损、抵御了 “红白玫瑰” 的诱惑之后，对方依然选择与你共同实践这门 “一起” 的艺术，共同守护那份在岁月深谷中依然闪耀的、被爱的目光镀过金的时光</strong>; 这份感激，指向的是对爱的艺术之艰难的认知，以及对共同跋涉的珍视</p><blockquote><p>一起这种艺术，若果只是漫长忍让，应感激终身的伴侣</p></blockquote><p>我们听了太说，也说过太多 “不相信爱情” 的话，但那往往不是对爱的否定，而是对自己是否有勇气、有耐心、有能力去学习和实践这门最艰难也最珍贵的 “一起” 的艺术（爱的艺术）的怀疑与退缩。而破解《远在咫尺》中困境的钥匙，或许就藏在弗洛姆的箴言里：<strong>爱，不是被动感受，而是主动创造的艺术</strong></p><h2 id="一加一的终极迷思">一加一的终极迷思</h2><p>从 “心动” 瞬间的生理迷障，到《人来人往》的投射幻影，再到《落花流水》中那惊鸿一瞥的真实共振；从相亲市场的精密匹配与婚姻现实的沉重门槛，到彩礼映射的社会断层与时代拧巴；直至《远在咫尺》里那 “身于咫尺，心于千里” 的疏离图景，我们遍历了 “爱” 的迷思与困境。而破解这一切的答案，或许指向了那个标题本身，也是《远在咫尺》最后的顿悟：一起这种艺术</p><p>“一起” 这种艺术的核心，是 “主动创造” 而非 “被动感受”。它要求我们放下对 “完美伴侣” 的虚妄投射，放下对 “最爱” 的唯一执念，如同放下对一件完美艺术品的幻想，转而专注于眼前这块独一无二的 “璞石”，那个真实的、不完美的伴侣。共同雕琢、打磨，在亲密与距离的动态平衡中，在冲突与和解的交织里，创造出一种只属于彼此的、独特的 “不完整的融合”。这份融合可能布满修补的痕迹，却因其真实与共创，而拥有了抵御岁月侵蚀与人性弱点的力量</p><p>“应感激终身的伴侣”，其深意并非感激对方的 “忍让”，而是感激那个愿意与你并肩站在生活的画布前，共同拿起 “爱的艺术” 工具，笨拙却坚韧地学习、实践、创造的同行者。感激 TA 与你一起，在看清了幻影易散、人性易移之后，依然选择在 “流水深处” 捕捉并珍存那些真实的回响，并努力将其谱写成属于两人的、虽不完美却独一无二的生命乐章，一段在岁月的深谷中被爱的目光镀过金的时光</p><p>一起这种艺术，终究是两个人的作品。它的完成既需要个人的觉悟与能力，更需要命运赐予一个同频共振的伙伴。这样的人，或许比 “理想伴侣” 的幻影更稀有，比 “最大公约数” 的匹配更难寻。当流水渴望与落花共谱一曲，但水点注定蒸发、落花注定飘落下游，或当刻刀已备，却无人执手共雕 —— 这或许，才是爱情这门艺术背后，最深的遗憾与最辽阔的留白。如同在《<span class="exturl" data-url="aHR0cHM6Ly9iYWlrZS5iYWlkdS5jb20vaXRlbS8lRTQlQjglODAlRTUlOEElQTAlRTQlQjglODAvMTc3Njk4NjY=">一加一<i class="fa fa-external-link-alt"></i></span>》中Eason 最后的独白</p><blockquote><p>其实…… 有冇呢个人……<br>根本有冇呢啲嘢嘅呢？</p></blockquote><hr><p>本文一些参考材料</p><ul><li>《<a href="https://wulc.me/2015/12/12/%E4%B8%BA%E4%BB%80%E4%B9%88%E7%9B%B8%E7%88%B1%E5%AE%B9%E6%98%93-%E7%9B%B8%E5%AE%88%E4%B8%8D%E6%98%93%EF%BC%9F">为什么相爱容易，相守不易？</a>》<br></li><li>《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY3YWYwNTg5MDVhOTBkZmQwZDc1OWMxNw==">欲望都市 1：爱情并非必须，但人类还是很好玩的<i class="fa fa-external-link-alt"></i></span>》<br></li><li>《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY0MDhhNGRmOGJlNWQ0MDAxM2ExOWM2OQ==">我值得被爱吗？聊聊低自尊与亲密关系<i class="fa fa-external-link-alt"></i></span>》<br></li><li>《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY3YTFiYzU2MjQ3ZDUxNzEzYzg3NTNhYw==">日本系列 4：老龄化启示录 —— 收支、产业与生死美学观<i class="fa fa-external-link-alt"></i></span>》<br></li><li><span class="exturl" data-url="aHR0cHM6Ly93d3cuYmlsaWJpbGkuY29tL3ZpZGVvL0JWMWMxNHkxdTdDeQ==">陈奕迅的人来人往到底讲了个什么故事<i class="fa fa-external-link-alt"></i></span><br></li><li><span class="exturl" data-url="aHR0cHM6Ly93d3cuYmlsaWJpbGkuY29tL3ZpZGVvL0JWMTJiNDExWjdRTS8=">陈奕迅的落花流水讲了个什么故事<i class="fa fa-external-link-alt"></i></span><br></li><li>《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zMDI2ODc5Lw==">爱的艺术<i class="fa fa-external-link-alt"></i></span>》<br></li><li>《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzVlNzQ1NDNhNDE4YTg0YTA0NmM0ZTU3OA==">我（们）的孤老生活<i class="fa fa-external-link-alt"></i></span>》<br></li><li><span class="exturl" data-url="aHR0cHM6Ly93d3cuYmlsaWJpbGkuY29tL3ZpZGVvL0JWMThxNHkxTTdhcA==">深度解析《远在咫尺》<i class="fa fa-external-link-alt"></i></span><br></li><li><span class="exturl" data-url="aHR0cHM6Ly93d3cuYmlsaWJpbGkuY29tL3ZpZGVvL0JWMThXNDExUzdFWA==">大话西游之仙履奇缘<i class="fa fa-external-link-alt"></i></span></li></ul>]]></content>
    
    
    <summary type="html">&lt;p&gt;文章的源起，是在深入了解听过 n
次但选择性忽略了歌词里所诉说的故事的《&lt;span class=&quot;exturl&quot; data-url=&quot;aHR0cHM6Ly9iYWlrZS5iYWlkdS5jb20vaXRlbS8lRTglQkYlOUMlRTUlOUMlQTglRTUlOTIlQUIlRTUlQjAlQkEvODI3MDkyOQ==&quot;&gt;远在咫尺&lt;i class=&quot;fa fa-external-link-alt&quot;&gt;&lt;/i&gt;&lt;/span&gt;》后，对最后那句 “一起这种艺术，若果只是漫长忍让，应感激终身的伴侣”
颇有感触，把储藏在脑子里的很多零散的观点拽出来了，只是这些观点现在也是凌乱不堪，所以尝试通过这篇文章来
connect the dots&lt;/p&gt;
&lt;p&gt;本文尝试对 “爱情” 这一命题展开一些探讨，涵盖 “心动” 的源起、人来人往的 “投射与认同” 游戏、已经是标品的相亲流程、以及 “一起” 的这种艺术，内容依旧是随心所欲的发散，祝开卷有益～&lt;/p&gt;</summary>
    
    
    
    <category term="闲话几句" scheme="https://wulc.me/categories/%E9%97%B2%E8%AF%9D%E5%87%A0%E5%8F%A5/"/>
    
    
    <category term="闲话几句" scheme="https://wulc.me/tags/%E9%97%B2%E8%AF%9D%E5%87%A0%E5%8F%A5/"/>
    
  </entry>
  
  <entry>
    <title>大模型技术报告解读</title>
    <link href="https://wulc.me/2025/02/23/%E5%A4%A7%E6%A8%A1%E5%9E%8B%E6%8A%80%E6%9C%AF%E6%8A%A5%E5%91%8A/"/>
    <id>https://wulc.me/2025/02/23/%E5%A4%A7%E6%A8%A1%E5%9E%8B%E6%8A%80%E6%9C%AF%E6%8A%A5%E5%91%8A/</id>
    <published>2025-02-23T04:00:37.000Z</published>
    <updated>2026-02-28T05:01:22.740Z</updated>
    
    <content type="html"><![CDATA[<p>今年的春节，deepseek把大模型的讨论热度推向了高潮，即使是在十八线小城的年味里，也藏着些意料之外的科技褶皱。表妹用方言对着手机喊 “给俺写段拜年词”，小侄子在忙着跟豆包里的声音温柔、善解人意的 “校花” 聊天，连巷口的春联摊主都学会了用生成式设计定制烫金纹样 —— 这些烟火气里的数字涟漪，像一场无声的启蒙运动，将 “大模型” 三个字编织进了这座十八线小城的毛细血管</p><p>两年前的 AI 还像一座青铜巨像，吞吐数据时浑身震颤着算力的轰鸣，只能在北上广深的数据中心里吞吐星辰；而今的大模型已化作游走的溪流，沿着 5G 基站浸润到县城修车铺的扫码系统、揉进快手主播的方言脚本，甚至蛰伏在老人机的语音助手里咳嗽一声提醒吃药。从 “暴力美学” 的千亿参数军备竞赛，到MoE架构轻巧切开算力蛋糕的刀锋，从耗资数千万美元的实验室贵族，到 DeepSeek-R1 用 600 万美元训练成本撕开的平民入场券 —— 这场进化不仅是技术的跃迁，更是科技叙事从 “神坛独白” 转向 “人间对话” 的隐喻：当大模型学会在显卡残骸上跳成本最优化的芭蕾，技术的毛细血管终于触到了烟火人间的心跳</p><span id="more"></span><p>上面这段话是 deepseek 生成的，不用多复杂的prompt，也不用反复调试，deepseek就那么 “毫不费力” 地生成了一段诗意与写实的文字；而更恐怖的是，这还不是deepseek-R1 的卖点：低成本但足以媲美 openAI-o1 的推理能力</p><p>这段时间试用下来，相较于两年前，大模型的确有了很大的使用体验的改进，不再是一个生硬的文字排列组合机器；除了众所周知的数据 + 算力的 “力大砖飞” 的技巧，技术上有了什么样的进步和革新？最近听的这期播客《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY3YTFiNjk3MjQ3ZDUxNzEzYzg2ODM2Nw==">89.逐句讲解 DeepSeek-R1、Kimi K1.5、OpenAIo1 技术报告 ——“最优美的算法最干净”<i class="fa fa-external-link-alt"></i></span>》，就介绍了三个比较有代表性的大模型报告，本文是学习后的文字版，祝开卷有益～</p><h1 id="openai-o1">OpenAI-o1</h1><p>报告是 24 年 9 月 12 日发布的，<span class="exturl" data-url="aHR0cHM6Ly9vcGVuYWkuY29tL2luZGV4L2xlYXJuaW5nLXRvLXJlYXNvbi13aXRoLWxsbXMv">Learningto reason with LLMs<i class="fa fa-external-link-alt"></i></span>；主要是详细介绍了在各个 benchmarks 上，o1效果非常好（比 GPT-4o 要好很多）</p><p><img data-src="https://wulc.me/imgs/gpt4o_vs_o1.jpg" height="50%" width="50%"></p><p>其中，思维链（Chain of Thought）应该是推理模型相较于前 2年前改进最大的地方之一了；简单来说就是在生成答案前会进行长时间的内部思考，通过多步骤推理、错误修正和策略调整优化答案质量，这种机制类似于人类 “系统 2” 的慢思考模式，显著提高了逻辑严谨性</p><p>报告称 “This process dramatically improves the model’s ability toreason”</p><blockquote><p>It learns to recognize and correct its mistakes. It learns to breakdown tricky steps into simpler ones. It learns to try a differentapproach when the current one isn’t working.</p></blockquote><p>思维链的底层技术就是强化学习了，报告显示这种思维链的能力随着训练时算力和推理时思考时间的增加而持续提升（如下图所示），呈现出类似 AlphaGo 的 “推理扩展定律”（InferenceScaling Law），也有点类似 LLM 在 pretrain阶段的随着数据量增加而效果变好的 scaling law</p><p><img data-src="https://wulc.me/imgs/scaling_law_chain_of_thought.png" height="50%" width="50%"></p><p>报告做了很多性能表现与基准测试，显示思维链的优势，但 o1 的思考过程对外不可见，仅展示摘要，OpenAI 认为这有助于监控模型的安全性（如防止用户操控）</p><p>至于具体实现算法细节，openAI报告里没怎么公开；外界的当时不少猜测是基于过程奖励模型（PRM），对推理过程中的每一步进行细粒度监督，而非仅评估最终结果（ORM），PRM这类方法最早在 openAI 的论文 <span class="exturl" data-url="aHR0cHM6Ly9hcnhpdi5vcmcvYWJzLzIzMDUuMjAwNTA=">Let's Verify Step byStep<i class="fa fa-external-link-alt"></i></span>有所提及，简单来说 ORM 仅对最终结果提供反馈，PRM则对每个推理步骤提供反馈。报告显示在训练模型解决 MATH数据集中的问题时，显著优于结果监督</p><p>但在下面要重点介绍的 DeepSeek 的报告中，显示了 PRM在实际中的落地的难点，是一个不太成功的尝试</p><p>openAI 的报告很短，没有太多的有效信息（毕竟已经是 closeAI了。。）</p><h1 id="deepseek">DeepSeek</h1><p><span class="exturl" data-url="aHR0cHM6Ly9naXRodWIuY29tL2RlZXBzZWVrLWFpL0RlZXBTZWVrLVIxL2Jsb2IvbWFpbi9EZWVwU2Vla19SMS5wZGY=">DeepSeek-R1:Incentivizing Reasoning Capability in LLMs via ReinforcementLearning<i class="fa fa-external-link-alt"></i></span>中，介绍了 DeepSeek-R1-Zero 与 DeepSeek-R1 两个模型</p><p>DeepSeek-R1-Zero 是直接在基础模型上应用大规模 RL 训练，而不需要 SFT(Supervised Fine-Tuning)，这个此前在 LLM、甚至可追溯到 16年刚刚兴起的深度学习领域中，被认为是 common sense的技巧：<u>在通用预训练模型的基础上，使用特定任务的有标签数据对模型参数进行微调，从而优化模型在该任务上的表现</u></p><p>而这也是公开的研究报告中，第一次展示了 LLM 的推理能力通过纯 RL也能够取得非常不错的效果，这里更重要的意义，也许是为各个团队在攻克 o1给世界的谜题，给出了一个更清晰的解题思路；正如 paper 里所说的 “it is thefirst open research to validate that reasoning capabilities of LLMs canbe incentivized purely through RL, without the need for SFT. Thisbreakthrough paves the way for future advancements in this area“</p><p>在讨论报告里提到的强化学习算法之前，先看下此前被广为流传的RLHF (Reinforcement Learning from Human Feedback) 算法的流程，再深入了解DeepSeek 在此基础上的相关改进</p><h2 id="rlhf">RLHF</h2><p>RLHF 分为 3 个阶段：SFT，RM 和 RL，如下图所示（图片来自<span class="exturl" data-url="aHR0cHM6Ly9hd3MuYW1hem9uLmNvbS9jbi93aGF0LWlzL3JlaW5mb3JjZW1lbnQtbGVhcm5pbmctZnJvbS1odW1hbi1mZWVkYmFjay8=">什么是RLHF？<i class="fa fa-external-link-alt"></i></span>）</p><p><img data-src="https://wulc.me/imgs/RLHF.jpg" height="60%" width="60%"></p><p><strong>（1）监督微调（SFT） 阶段</strong></p><p>就是上面提到的 SFT过程，基于标注数据调整预训练模型，使其初步适应特定任务（如对话、指令遵循）</p><p>具体的做法就是使用高质量的人工标注数据（如人工编写的问答范例）对预训练模型进行微调；训练方式与预训练类似，采用自回归的下一词预测目标（如交叉熵损失）</p><p><strong>（2）奖励模型（RM）阶段</strong></p><p>这个阶段是构建一个能模拟人类偏好的打分模型，量化生成内容的质量</p><p>具体的做法是通过 SFT模型生成同一指令的多个回答，由人工对回答进行排序或打分（如偏好排序）；这个流程往往也是提升模型的​安全性​（避免有害内容）和​价值观对齐​（符合伦理偏好）所依赖的环节，即需要引入人工的的纠偏和勘误</p><p>然后在原始的基座模型技术上，修改输出和损失函数（eg，对比损失，pairwise rankingloss），训练一个回归模型（RM），输入指令和回答，输出标量的奖励值</p><p><strong>（3）强化学习（RL）阶段</strong></p><p>最后的阶段就是利用 RM 的奖励信号优化 SFT模型，使其生成更高奖励的响应，通过强化学习算法（如DPO、GRPO、PPO）调整模型参数，最大化预期奖励值</p><p>以 PPO (Proximal Policy Optimization)算法为例，RL 阶段的主要流程就是下图的 Step3</p><p><img data-src="https://wulc.me/imgs/RLHF_PPO.jpg" height="60%" width="60%"></p><p>下面着重讲一下原始的 PPO (Proximal Policy Optimization) 算法，PPO 属于policy-based算法，这里也简单介绍一下强化学习的两种大的技术范式：policy-based 和value-based</p><p>value-based方法侧重于学习一个<strong>精确的价值函数</strong>，用来评估在特定状态 s下执行某个动作 a 能够带来的预期回报，而在执行 action时，会从动作里选择出价值最大的动作。常见的方法如 Q-learning 或DQN。Q-learning 中的 Q-table 或 DQN 中的Q-network，都是在记录或拟合这个价值函数。前者可以理解为是一张直观的打分表，后者则通过NN 网络来拟合这张打分表。这类方法一般都是只适用于 <strong>action数量有限（离散）</strong>的场景，像 Q-table 往往还会限制 state数量有限，因为表的大小存储会有限制</p><p>policy-based方法则侧重学习一个<strong>策略函数</strong>，根据预估的动作概率分布，直接输出最终选择的action，<strong>policy-based的方法能同时支持离散的动作空间和连续的动作空间</strong></p><ul><li><p>对于离散动作空间，这个场景比较好理解，通过一个 softmax函数对最终的 n 个动作归一化成概率和为 1的概率分布，然后选择预估概率最大的动作即可（这其实也是 DQN的做法）</p></li><li><p>对于连续的动作空间，模型输出的是<strong>概率分布的参数</strong>，最常见的一个思路是假设动作服从高斯分布，则模型会输出均值<span class="math inline">\(\mu\)</span> 和 标准差 <span class="math inline">\(\sigma\)</span> 这两个参数，而<em>智能体从 <span class="math inline">\(N(\mu, \sigma^2)\)</span>这个分布中随机抽取一个数值作为实际执行的动作</em>，<u>模型学习的目标是调整<span class="math inline">\(\mu\)</span>（让分布中心靠近好的动作）和<span class="math inline">\(\sigma\)</span>（调整探索的确定性）</u>，这种场景下一般使用NLL (Negative Log-Likelihood) 损失函数，其本质也是 maximum-likelihoodestimation 的思想，只是相较于常见的二分类的 MLE 没有绝对的 groundtruth，而是基于环境反馈的具体 reward 来决定最终的 gradient 的weight</p></li></ul><p>policy-based 方法中往往会涉及到策略梯度（policygradient）的概念，其实跟机器学习中 bp 的 gradient基本是相同的概念，可以理解为是 weightedgradient，比如说以离散空间为例，其实就是个多分类的任务，只是在传统的多分类任务中bp 中回传 gradient 时，多乘一个 reward，其物理含义是对增加 reward大的动作的出现概率，减少 reward 小的动作的出现概率</p><p>回到 PPO 算法，PPO 算法一种基于 Actor-Critic 架构实现的算法。PPO中共有 4 个模型：Actor Model、Critic Model、Reward Model 和 ReferenceModel</p><p>其中，<u>Reward Model 和 Reference Model 是在 LLM 场景下的 RLHF流程中独有的模块</u>，原生的 PPO算法（用于机器人、游戏等）没有这两个模块，因为在传统的强化学习（比如玩超级玛丽）中，环境会直接给你Reward（吃到金币+1）。但大模型生成一段话，环境（用户）不会立刻给你打分。因此，我们需要模拟一个环境，而reward model 这个模块就是干这个事情的，其作用是为 Actor model 提供环境的reward；而 referencemodel，顾名思义，就是为了避免模型偏离原始参数太多的一个 “参考模型 “，在实际中会通过与当前actor model 的输出的分布的差异做对比，通过 KL散度来惩罚分布差异变化过大的情况</p><ul><li><strong>Actor Model（策略模型）</strong></li></ul><p>这个模型的功能是生成语言模型的输出（如对话中的response），是训练的主要目标；通常会基于上面步骤（1）的 SFT模型初始化，然后通过策略梯度更新参数，最大化奖励信号同时避免偏离参考模型即Reference Model</p><ul><li><strong>Reference Model（参考模型）</strong>​</li></ul><p>这个模型也是通过 SFT模型初始化的，且<strong>参数是固定不更新的</strong>，相当于 Actor的初始版本，用于计算 KL 散度约束（当前 actor model 和 reference model输出的分布差役，防止 Actor在训练中过度偏离原始分布，用与缓解奖励作弊（RewardHacking）和灾难性遗忘（Catastrophic Forgetting）</p><p>奖励作弊主要是指模型通过偏离合理策略（如生成编造虚假信息），来提高奖励分数；灾难性遗忘则是指模型在优化新任务时，丢失了预训练阶段学到的通用知识；具体的生效方式，都是通过KL 散度来约束 Actor Model 和 Reference Model 的输出差异不会过大</p><ul><li><strong>​Reward Model（奖励模型）</strong>​</li></ul><p>这个模型就是上面提到的阶段（2）中训练出来的模型，其功能是对生成的response进行实时打分，提供即时奖励信号；​训练方式通过人类标注的偏好对（good/badresponse pairs）进行对比学习，跟 Reference Model类似，<strong>参数在训练过程也是被冻结不更新的</strong></p><ul><li><strong>​Critic Model（评论家模型）​</strong></li></ul><p><u>Reward Model 预测的是即时收益（即当下这个动作的收益），CriticModel 预测的则是当前状态的长期收益</u>。Critic Model的重要作用之一是平滑梯度，因为如果我们只靠最后的 Reward来更新，梯度的方差会非常大（因为一句话写得好可能只是运气）</p><p>Critic Model 的输出主要是用于计算优势函数（Advantage Function），指导Actor的优化方向。这里提到的 “优势函数” 的计算方法因具体强化学习算法而异，但其核心思想是<strong>衡量特定动作相对于策略平均表现的优劣程度</strong>，以PPO 算法为例，优势函数的定义如下</p><p><span class="math display">\[A(s,a)=Q(s,a)−V(s)\]</span></p><ul><li><span class="math inline">\(​V(s)\)</span>：状态价值函数 (State-ValueFunction)，表示在状态 s 下按当前策略执行所有动作的平均预期回报（在 PPO 中由Critic Model 预估当前时刻的未来预期 reward 得到的）</li><li><span class="math inline">\(Q(s,a)\)</span>：动作价值函数 (Action-ValueFunction)，表示在状态 s 下执行动作 a 后的预期总回报（包含未来奖励的折现），可以直观拆解为当前执行动作后的即时收益和下一时间的状态价值（在PPO 中是 ​Reward Model 预估的即时 reward 和 Critic Model预估下一时刻的未来 reward 加和得到的）</li></ul><p><img data-src="https://wulc.me/imgs/PPO_advantaget_function.jpg" height="50%" width="50%"></p><p>则当 <span class="math inline">\(A(s,a)&gt;0\)</span>，说明动作 a优于平均表现，反之差于平均</p><p>关于这个函数为什么会是这个形式，这篇文章给了一个比较通俗的例子《<span class="exturl" data-url="aHR0cHM6Ly96aHVhbmxhbi56aGlodS5jb20vcC83NDYxODYzOTM3">人人都能看懂的 RL-PPO 理论知识<i class="fa fa-external-link-alt"></i></span>》（ps，这篇文章整体也非常推荐一读）</p><p><img data-src="https://wulc.me/imgs/RL_advantage_function.jpg" height="80%" width="80%"></p><p>Critic Model 的角色跟 Reward Model 有点像（实际上，在后来的 GRPO算法中也把 Critic Model 给去掉了），但 Critic Model的参数是更新的，由于是预测价值，因此更新的方式也是基于 mse 这一类 loss来最小化实际收益和预测收益差异；</p><p>因此， PPO 的一轮训练过程是这样</p><p>1、Actor 根据当前策略生成 response<br>2、Reference Model 计算 KL 散度（防止跑偏），Reward Model给出最终的原始分数，最终 Reward = RM 分数 - KL 惩罚<br>3、Critic Model 观察生成过程中的每一个状态，给出上面预测的 <span class="math inline">\(V(s)\)</span> 值<br>4、Actor 通过第二步计算的 “最终 Reward“和第三步计算的 <span class="math inline">\(V(s)\)</span> 值，进而计算上面提到的优势函数 <span class="math inline">\(A(s,a)\)</span>, 通过并 PPO-Clip 机制更新 Actor的参数<br>5、Critic也会根据实际回报（Return）和预测值（Value）的误差调整自身的参数</p><p>关于 Actor Loss 和 和 Critic Loss 《<span class="exturl" data-url="aHR0cHM6Ly96aHVhbmxhbi56aGlodS5jb20vcC82Nzc2MDc1ODE=">图解大模型 RLHF 系列之：人人都能看懂的 PPO 原理与源码解读<i class="fa fa-external-link-alt"></i></span>》，文章给出了代码示例，整篇文章也推荐一读</p><h2 id="deepseek-r1-zero-pure-rl-with-grpo">DeepSeek-R1-Zero: Pure RLwith GRPO</h2><p>虽然前面提到的 PPO 的范式中的 Actor-Critic 范式看起来似乎比较合理，但<strong>Critic训练的准确性，其实是没法保证的，所以当价值函数不够准确时，与其用一个错误的价值评估，还不如直接舍弃掉这个评估</strong></p><p><span class="exturl" data-url="aHR0cHM6Ly9hcnhpdi5vcmcvYWJzLzI0MDIuMDMzMDA=">Group Relative PolicyOptimization<i class="fa fa-external-link-alt"></i></span>（GRPO）就是这么做的，GRPO 是一种在 DeepSpeek-v2中提出的强化学习算法，前面提到 Critic Model 的角色跟 Reward Model有点像，而在 GRPO 算法中其实是 Critic Model 去掉了，那 GRPO是怎么做的？简单来说就是通过多次采样同一问题的不同回答，直接利用组内奖励的统计特性（如均值、方差）计算相对优势，GRPO的跟 PPO 的区别如下</p><p><img data-src="https://wulc.me/imgs/GRPO_VS_PPO.jpg" height="70%" width="70%"></p><p>可以看到，GRPO 没有了 Value Model (也就是 CriticModel)，取而代之的是每次生成 <span class="math inline">\(G\)</span> 个output，然后分布算出这 <span class="math inline">\(G\)</span> 个 output的 reward，计算方式如下所示</p><p><img data-src="https://wulc.me/imgs/GRPO_reward.jpg" height="60%" width="60%"></p><p>得到了 <span class="math inline">\(G\)</span> 个 reward 后，通过Group Computation 计算出各个 reward 优势函数 <span class="math inline">\(A_i\)</span>，计算方法就是基于 group内的均值和方差来计算，paper 里分成了两种类型：Outcome Supervision RL 和Process SupervisionRL（一个关注最终结果，一个关注过程每个步骤），但计算方式都差不多</p><p><img data-src="https://wulc.me/imgs/GRPO_advantage_computation.jpg" height="60%" width="60%"></p><p>则 policy model 的损失函数可以写成下面的形式</p><p><img data-src="https://wulc.me/imgs/GRPO_policy_model.jpg" height="80%" width="80%"></p><p>则通过 GRPO 训练的整体算法流程如下所示</p><p><img data-src="https://wulc.me/imgs/GRPO_overall_process.jpg" height="60%" width="60%"></p><h2 id="reward-modeling">Reward Modeling</h2><p>虽然取消 Critic Model 保留了 Reward Model，但在 DeepSeek-R1 使用的Reward Model 也不像前面 PPO 方法中提到的基于模型预估的，而是采用了rule-based 的 reward modeling，paper 中采用了两种 rule-based 的reward：accuracy reward 和 format reward；而采用 rule-based的原因是如果还是基于预估值的 reward modeling 的方式，在这种大规模的 RL训练中，很容易出现 reward hacking 的问题（实际上所有基于预估来获取reward 的方式都会有这样的问题），同时也会让训练变得更加复杂</p><p><img data-src="https://wulc.me/imgs/DeepSeek_R1_Zero_reward_modeling.jpg" height="60%" width="60%"></p><h2 id="deepseek-r1-user-friendly-model-with-cold-start">DeepSeek-R1:User-Friendly Model with Cold Start</h2><p>尽管通过 GRPO 算法训练获得了推理能力的显著提升，DeepSeek-R1-Zero在评测上效果还不错，但是在实际使用时，仍存在一些缺陷。一方面，R1-Zero生成的推理内容可读性欠佳，语言混合的情况时有发生，这使得其推理过程难以被清晰理解。另一方面，由于直接在基础模型上进行强化学习，没有前期的引导，训练初期模型的表现不稳定，收敛速度较慢</p><blockquote><p>DeepSeek-R1-Zero encounters challenges such as poor readability, andlanguagemixing. To address these issues and further enhance reasoningperformance, we introduce DeepSeek-R1, which incorporates a small amountof cold-start data and a multi-stage training pipeline.</p></blockquote><p>为了解决这些问题，DeepSeek-R1 在 R1-Zero的基础上进行了如下 4 点改进</p><blockquote><p>(1)Specifically, we begin by collecting thousands of cold-start datato fine-tune the DeepSeek-V3-Base model<br>(2)Following this, we perform reasoning-oriented RL likeDeepSeek-R1-Zero<br>(3)Upon nearing convergence in the RL process, we create new SFT datathrough rejection sampling on the RL checkpoint, combined withsupervised data from DeepSeek-V3 in domains such as writing, factual QA,and self-cognition, and then retrain the DeepSeek-V3-Base model<br>(4)After fine-tuning with the new data, the checkpoint undergoes anadditional RL process, taking into account prompts from allscenarios.</p></blockquote><p><strong>（1）冷启动</strong><br>DeepSeek-R1 收集了数千条长思维链（CoT）数据来微调 DeepSeek-V3-Base模型，并在这之后进行上面提到的 RL训练过程。这些数据通过多种方式获得，如少样本提示、引导模型生成带反思验证的答案等。冷启动数据提升了模型输出的可读性，并融入人类先验知识，为模型提供了更好的训练起点；在微调后再采用上面的训练DeepSeek-R1-Zero 的方式，整体的效果是要优于纯 RL训练得到的 DeepSeek-R1-Zero</p><p><strong>（2）语言一致性奖励</strong><br>针对 DeepSeek-R1-Zero 推理中语言混合的问题，DeepSeek-R1在强化学习训练时引入语言一致性奖励。这个奖励是依据思维链（CoT）中目标语言单词的比例计算，比例越高奖励越高。虽然这会使模型性能稍有下降，但能有效缓解语言混合现象，让推理过程更符合人类阅读习惯</p><p><strong>（3）拒绝采样（RejectionSampling）与监督微调 (SFT)</strong></p><p>前面两个步骤都把重点放在了 reasoning上，在这一步则是搜集各种数据来提升模型的一般能力如 writing, role-playing等（可能也侧面说明了在最终商用的模型中，SFT 这一环节还是少不了的）</p><p>具体包含了两部分数据：推理数据（Reasoning data） 和非推理数据（Non-Reasoning data）, 拒绝采样（RejectionSampling）的含义指的是生成多个候选输出，并根据特定标准筛选出最优样本，从而提升数据的质量。例如，生成 10 条可能的推理路径后，仅保留最符合逻辑或最接近正确答案的样本</p><p>对于推理数据的搜集，一部分来自前面训练好的模型中，从中得到 reasoningtrajectories，然后使用基于规则的简历来做拒绝采样（eg. 答案是否符合预设格式、最终结果是否正确）；另一部分则是引入生成式奖励模型（generativerewardmodel），即判断模型的推理逻辑是否与人类标注的参考答案（ground-truth）匹配，这部分是通过将模型生成的预测与真实答案（ground-truth）输入 DeepSeek-V3，评估逻辑一致性和语义匹配度；整体的推理数据过滤得到了大概600k 的数据</p><blockquote><p>We curate reasoning prompts and generate reasoning trajectories byperforming rejection sampling from the checkpoint from the above RLtraining. In the previous stage, we only included data that could beevaluated using rule-based rewards. However, in this stage, we expandthe dataset by incorporating additional data, some of which use agenerative reward model by feeding the ground-truth and modelpredictions into DeepSeek-V3 for judgment. Additionally, because themodel output is sometimes chaotic and difficult to read, we havefiltered out chain-of-thought with mixed languages, long parapraphs, andcode blocks.</p></blockquote><p>对于非推理数据，如写作、事实性问答等，复用 DeepSeek-V3 的部分 SFT数据集，共收集约 200k 样本</p><p>利用这些总计约 800k 样本，对基础模型即 DeepSeek-V3-Base 进行两个epoch 的微调，同时提升了模型的基础推理能力和通用任务上的能力（MoE的体现之一）</p><p><strong>（4）全场景强化学习</strong><br>这一步主要是使模型与人类的偏好更一致（如无害性、实用性），在步骤（3）的模型基础上进行的额外的强化学习的训练。为了达到无害性，需要通过关注推理过程（reasoningprocess）和最终的结果（summary），识别并移除任何可能的有害的内容）；而实用性则主要关注最终的结果（summary）的有效性；具体做法paper 了没提，关键点是奖励信号的设计和组合（eg.对于无害性，需要通过检测推理过程或最终的结果中是否含有暴力、歧视性词汇，进而确定具体label）</p><h2 id="distillation">Distillation</h2><p>报告也证实了一个关于蒸馏的 “常识”：即可以把 DeepSeekd模型的推理能力蒸馏到其他模型，得到的效果会比原来的模型以以及公开的蒸馏模型要更好，如下图所示</p><p><img data-src="https://wulc.me/imgs/DeepSeek_distill_models.jpg" height="60%" width="60%"></p><p>另外，在模型参数相同情况下，蒸馏出来的模型比起只在模型上使用DeepSeek-R1-Zero 的训练流程得到的效果要更好，同时使用的算力要更小，如下图所示，这能降低模型商用的成本的一个重要途径</p><blockquote><p>distilling more powerful models into smaller ones yields excellentresults, whereas smaller models relying on the large-scale RL mentionedin this paper require enormous computational power and may not evenachieve the performance of distillation</p></blockquote><p><img data-src="https://wulc.me/imgs/DeepSeek_distillation_vs_rl.jpg" height="60%" width="60%"></p><h2 id="unsuccessful-attempts">Unsuccessful Attempts</h2><p>这部分主要提到了两个不成功的尝试：Process Reward Model (PRM) 和 MonteCarlo Tree Search (MCTS)</p><p>Process Reward Model (PRM)：这部分主要是指过程奖励模型在实际中比较难落地，paper提到主要有以下几点原因：一是把定义步骤会比较困难（即把推理过程拆解成各个步骤），二是为每个步骤定义一个reward 也会比较困难（模型打分不考虑，人工标注不现实），三是如果 PRM基于预估得到每个步骤的 reward，不可避免地会出现 reward hacking地问题，原因跟上面提到的一样：所有基于预估来获取 reward的方式都不可避免会有这样的问题</p><p>Monte Carlo Tree Search (MCTS) ：蒙特卡洛树搜索，这个在 AlphaGo中关键的方法，未被证明在大模型的训练中同样有效，其主要原因还是搜索空间过大和以及价值模型训练困难，paper里是这么做的</p><blockquote><p>MCTS involves breaking answers into smaller parts to allow the modelto explore the solution space systematically. To facilitate this, weprompt the model to generate multiple tags that correspond to specificreasoning steps necessary for the search. For training, we first usecollected prompts to find answers via MCTS guided by a pre-trained valuemodel. Subsequently, we use the resulting question-answer pairs to trainboth the actor model and the value model, iteratively refining theprocess.</p></blockquote><p>MCTS需要对每一步生成的可能路径进行多次模拟和评估。在下棋中这个可能的路径数量是有限的，但在自然语言生成中，每个 token 的选择涉及数千甚至数万种可能性，导致搜索空间呈指数级增长。例如，一个包含 100 个 token 的句子，若每个 token 有 100 种候选词，总路径数为100^100，远超可行计算范围；当然也可以提前做剪枝之类的，但 paper提到了这容易导致模型学不好（getting stuck in local optima）</p><p>另外 MCTS也需要训练一个价值模型来评估中间步骤，这个模型训练会比较困难，主要是奖励信号比较难定义（跟前面PRM提到的原因一样）；所以一般的经验是 MCTS 更适合封闭式、目标明确的任务（如解题、代码生成），但在开放域生成（如创意写作、多轮对话）中效果有限</p><h1 id="kimi">Kimi</h1><p>Kimi 的这篇报告 <span class="exturl" data-url="aHR0cHM6Ly9hcnhpdi5vcmcvcGRmLzI1MDEuMTI1OTk=">KIMIK1.5:SCALING REINFORCEMENT LEARNING WITH LLMS<i class="fa fa-external-link-alt"></i></span>，整体的方法跟DeepSeek-R1 比较相似，可以说是殊途同归了</p><p>两篇报告都显示通过 RL 推动模型自主生成思维链（Chain-of-Thought,CoT），出现了如自我验证、反思等行为；同时能够显著提升模型推理能力，尤其在数学、编程等复杂任务中</p><p>同时两者均通过蒸馏技术将大模型能力迁移至小模型；Kimi 提出 Long2Short 优化（如模型合并、DPO 训练），DeepSeek-R1 直接使用大模型生成数据微调小模型</p><p>但 Kimi 的训练流程跟 DeepSeek-R1 不太一样，Kimi整体还是采用多阶段训练（预训练→监督微调→长链 SFT→RL），不像 DeepSeek做了纯 RL 的探索；另外，Kimi 这篇报告中提到了非常多的训练细节，这也是DeepSeek 和 OpenAI中没有提及的，这部分对其他团队复现也提供了非常多有用的信息</p><p>报告提到通过 “Long context scaling” + “Improved policyoptimization”，就能取得不错的效果，而不用依赖一些比较复杂的技术，如上面提到的无效的探索蒙特卡洛树搜索（MonteCarlo tree search） 和 过程奖励模型（process reward models），在 Kimi中也并没有被采用</p><h2 id="long-context-scaling">Long context scaling</h2><p>这里的 Long，指的是将 RL 上下文窗口扩展至 128ktokens，支持生成更长的思维链（Chain-of-Thought,CoT），提升复杂推理能力</p><p>报告里提到一个概念：RL promptset，这是一组经过精心筛选的问题（如数学题、编程题、逻辑推理题等），用于引导模型在强化学习过程中生成长链推理（CoT），也是重要的训练数据来源；这部分数据需要满足以下约束</p><ul><li>多样性覆盖：覆盖 STEM、编程、通用推理等多领域，确保模型适应不同任务<br></li><li>可评估性：答案可通过规则（如数学公式验证）或测试用例（如编程题）客观验证，排除易被猜测的问题（如选择题）</li><li>平衡的难度：包含简单、中等、困难的问题，促进模型逐步学习复杂推理</li></ul><p>具体的构建方法如下<br>（1）自动筛选；通过模型自评估（如 SFT 模型生成多次答案，计算通过率）确定问题难度；通过过滤易被Reward Hacking的问题，例如排除答案格式简单或可通过随机猜测解决的问题<br>（2）标签系统；使用领域标签（如数学、编程）和难度标签（易 / 中 / 难）分类问题，确保训练数据的均衡分布。如数学竞赛题标记为 “高难度”，小学数学题标记为 “低难度”<br>（3）验证与排除；若模型无需推理即可在多次尝试中猜中答案（如 8 次尝试内成功），则该问题被排除；避免包含需要主观判断的问题（如证明题），以保持评估的客观性</p><p>长链 SFT（Long-CoT Supervised Fine-Tuning）的训练数据，就是基于 RLprompt set中的问题，通过人工或自动生成高质量的 CoT 标注（例如通过拒绝采样或人工精修）得到的，这部分跟DeepSeek-R1 中的冷启动部分数据作用基本一致</p><h2 id="improved-policy-optimization.">Improved policyoptimization.</h2><h3 id="policy-optimization">Policy Optimization</h3><p>报告提出基于 <strong>Online Policy MirrorDescent</strong> 的一个变种算法，其做法跟上面提到的 GRPO也比较相似，同样去掉了 Critic model，其中 <span class="math inline">\(r\)</span> 是 reward model，<span class="math inline">\(\pi\)</span> 是 actor model (报告里也成为 policymodel) 和 reference model</p><p><img data-src="https://wulc.me/imgs/kimi_policy_oprimization.jpg" height="80%" width="80%"></p><p>上面公式（3）显示的最终的函数跟 GRPO 也比较相似，用作 loss 加权的reward 是由当前 <span class="math inline">\(k\)</span> 个 采样的response 的 reward 取均值得到，通过有一个 KL 散度约束 actor model 和critical model 的输出的 diff</p><h3 id="length-penalty">Length Penalty</h3><p>kimi 1.5 引入长度惩罚（Length Penalty），这是在前面 openAI 和deppSeek 中都没提及的技术，简单来说，就是随着回答长度的增加，边际roi 在逐步下降（模型效果 / 训练成本）。因此，训练的过程引入了一个 lengthreward 来约束回答的长度，在 <span class="math inline">\(k\)</span>个采样的 response中计算最大长度和最短长度，然后通过下面的方式对回答长度短的回答增加一个额外的reward</p><p><img data-src="https://wulc.me/imgs/kimi_length_penalty.jpg" height="60%" width="60%"></p><h3 id="sampling-strategies">Sampling Strategies</h3><p>除了 RL 本身的采样策略，paper 也提了两种额外的采样策略：CurriculumSampling 和 Prioritized Sampling</p><p>Curriculum Sampling 指的是先训练简单任务，再训练困难任务（基于 RLprompt set 区分问题的难度）；其原因是 RL模型再最开始的效果不好，如果把同等的训练资源分配到困难任务上，获得的效果不佳，导致训练效率低下</p><p>Prioritized Sampling可理解为会增加对困难任务的采样概率，即如果一个问题的成功率是 <span class="math inline">\(s_i\)</span>，则采样概率是 <span class="math inline">\(1 − s_i\)</span></p><h2 id="long2short">Long2short</h2><p>这部分的作用跟蒸馏比较类似，都是把一个大模型的能力迁移到小的模型上，这里的long 和 short 分别指 long-CoT models 和 short-CoT models</p><p>为了达到这个目标，报告中主要采用了 4 种方法： model merging, shortestrejection sampling, DPO 和 long2short RL</p><ul><li>model merging：对两个模型的参数做平均<br></li><li>shortest rejection sampling：对同一个问题采样 n 次（n =8），然后选择最短的回答做 SFT</li><li>DPO：同样对一个问题采样 n 次，然后选择最短且正确的回答作为 positivesample，长的回答（短回答长度的 1.5 倍及以上）作为 negativesample（无论是否 correct）<br></li><li>long2short RL：基于训练好的一个模型，采用上面提到的 length penalty再进行一轮 RL 的训练</li></ul><h1 id="小结">小结</h1><p>当强化学习的梯度在 Transformer架构中奔涌，一场关于推理能力的静默革命正在重塑大模型的进化轨迹。从 OpenAI-o1 在思维链中构建的 "系统 2" 慢思考范式，到 DeepSeek-R1 用纯强化学习突破 SFT 依赖的惊险一跃；从过程奖励模型 (PRM) 对推理步骤的原子化监督，到 GRPO 算法抹除价值函数后展现的群体相对优势 —— 这些技术突破不仅解构了 "暴力美学" 时代的千亿参数迷信，更在算力与算法的二重奏中谱写出新的可能性。当 DeepSeek 用规则化奖励模型破解强化学习的奖励欺骗困局，当模型蒸馏将推理能力压缩进更轻量的架构，这场技术进化正在证明：大模型的核心竞争力，或许不在于吞噬多少星辰般的数据，而在于如何用更优雅的算法，在显卡残骸上搭建起通向量产智慧的阶梯</p><p>上面这段文字，也是让 deepseek基于这篇文章内容生成了一段总结；看完后还是不禁感慨大模型的能力令人惊艳。而无论拒绝或接受，这场大模型革命正以比蒸汽机更温柔的轰鸣重塑文明肌理；当 18 世纪的纺织工人惊恐地看着珍妮纺纱机，他们不会想到机械臂终将托起整个工业文明；而今面对语言模型中涌现的推理能力，我们比先辈更幸运 —— 每个人都能在开源社区的算力碎片里拾取火种，每个县城开发者都能用 API 接口编织智能神经网络。与其担忧模型参数膨胀是否会吞噬工作岗位，不如成为第一批大模型的 "算法纺织工"；历史从不同情被动者，当大模型的思维链已能穿透数学证明的铜墙铁壁，当 DeepSeek-R1 的推理能力正通过模型蒸馏注入老人机的芯片 —— 这场静默的认知革命，终将把迟疑者永远留在蒸汽朋克的隐喻里</p>]]></content>
    
    
    <summary type="html">&lt;p&gt;今年的春节，deepseek
把大模型的讨论热度推向了高潮，即使是在十八线小城的年味里，也藏着些意料之外的科技褶皱。表妹用方言对着手机喊 “给俺写段拜年词”，小侄子在忙着跟豆包里的声音温柔、善解人意的 “校花” 聊天，连巷口的春联摊主都学会了用生成式设计定制烫金纹样 —— 这些烟火气里的数字涟漪，像一场无声的启蒙运动，将 “大模型” 三个字编织进了这座十八线小城的毛细血管&lt;/p&gt;
&lt;p&gt;两年前的 AI 还像一座青铜巨像，吞吐数据时浑身震颤着算力的轰鸣，只能在北上广深的数据中心里吞吐星辰；而今的大模型已化作游走的溪流，沿着 5G 基站浸润到县城修车铺的扫码系统、揉进快手主播的方言脚本，甚至蛰伏在老人机的语音助手里咳嗽一声提醒吃药。从 “暴力美学” 的千亿参数军备竞赛，到
MoE
架构轻巧切开算力蛋糕的刀锋，从耗资数千万美元的实验室贵族，到 DeepSeek-R1 用 600 万美元训练成本撕开的平民入场券 —— 这场进化不仅是技术的跃迁，更是科技叙事从 “神坛独白” 转向 “人间对话” 的隐喻：当大模型学会在显卡残骸上跳成本最优化的芭蕾，技术的毛细血管终于触到了烟火人间的心跳&lt;/p&gt;</summary>
    
    
    
    <category term="LLM" scheme="https://wulc.me/categories/LLM/"/>
    
    
    <category term="机器学习" scheme="https://wulc.me/tags/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/"/>
    
    <category term="深度学习" scheme="https://wulc.me/tags/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0/"/>
    
    <category term="LLM" scheme="https://wulc.me/tags/LLM/"/>
    
  </entry>
  
  <entry>
    <title>adload 约束下的混排价值最大化</title>
    <link href="https://wulc.me/2025/01/19/Hierarchically%20Constrained%20Adaptive%20Ad%20Exposure%20in%20Feeds/"/>
    <id>https://wulc.me/2025/01/19/Hierarchically%20Constrained%20Adaptive%20Ad%20Exposure%20in%20Feeds/</id>
    <published>2025-01-19T13:37:39.000Z</published>
    <updated>2026-02-28T05:01:22.709Z</updated>
    
    <content type="html"><![CDATA[<p>之前写的<a href="https://wulc.me/2023/02/26/%E6%B7%B7%E6%8E%92%E9%82%A3%E4%BA%9B%E4%BA%8B/">混排文章</a>，主要介绍了《AdsAllocation in Feed via ConstrainedOptimization》里的基本做法，同时拓展讨论了混排中的一些开放性问题，这篇 paper解决的问题是 request 维度的插入规则，但是没有考虑到一些比较实际的约束如adload，即出广告的比例是有限的</p><p>而如果考虑到 adload 的约束，就不能只考虑 request内的价值比较了，而是要考虑到 request 之间或者说 session维度的价值最大化了，如在某些高价值请求上多出，低价值请求上少出或不出，以此达到adload 约束下收入最大化。这篇 paper《<span class="exturl" data-url="aHR0cHM6Ly9hcnhpdi5vcmcvYWJzLzIyMDUuMTU3NTk=">Hierarchically ConstrainedAdaptive Ad Exposure in Feeds<i class="fa fa-external-link-alt"></i></span>》为这个问题提供了一个解决思路；paper整体做法还是 beam search 和 generator+evaluator的混排范式，但是在这个过程中会把整体约束考虑到这个在线的求解过程中；相较于常规做法把控adload 独立在混排之外，是一个比较好的思路，值得一读～</p><span id="more"></span><h2 id="问题建模">问题建模</h2><h3 id="定义">定义</h3><p>paper 把整体问题定义如下</p><p><img data-src="https://wulc.me/imgs/mixrank_formulation.png" height="50%" width="50%"></p><p>其中有两点值得注意</p><ul><li><strong>价值度量</strong></li></ul><p>价值度量或者说量纲对齐，是混排阶段无法绕开的问题； paper里推荐候选的用户价值即 <span class="math inline">\(U^{rec}(s|\pi_s)\)</span> 和广告的商业价值即 <span class="math inline">\(U^{ad}(s|\pi_s)\)</span>量纲的对齐，还是用一个货币化超参 <span class="math inline">\(\alpha\)</span> 来做的</p><p>这也是业界常见做法，究其原因，应该还是商业价值（ecpm）有比较明确的物理含义，且不容易突变（因为 bid 基本稳定、ctr、cvr预估也有准确性要求），像推荐往往只关注序不关注高低估，这可能导致的问题是推荐的分一旦抖动时，容易导致出现积压，所以往往也会对推荐分做一些稳定性的保障，如cap 掉异常值，整体做归一化等</p><ul><li><strong>application level 建模</strong></li></ul><p>如背景提到的，前一篇 paper 主要在于建模的是 request-level价值的最大化，但没有考虑到有 adload 约束（即下图的 <span class="math inline">\(m^*\)</span>）的时的情况，而这里建模时会把一个session 的 request 共同考虑</p><h3 id="建模">建模</h3><p>上面的问题虽然定义起来比较简单，但是如果要直接求解 <span class="math inline">\(\pi\)</span>还是比较难的，所以还需要对问题做一些转化，转换成数学上可求解的形式，具体的方法是把整体的策略拆解成两部分，分别是application-level 的策略 <span class="math inline">\(x\)</span> 和request-level 的策略 <span class="math inline">\(\pi\)</span>, 如下所示<span class="math inline">\(x\)</span> 解决否在这个请求出广告，而 <span class="math inline">\(\pi\)</span>解决在这条请求出多少广告；除了这两个符号，paper 使用的符号定义如下</p><p><img data-src="https://wulc.me/imgs/mix_rank_notatios.png" height="50%" width="50%"></p><p>在 reqeust 维度定义了出广告的价值 <span class="math inline">\(v\)</span> （<span class="math inline">\(\pi_0\)</span> 表示不出广告）和广告数量 <span class="math inline">\(w\)</span> ，如下所示；这里有个点 paper里没有说得很清楚，就是 <span class="math inline">\(v\)</span>的详细计算方式，乍一看下面的公式（4），<span class="math inline">\(v\)</span>就是广告的价值之和，最直观的方式就是纯广告候选的 <span class="math inline">\(\sumecpm\)</span>，但这种方式是考虑不全的，一是只考虑了商业价值，二是广告插入后对推荐内容的影响没被考虑在内</p><p>猜测实际的计算方式应该是：<u>同时出推荐内容和广告的 list 价值 -只有推荐内容的价值</u> , 这也意味着在 beam search 中每个 list的价值时，需要同时计算两个，即有广告的 <span class="math inline">\(U(s|\pi_s)\)</span> 和无广告的<span class="math inline"> \(U(s|\pi^0)\)</span>；另外，paper这里也没给出具体的 <span class="math inline">\(U(s|\pi_s)\)</span> 和<span class="math inline">\(U(s|\pi^0)\)</span>计算方式，实际的计算应该还要考虑位置的衰减，即需要乘上position_discount</p><p><img data-src="https://wulc.me/imgs/mixrank_value_def.png" height="50%" width="50%"></p><p>在 adload 约束下的价值最大化，其实就是一个典型的 0-1 背包问题，adload就是背包的容量，需要最大化出广告的请求的价值，则基于上面定义的符号，可以写出下面的最优化稳定的定义，<span class="math inline">\(x_s\)</span> 就是某条请求是否要出广告</p><p><img data-src="https://wulc.me/imgs/mixrank_two_level.png" height="50%" width="50%"></p><p>但与传统背包算法不同的点是，物品的价值是会动态变化的，即由request-level 的策略 <span class="math inline">\(\pi_s\)</span>决定的，因此 paper 设计了 two-level 的算法来优化这个问题，一个是application level，一个是 request level</p><h2 id="问题求解">问题求解</h2><h3 id="application-level">application level</h3><p>这里是通过贪心算法求解 application-level的问题的，即决定当前请求是否出广告（ps，贪心算法求解背包问题非最优，但足够轻量级），具体做法就是基于上面定义的<span class="math inline">\(v\)</span> 和 <span class="math inline">\(w\)</span> 计算 <span class="math inline">\(\rho =v/w\)</span> （可以理解为广告的边际价值），然后基于 <span class="math inline">\(\rho\)</span> 排序，然后在 adload 的约束下求一个<span class="math inline">\(\rho\)</span> 的门槛，线上 serving时只有门槛大于这个的请求才能出广告，如下图所示</p><p><img data-src="https://wulc.me/imgs/mixrank_application_level.png" height="50%" width="50%"></p><h3 id="request-level">request level</h3><p>request level 要决定的就是具体出广告的策略 <span class="math inline">\(\pi_s\)</span></p><p>假设出广告策略从 <span class="math inline">\(\pi_1\)</span> 变到了<span class="math inline">\(\pi_2\)</span>，相应的这个请求的 <span class="math inline">\(v\)</span> 和 <span class="math inline">\(w\)</span> 都会发生变化（记为 <span class="math inline">\(\Delta v^{+}\)</span> 和 <span class="math inline">\(\Delta w_s\)</span>），而由于 <span class="math inline">\(w\)</span>发生了变化，会导致其他请求会多出或少出广告，进而影响 application-level的价值</p><p>如下图所示，在这个请求内增加的价值的为 <span class="math inline">\(\Delta v^+\)</span>，但是其他请求减少的价值为<span class="math inline">\(\Deltav^-\)</span>（<strong>近似值，用上面求出来的请求门槛近似减少的广告的价值，极端情况下不一定成立</strong>），而只有这两者加和大于0 时，这个策略才是有效的</p><p><img data-src="https://wulc.me/imgs/mixrank_request_level.png" height="50%" width="50%"></p><p>而<strong>如果对 <span class="math inline">\(\Delta v^{+} + \Deltav^{-} &gt; 0\)</span> 做展开，可以得到下图的公式 (10)，而根据公式(10) 可以得到得到最优的 <span class="math inline">\(\pi_s\)</span>的思路是要找到一个 <span class="math inline">\(\pi_s\)</span>，使得<span class="math inline">\(v(s|\pi_s) - \rho_{thres} *w(s|\pi_s)\)</span> 最大，即下图（11）</strong></p><p>这是非常关键的一步，能够把一个跨请求的优化转为当前请求就能解决的优化的问题，因为<span class="math inline">\(v(s|\pi_s)\)</span> 和 <span class="math inline">\(\rho_{thres} * w(s|\pi_s)\)</span>都是当前请求就能得到的值</p><p><img data-src="https://wulc.me/imgs/mixrank_application_level2request_level.png" height="50%" width="50%"></p><h2 id="保序问题">保序问题</h2><p>混排中另一个常讨论的问题是，是否要对输入的队列保序；即输入的推荐队列和广告队列在混排后，内部是否保序，如广告队列[A1,A2,A3]在混排后，内部保序意味着整体队列会长这个样子 [...A1...A2...A3...]</p><p>直观来看，保序有两点比较重要的意义<u>（1）不影响各链路精排的迭代，即精排 auc的指标的迭代是有效，而如果在混排改了精排的序，是有可能导致精排 auc的不可读 （2）对于广告扣费，需要保证广告排序时按照 sorted_ecpm降序排列的，否则扣费会有问题</u></p><p>paper 则从拍卖机制出发，从 Incentive Compatibility (IC) 和 IndividualRationality (IR) 强调了保序的重要性</p><p>IC就是常说的激励兼容，具体来说，一个机制是激励兼容的，意味着当且仅当每个参与者在这个过程中真实表达自己的偏好时，能获得的效用比边际要更高，即这个机制就是鼓励参与者表达真实的价值预期，放在广告里就是bids truthfully。IR直译过来就是 “个体理性”，指的是每个参与者在参与拍卖机制时，其效用不低于不参与拍卖时的效用，即参与拍卖不会使参与者变得更糟，这两者的联系，用paper 的话是这么说的</p><blockquote><p>Formally, if every participant advertiser bids truthfully (i.e., bidsthe maximum willing-to-pay price), IR will guarantee their non-negativeprofits, and IC can further ensure that they earn the best outcomes</p></blockquote><p>那为什么这个跟保序有关？其实跟上面说的扣费原因是一样的，因为一旦破坏了序，意味着扣的钱就会发生变化，而这会破坏上面提到的IC 和 IR，更严格的理论可参考 <span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvTXllcnNvbiVFMiU4MCU5M1NhdHRlcnRod2FpdGVfdGhlb3JlbQ==">Myerson–Satterthwaitetheorem<i class="fa fa-external-link-alt"></i></span>， 这里不再详细展开</p><p>但是混排也不是完全不能改精排的序？因为混排有很多精排感知不到的context 信息（如上下文的推荐内容、位置等），因此在混排基于 context model重新预估 ctr、cvr（相当于让 ctr、cvr预估更准确），这种情况也是有可能改序的，但这种改序的同时也改了ecpm，也保证了 ecpm是递减的，也不违背上面说的问题，这种方式也是笔者认为在混排改序唯一合理的方式（但这种方式就存在死循环的问题，即如果改了序，context也会变，ctr、cvr 也要重新预估了）</p><h2 id="混排算法">混排算法</h2><p>整体的算法还是基于 beam search 的框架来做，如下图所示，下文的exposure template，均指的是基于 beam search 搜出来的候选 list</p><p><img data-src="https://wulc.me/imgs/mixrank_beam_search.jpg" height="50%" width="50%"></p><p>整体的算法如下图所示，第 6 行和第 9 行的公式 14 ，其实就是上图的公式12，即找到 <span class="math inline">\(v(s|\pi_s) - \rho_{thres} *w(s|\pi_s)\)</span> 最大的候选 list；12是对当前候选做剪枝，即把候选中突破了红线约束（如mingap）的候选排除，减少计算复杂度；13-14 行的含义是选择当前价值最大<span class="math inline">\(B\)</span> 个候选 list 进入下一步的search，比较标准的一个 beam-search 算法</p><p><img data-src="https://wulc.me/imgs/mix_rank_algorithm.jpg" height="50%" width="50%"></p><p>而在 beam search最终选择出来的候选中，最终决定是否要插入广告，会基于上面提到的application-level 求解出来的价值门槛 <span class="math inline">\(\rho_{thres}\)</span>，如下图所示</p><p><img data-src="https://wulc.me/imgs/mix_rank_beamsearch_final.jpg" height="50%" width="50%"></p><p>一个值得注意的问题是 <span class="math inline">\(\rho_{thres}\)</span>的求解频率，如果做天级更新，即根据过去 n 天数据计算一个 <span class="math inline">\(\rho_{thres}\)</span>然后在当天保持不变，容易出现的问题是当前流量如果有波动，容易导致 adload超或打不满；一种解决方法是提高求解 <span class="math inline">\(\rho_{thres}\)</span>的频率，同时使用更实时的数据来求解（eg 每小时求解一次，用过去 n个小时的数据），另一种解决方法就是在输出的 <span class="math inline">\(\rho_{thres}\)</span> 基础上再叠加一个pacer，调控实时的 adload，即当 adload超了就提门槛，反之降门槛（跟常见的调控 sorted_ecpm 门槛控制 adload一个道理）</p><h2 id="小结">小结</h2><p>paper 在当前业界广泛使用的 “list 价值评估 + beam-search”的混排框架下，考虑了在 adload约束下，整体价值（自然 + 广告）最大化的问题；相较于更常见的仅考虑广告侧信息控adload 的方法（如调整 ecpm 门槛），有创新的地方，而除了 adload约束，其他的约束也可以考虑利用这套建模和求解方法，来融入到整体的混排算法中</p>]]></content>
    
    
    <summary type="html">&lt;p&gt;之前写的&lt;a href=&quot;https://wulc.me/2023/02/26/%E6%B7%B7%E6%8E%92%E9%82%A3%E4%BA%9B%E4%BA%8B/&quot;&gt;混排文章&lt;/a&gt;，主要介绍了《Ads
Allocation in Feed via Constrained
Optimization》里的基本做法，同时拓展讨论了混排中的一些开放性问题，这篇 paper
解决的问题是 request 维度的插入规则，但是没有考虑到一些比较实际的约束如
adload，即出广告的比例是有限的&lt;/p&gt;
&lt;p&gt;而如果考虑到 adload 的约束，就不能只考虑 request
内的价值比较了，而是要考虑到 request 之间或者说 session
维度的价值最大化了，如在某些高价值请求上多出，低价值请求上少出或不出，以此达到
adload 约束下收入最大化。这篇 paper《&lt;span class=&quot;exturl&quot; data-url=&quot;aHR0cHM6Ly9hcnhpdi5vcmcvYWJzLzIyMDUuMTU3NTk=&quot;&gt;Hierarchically Constrained
Adaptive Ad Exposure in Feeds&lt;i class=&quot;fa fa-external-link-alt&quot;&gt;&lt;/i&gt;&lt;/span&gt;》为这个问题提供了一个解决思路；paper
整体做法还是 beam search 和 generator+evaluator
的混排范式，但是在这个过程中会把整体约束考虑到这个在线的求解过程中；相较于常规做法把控
adload 独立在混排之外，是一个比较好的思路，值得一读～&lt;/p&gt;</summary>
    
    
    
    <category term="计算广告" scheme="https://wulc.me/categories/%E8%AE%A1%E7%AE%97%E5%B9%BF%E5%91%8A/"/>
    
    
    <category term="计算广告" scheme="https://wulc.me/tags/%E8%AE%A1%E7%AE%97%E5%B9%BF%E5%91%8A/"/>
    
    <category term="机器学习" scheme="https://wulc.me/tags/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/"/>
    
  </entry>
  
  <entry>
    <title>Multi-channel Budget Allocation and Bidding</title>
    <link href="https://wulc.me/2024/12/22/Multi-Channel%20Budget%20Allocation%20and%20Bidding/"/>
    <id>https://wulc.me/2024/12/22/Multi-Channel%20Budget%20Allocation%20and%20Bidding/</id>
    <published>2024-12-22T13:37:39.000Z</published>
    <updated>2026-02-28T05:01:22.835Z</updated>
    
    <content type="html"><![CDATA[<p>最近一段时间在研究 multi-channel bidding 的问题，套用 Google Ads 的<span class="exturl" data-url="aHR0cHM6Ly9zdXBwb3J0Lmdvb2dsZS5jb20vZ29vZ2xlLWFkcy9hbnN3ZXIvMTI4NTA0NDg/aGw9ZW4="> PowerMore Conversions and Value through Cross-Channel Bid Optimization<i class="fa fa-external-link-alt"></i></span>是这么定义这个问题的</p><blockquote><p>Traditionally, advertisers have applied automated bidding tocampaigns that target a single channel. For example, they might use abid strategy that maximizes conversion value on separate campaigns forSearch, Display, and Video. But there are limitations to this siloedapproach. But multi-channel bid optimization can help you to drivebetter results compared to single-channel bid optimization by maximizingmarginal CPA or ROAS in each and every auction</p></blockquote><p>简单来说，就是一个计划在更多流量位上同时投放，能够更好优化预算的边际收益（marginalCPA orROAS），这个也很好理解，因为有了更丰富的流量库存，同一笔预算效率理论上是能做到更优的；这跟国内当前各个媒体平台近年提的 “通投”、“全站投放” 等产品，本质上也是类似的。这类产品广告主提供了使用门槛更低的产品，省去了广告主在不同channel分配预算或设置出价的过程，同时平台能够通过算法能力把预算的效率变得更高</p><p>从技术视角上来看，这里的 multi-channel 有两个问题值得讨论</p><p>（1）统一出价是否是最优的？如果不是，分 channel 出价要怎么做<br>（2）预算是否要显式分配到各个 channel</p><p>上面讨论的 multi-channel 的例子都是在一个大的平台下的channel，这种情况下各 channel的预算和出价是比较容易共享的；而另外一个常见的 multi-channel的定义是跨平台的，比如说很多广告主会同时在 google 和 meta 两个 channel投放，这个时候显然预算和出价是不能共享的；那站在广告主的视角下，怎么分配是最优的也是一个值得讨论的问题</p><p>本文主要讨论前者，即在同一平台的多个 channel 同时投放时，budgetallocation 和 bidding的相关问题；同时会提一下在不同平台（channel）投放时的一些研究，祝开卷有益～</p><span id="more"></span><p>上面提到，在同一平台上的多 channel投放，有两个问题需要解决，一是出价，即是否要分 channel独立出价；二是预算分配，即是否要限制各个 channel使用的预算，下面分别谈一下这两部分</p><h2 id="统一出价-vs-分-channel-出价">统一出价 vs 分 channel 出价</h2><p>在 multi-channel 中常见的一个问题是，统一出价（即在各个 channel中使用同一个出价）是否是最优的</p><p>直观来看，把所有 channel当做一个整体的广告位，然后统一来出价似乎是比较合理的？但如果进一步分析，结论不一定如此；可以粗略把出价产品分为成本类出价和非成本类出价</p><p>对于成本类出价（如 target-cost、cost-cap），往往是基于后验做bidding，这一做法本质上是在为模型预估不准做兜底；当各个 channel的模型预估准确时，统一出价是最优的，但这一点往往很难成立，更常见的情况是在channel A 高估，在 channel B低估，或者高估程度不太一致；而如果仅靠一个统一的出价，无法很好处理各个channel 高低估不一致的问题，比如说统一提价能解决低估的 channel问题，但是会加剧高估 channel 的问题</p><p>非成本类出价（如 lowest-cost）没有上面的问题，但非成本类往往会通过budget allocation 来间接控制成本，而 budget allocation曲线的一个很重要的信号就是 channel的流量分布，会倾向于把预算更多分配到流量更多的时间片，而各个 channel的流量分布往往是不一致的，即各个 channel的最优预算分配曲线往往也是不一致的</p><p>因此，无论是成本类出价还是非成本类出价，比较合理的的做法往往是各个channel 独立出价，而这又有常见的两种方式</p><p>（1）所有 channel 的出价都独立，即独立搜集数据，独立 pacing<br>（2）基于所有 channel 的后验计算出一个基础的出价，然后各个 channel基础的出价上再做扰动</p><p>选择哪种方式，也跟出价类型、数据稀疏程度等因素有关</p><p>成本类出价理论上两种方式都可用，如 target-cost 和 cost-cap这一类产品，广告主是有明确的成本目标 / 限制的，各个 channel只要锚定广告主明确的诉求，其实就可独立做出价，这里还有个问题是数据的稀疏程度，方式（1）有效的前提是各个channel 的后验数据都比较充足，否则数据过于稀疏冷启问题会比较严重</p><p>而对于 lowest-cost 这一类非成本类出价的产品，使用方式 1就有点困难了，主要原因有两个</p><p>一是方式 1 要求每个 channel的预算是明确的，但这在通投场景是没有的（可通过算法分配一个，后面预算分配会提到）<br>二是 nobid 虽然没有明确的成本约束，但是 channel之间的成本差异不能过大，一个很直观的想法是，成本更高的 channel向成本更低的 channel 的成本看齐，这样会就是一个动态的 target-cost产品，且预算花完是没有保证的；因此实际中往往是一个主 channel负责把钱花完，其他 channel 把成本对齐主 channel</p><p>综上，<em>这部分基本的观点是分 channel 出价在实际中往往是更优的，而分channel 出价是否要做到各 channel完全独立，取决于多种因素。在广告主明确表达了成本的产品上，理论上是可以做到完全独立出价的，但需要各channel 后验数据充足；lowest-cost 因为没有显式的分 channel预算，做独立出价有点难，最直观的做法是在主 channel的出价基础上做一些扰，做成一个动态 target-cost （主 channel的成本）的产品，后面也会提到的一个做法是在不同 channel之间做预算分配</em></p><h2 id="预算分配">预算分配</h2><p>预算分配跟出价是紧密相关的，尤其是对于 lowest-cost这一类出价，预算分配是最主要的调控手段；这里的预算分配的主要问题是预算是否要显式分到各个channel；而这部分的做法同样跟具体的出价类型相关</p><h3 id="成本类出价">成本类出价</h3><p>对于 target-cost 或 cost-cap 这一类有广告主明确的 given_cpa的出价，由于是有明确的成本目标，理论上是可以共享预算，即各个 channel都锚着固定成本去 pacing后验成本达到这个目标，这种情况下不需要对预算做显式的划分，哪个 channel能在 given_cpa的约束下能花更多的钱，这个渠道就是更优的；不过共享预算 + 基于后验 pacing的 target-cost 也有一些其他问题</p><p>除了上面说的数据稀疏，基于后验成本 pacing的成本类出价一直面临的另一个挑战是，后验数据回传延迟（delayedfeedback）问题，这个问题会导致当前计算的后验成本不准确，往往需要建模来解决（模型也会面临这个问题，关于这个问题的一些解决方法可参考 <a href="https://wulc.me/2020/12/05/Delay%20FeedBack%20In%20Computational%20Advertising/">DelayedFeedBack In Computational Advertising</a>）</p><p>也有业界的做法是做了预算的划分的，比如说这篇 paper 《<span class="exturl" data-url="aHR0cHM6Ly9kbC5hY20ub3JnL2RvaS8xMC4xMTQ1LzM2Mzc1MjguMzY3MTU0MA==">SpendingProgrammed Bidding: Privacy-friendly Bid Optimization with ROIConstraint in OnlineAdvertising<i class="fa fa-external-link-alt"></i></span>》，就是对成本类出价的预算做了划分，并且通过实验验证效果是更优，文章建模的思路挺值得学习的</p><p>SPB大致的做法就是先基于后验数据（不一定要非常实时，整体还是要考虑数据的时效性与有效性的trade_off），离线建模 cost2convert 的函数，然后基于 given_cpa 计算一个budget，最后基于预算分配曲线把 budget花完，这样理论上收到上面的影响会更小，paper 中的是这么说的</p><blockquote><p>SPB is a two-stage framework that separates long horizon deliveryspend planning (the macro stage) and short horizon bidding execution(the micro stage). The macro stage models the target ROI to achievemaximum utility and derives the expected spend, whereas the micro stageoptimizes the bid price given the expected spend.</p></blockquote><p>这个方法的关键点是建模 cost2convert 的函数 <span class="math inline">\(f(cost) =convert\)</span>，常见的一个<strong>先验假设是随着 cost增加，转化数的增加速度逐渐减小，或者说边际成本是逐步增加的</strong>，如下图所示（横轴是消耗，纵轴是转化数）；这个假设也比较直观，因为对于一个计划而言，便宜的转化拿完了，需要出更高的价才能拿得到转化，转化成本是随之增加的</p><p><img data-src="https://wulc.me/imgs/cost2convert.jpg" height="50%" width="50%"></p><p>根据上面的定义，可以得到成本的公式为 <span class="math inline">\(\frac{cost}{f(cost)}\)</span>,而边际成本则是上面曲线的斜率的倒数即 <span class="math inline">\(\frac{1}{f'(cost)}\)</span>，基于上面的边际成本随着cost 逐步增加的假设，可以进一步假设边际成本与转化数 <span class="math inline">\(f(cost)\)</span>成线性关系（实际中不一定是线性，保证是递增的关系即可）, 如下所示，其中<span class="math inline">\(\omega\)</span> 和 <span class="math inline">\(b\)</span> 是需要拟合得到的参数</p><p><span class="math display">\[\frac{1}{f'(cost)} = \omega *f(cost) + b\]</span></p><p>通过如下推导</p><p><img data-src="https://wulc.me/imgs/cost2convert_deduce.jpg" height="50%" width="50%"></p><p>可以得到 <span class="math inline">\(f(cost)\)</span>的形式为 (这里省略了常数 <span class="math inline">\(C\)</span>, 且因为<span class="math inline">\(f(cost)\)</span>不会为负数，因此只取了为正数的那一项)</p><p><span class="math display">\[f(cost) = \frac{\sqrt{2 * \omega * cost+ b^2} - b}{\omega}\]</span></p><p>上面的推导，其实也可以直接基于边际成本上升直接给 <span class="math inline">\(f(cost)\)</span> 一个先验的函数形式，这里是直接对斜率做了假设然后推导的，但其实跟直接的假设没有多大的本质区别</p><p>利用客户给定的 given_cpa, 可以得到下面的等式</p><p><span class="math display">\[given\_cpa = \frac{cost}{f(cost)} =\frac{\omega * cost}{\sqrt{2 * \omega * cost + b^2} - b}\]</span></p><p>进一步求解上面的方程可得到分配的预算为</p><p><span class="math display">\[cost = \frac{(2 * given\_cpa - b)^2 -b^2}{2 * \omega}\]</span></p><p>因此，只要通过历史数据拟合得到 <span class="math inline">\(\omega\)</span> 和 <span class="math inline">\(b\)</span>，就能沟通过客户给定的 given_cpa得到规划的预算</p><p><strong>上述的方法应用到多个 channel 的情况，可以为每个 channel拟合出自己的 <span class="math inline">\(\omega\)</span> 和 <span class="math inline">\(b\)</span>，然后基于上面公式来计算每个 channel应该分配的预算</strong></p><p>但这种方式也有其局限性，首先这种建模的精度不一定是非常准确的（因为如果能够准确建模出cost2convert的关系，相当于可以预估计划的实际成本了）；其次是假设的先验形式，在实际中不一定是所有的计划都服从这样的形式（分段线性拟合的能力理论上要比这种纯先验的要好一些），甚至不都服从随着cost 增加，边际成本上涨的假设；其次是由于 cost2convert对转化数有要求，因此在 convert数不足时，需要走探索出价，只有在转化数置信后才能建模</p><h3 id="非成本类出价">非成本类出价</h3><p>在统一出价中提到，对于 lowest-cost这一类非成本类出价的产品，使用完全独立出价有点困难了，主要原因是这种方式要求每个channel的预算是明确的，但这在通投场景是没有的明确的预算分配，那能不能通过算法算出一个？我们在上面的 SPB 的 paper里提到的计算过程，不就是一个分配预算的过程么？能否复用上面的方法呢</p><p>对于 lowest cost 这类没有广告主给定的出价，没有given_cpa，理论上没法直接套用上面的那种模式；但我们能否给定一个 margin_cpa作为 given_cpa，然后做到预算花完的前提下 margin_cpa最小？答案是可以的，首先看上面 cost2convert 的形式</p><p><span class="math display">\[f(cost) = \frac{\sqrt{2 * \omega * cost+ b^2} - b}{\omega}\]</span></p><p>如果直接看这个函数，大概长下面这个样子的；从红线到黑线，代表 <span class="math inline">\(\omega\)</span> 从 1 变成了 3，<span class="math inline">\(b\)</span> 不变，从红线到绿线，代表 <span class="math inline">\(b\)</span> 从 1 变成了 5.2, <span class="math inline">\(\omega\)</span> 不变，两者在花相同的 cost前提下，转化数都更少了，即转化成本上涨了</p><p><img data-src="https://wulc.me/imgs/cost2convert_formula.jpg" height="80%" width="80%"></p><p>因为前面的推导中有个假设是边际成本与转化数 <span class="math inline">\(f(cost)\)</span> 成线性关系（如下所示），则 <span class="math inline">\(\omega\)</span> 和 <span class="math inline">\(b\)</span>的上涨就代表了成本的上涨，或者说<strong>每个 channel 拟合出来的 <span class="math inline">\(\omega\)</span> 和 <span class="math inline">\(b\)</span>代表了其转换成本的高低情况</strong>，<span class="math inline">\(\omega\)</span> 和 <span class="math inline">\(b\)</span> 越大，代表成本越高</p><p><span class="math display">\[\frac{1}{f'(cost)} = \omega *f(cost) + b\]</span></p><p>而从最终的预算分配公式可知，<u>一个 channel <span class="math inline">\(\omega\)</span> 和 <span class="math inline">\(b\)</span>越大，分得得预算会越少，代表整体算法会把预算更多分配到成本更低的 channel上</u></p><p><span class="math display">\[cost = \frac{(2 * given\_cpa - b)^2 -b^2}{2 * \omega}\]</span></p><p>同时从上面的公式可知，<span class="math inline">\(cost\)</span> 和given_cpa 是正相关，given_cpa过低，能够花出去的钱也少，因为便宜的转化就那么多；<strong>有了这个单调性的特性，就可以通过二分查找的方式来找个一个最小的margin_cpa，使得预算能刚好花完</strong></p><p>基于这个查找到的 margin_cpa，便能够套用上面公式计算出各个 channel 的budget，然后基于这个分配好的 budget，lowest-cost这类出价能够很自然地做预算分配来出价投放</p><h2 id="跨平台的-multi-channel">跨平台的 multi-channel</h2><p>上面说的都是在同一个平台的 multi-channel的预算分配和出价，也有一些研究是针对多平台的 multi-channel的预算分配</p><p>这篇 paper 《<span class="exturl" data-url="aHR0cHM6Ly9hcnhpdi5vcmcvYWJzLzIzMDIuMDE1MjM=">Multi-channelAutobidding with Budget and ROI Constraints<i class="fa fa-external-link-alt"></i></span>》就是站在广告主视角下，如何通过设置各个 channel 的 budget 和 roi来达到营销效果的最优（这也是广告主唯二影响他们投放效果的手段）</p><p>论文的篇幅比较长，这里重点说一下论文的一个核心结论：<strong>Solelyoptimizing per-channel budgets are sufficient to maximizeconversion</strong>，即只优化各个 channel 的 budget 便能做到 maxconversion，理论证明过程比较复杂，这里就不详细展开了，套用 paper的话是这么说的</p><blockquote><p>In Theorem 3.2 of Section 3, we show that solely optimizing forper-channel ROIs is inadequate to optimize conversion across allchannels possibly resulting in arbitrary worse total conversionscompared to the hypothetical global optimal where advertisers canoptimize over individual auctions. In contrast, in Theorem 3.3 andCorollary 3.4 we show that solely optimizing for per-channel budgetsallows an advertiser to achieve the global optimal.</p></blockquote><p>在上面的结论基础上，paper 设计了一个算法，用于做各个 channel的预算分配，整体算法流程如下图所示</p><p><img data-src="https://wulc.me/imgs/sgd_ubc_algo.jpg" height="50%" width="50%"></p><p>这个算法结合了 SGD 和 UCB，整体目标是在 budget约束下最大化总转换数；这里基本就是套用了 Multi-Arm Bandits的范式，将连续预算空间离散化为有限臂（候选预算值），然后基于 MAB的探索与利用机制：迭代选择臂、观测反馈、更新统计信息，优化预算分配策略；不同的点是引入了对偶变量和sgd（上图的公式 10），用来处理预算约束，传统的 MAB 没有涉及到这一点</p><p>但是回到实际中，对于各类广告主尤其是 SMB这种中小广告主，如果想直接用这个方法是比较困难的，因为使用门槛会比较高；而实际中，广告主往往会先在各平台投一小笔钱看效果，然后根据各平台效果再决定在哪个平台投入更多的预算，这其实跟上面的SGD_UCB 算法的模式也比较像，只是精度没有那么高</p><h2 id="小结">小结</h2><p>本文主要讨论了同一平台下 multi-channel下的出价和预算分配问题；无论是成本类出价还是非成本类出价，比较合理的做法往往是各个channel独立出价；而对于成本类出价或非成本类出价，都有两种技术范式，选择哪种基本得看哪种更适合当前业务现状，而这基本又得靠实验来决策了</p><p>对于成本类出价，理论上是可以共享预算，然后独立 channel来搜集数据和出价；但除了这种方式，另一种技术范式就是类似 SpendingProgrammed Bidding 这种算法：通过建模 cost2convert 的关系，然后基于given_cpa 在不同 channel 之间做显式的预算分配</p><p>非成本类出价同样也有两种技术范式，一种是共享预算，然后以一个主channel 的成本作为后验成本，当做一个动态 target-cost产品；另一种也是借鉴类似上面的预算分配的思路，通过搜索出一个margin_cpa，套用同样的算法，来在不同 channel之间做预算分配，然后基于预算分配曲线来投放</p>]]></content>
    
    
    <summary type="html">&lt;p&gt;最近一段时间在研究 multi-channel bidding 的问题，套用 Google Ads 的&lt;span class=&quot;exturl&quot; data-url=&quot;aHR0cHM6Ly9zdXBwb3J0Lmdvb2dsZS5jb20vZ29vZ2xlLWFkcy9hbnN3ZXIvMTI4NTA0NDg/aGw9ZW4=&quot;&gt; Power
More Conversions and Value through Cross-Channel Bid Optimization&lt;i class=&quot;fa fa-external-link-alt&quot;&gt;&lt;/i&gt;&lt;/span&gt;
是这么定义这个问题的&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;Traditionally, advertisers have applied automated bidding to
campaigns that target a single channel. For example, they might use a
bid strategy that maximizes conversion value on separate campaigns for
Search, Display, and Video. But there are limitations to this siloed
approach. But multi-channel bid optimization can help you to drive
better results compared to single-channel bid optimization by maximizing
marginal CPA or ROAS in each and every auction&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;简单来说，就是一个计划在更多流量位上同时投放，能够更好优化预算的边际收益（marginal
CPA or
ROAS），这个也很好理解，因为有了更丰富的流量库存，同一笔预算效率理论上是能做到更优的；这跟国内当前各个媒体平台近年提的 “通投”、“全站投放” 等产品，本质上也是类似的。这类产品广告主提供了使用门槛更低的产品，省去了广告主在不同
channel
分配预算或设置出价的过程，同时平台能够通过算法能力把预算的效率变得更高&lt;/p&gt;
&lt;p&gt;从技术视角上来看，这里的 multi-channel 有两个问题值得讨论&lt;/p&gt;
&lt;p&gt;（1）统一出价是否是最优的？如果不是，分 channel 出价要怎么做&lt;br&gt;
（2）预算是否要显式分配到各个 channel&lt;/p&gt;
&lt;p&gt;上面讨论的 multi-channel 的例子都是在一个大的平台下的
channel，这种情况下各 channel
的预算和出价是比较容易共享的；而另外一个常见的 multi-channel
的定义是跨平台的，比如说很多广告主会同时在 google 和 meta 两个 channel
投放，这个时候显然预算和出价是不能共享的；那站在广告主的视角下，怎么分配是最优的也是一个值得讨论的问题&lt;/p&gt;
&lt;p&gt;本文主要讨论前者，即在同一平台的多个 channel 同时投放时，budget
allocation 和 bidding
的相关问题；同时会提一下在不同平台（channel）投放时的一些研究，祝开卷有益～&lt;/p&gt;</summary>
    
    
    
    <category term="计算广告" scheme="https://wulc.me/categories/%E8%AE%A1%E7%AE%97%E5%B9%BF%E5%91%8A/"/>
    
    
    <category term="计算广告" scheme="https://wulc.me/tags/%E8%AE%A1%E7%AE%97%E5%B9%BF%E5%91%8A/"/>
    
    <category term="机器学习" scheme="https://wulc.me/tags/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/"/>
    
  </entry>
  
  <entry>
    <title>爬过第二座山</title>
    <link href="https://wulc.me/2024/10/03/%E7%88%AC%E8%BF%87%E7%AC%AC%E4%BA%8C%E5%BA%A7%E5%B1%B1/"/>
    <id>https://wulc.me/2024/10/03/%E7%88%AC%E8%BF%87%E7%AC%AC%E4%BA%8C%E5%BA%A7%E5%B1%B1/</id>
    <published>2024-10-03T13:53:19.000Z</published>
    <updated>2026-02-28T05:01:22.863Z</updated>
    
    <content type="html"><![CDATA[<p>最近听了情感播客《面基》的两期关于中年的播客：《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY2ODM1ZjgwY2RkMjMwYjIzYjk2MTk3Mg==">中年，人生的第二座山<i class="fa fa-external-link-alt"></i></span>》和《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY2ZjI4YzM1MmFkZmU0OGI4MzE3YWM5Nw==">中年之路上的四种觉醒<i class="fa fa-external-link-alt"></i></span>》后，也看了提及的几本相关的书:《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zNTA0ODUzMS8=">第二座山<i class="fa fa-external-link-alt"></i></span>》、《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zNjEzOTM5MS8=">中年之路<i class="fa fa-external-link-alt"></i></span>》、《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zNjg3MDAyNC8=">中年觉醒<i class="fa fa-external-link-alt"></i></span>》以及一些研究报告；颇有感触，想写点东西来记录一下，于是有了这篇文章</p><p>每次读到这类内容，都会有一种错觉，似乎听完后就可以合理化自己躺平，给自己不努力找一个借口；因为一命二运三风水、命运无常，在随机性面前的我们似乎无能为力（比较扎心的是，这的确是一个不争的事实）；但这并不意味着我们要躺平，原因在之前写的《<a href="https://wulc.me/2023/02/05/%E5%81%9A%E4%B8%80%E4%B8%AA%E6%B8%85%E9%86%92%E7%9A%84%E5%82%BB%E7%93%9C">做一个清醒的傻瓜</a>》中也提到了：<strong>“在努力还没达到一定程度前，我们连面对随机性的机会都没有，或者说幸存者偏差也是有门槛的，当你的能力不足时，进入决赛圈的资格都没有”</strong></p><p>本文是写给自己的心理按摩，是为了让自己在 “尽人事” 后，能够更坦然地 “听天命”；是为了能在面对人生的第二座山的时候，能够更加从容；祝开卷有益～</p><span id="more"></span><h1 id="神奇的-35-岁">神奇的 35 岁</h1><p>35 岁在我国似乎是个神奇的节点，青山资本的这份报告《<span class="exturl" data-url="aHR0cHM6Ly9tcC53ZWl4aW4ucXEuY29tL3MvYUVSRUFzRG50ck9lRE1paWU1dkU0QQ==">35 岁，中国式中年丨青山资本 2022 年度消费报告<i class="fa fa-external-link-alt"></i></span>》，里面就提到了大量的事实表明，无论是在各种政策（如购房、深造、落户、创业等）、婚育、职场里，35岁都是一个重要的分水岭</p><h2 id="社会时钟的转折点">社会时钟的转折点</h2><p>35岁仿佛就是我国社会时钟的一个重要转折点，社会的政策、婚育观点、以及备受关注的职场等都会在这个时间节点迎来一个重要转折</p><p>在买房、深造、落户、创业等各种政策里，几乎都提到了 “35 岁” 这个关键词</p><blockquote><p>嘉兴：购房时 35 周岁以下的全日制普通高校本科毕业生可使用 15 万元人才房票<br>济宁：就业的硕士（不超 35 周岁）3 年内购首套房可发放购房补贴 6 万元<br>长沙：35 周岁（含）以下的硕士首次购房一次性给予最高 5 万元购房补贴，35 岁以下博士首次购房的购房补贴由 6 万提高到 10 万</p><p>公派留学，博士申请需为 “不超过 35 岁具有硕士学位”</p><p>温州 “35 周岁以下中级工可先落户后择业”</p><p>九江修水 “对 35 周岁以下全日制高校毕业生给予每人 1000 元落户奖，提供‘拎包入住’人才公寓”</p></blockquote><p>婚恋市场上也是这样，到了一定年龄尚未婚配的年轻人，难免被家庭和社会催婚。往往一开始年轻人需要和长辈激烈辩论，但在斗争了几年后会出现一个神奇的现象：<u>突然有一天长辈不再唠叨催促了，朋友也不再热心介绍对象了，因为大家心里有一条年龄底线，过了这条线还不婚配的人，就默认为在婚介市场上已经失去了价值，打上了不必再劝的标签</u>。催婚有 35 岁的心理线，催育更有 35 岁的警戒线。各类医学研究中都将 35 岁作为高龄产妇分界线。35 岁不生孩子，基本被视为丧失了怀孕生育的可能性，除非 “上科技”</p><p>职场上这种现象则更为明显，互联网行业是近年职场里常被提及的吃 “青春饭” 的职业，但除了程序员头上悬挂着 “35 岁” 的这把达摩克利斯之剑，军人、主播、运动员，也面临类似困境，解放军作战部队在到达营长之前、非作战部队在到达连长之前，35 岁是最高服役年龄；欢聚时代一份主播年龄统计显示，35 岁以上的主播仅占 7%。运动员的退役年龄绝大部分也在 35 岁以前</p><p>甚至在一些领域如公务员报考，35岁就是一个硬门槛，94 年颁布的《国家公务员录用暂行规定》要求报考者必须 “年龄为三十五岁以下”，直到2024 年，才把这个门槛放开至 40周岁以内（针对硕士、博士研究生）。但公务员招聘的示范效应，使得事业单位的考编、大学招聘教师也出现了 35 岁上限的要求，大部分央企、国企乃至部分民营企业也逐渐习惯性地将不超过 35 岁作为岗位录用的标准</p><h2 id="为什么偏偏是-35">为什么偏偏是 35</h2><p>面对这个神奇的社会时钟转折点，我们不禁会问，为什么偏偏是 35</p><p>创造 “中年危机” 一词的是美国精神分析学家艾略特・贾克，当时是 1965 年，而研究的研究出发点很简单：人的生命旅程过半时会意识到自己必然迎来死亡，生命有限、能力有限，因此便有危机感。在当时的人均寿命刚超过 70 岁，以及女性大量进入职场对男性造成一定的挤压，在七八十年代的美国媒体频发男性中年危机的文章，以及无数情绪共鸣下，造词宣告成功</p><p>中国流行 “中年危机” 则是从 90 年代开始，最早的媒体记录是 1994 年出现的，之后情绪共鸣开道，媒体深入报道。报告提到一个诡异的现象：<em>55 个国家的人在 46 岁时心态陷入最低谷，中国则提前了 10 年</em></p><p>在不同国家的就业市场上，年龄收入曲线都呈现倒 U 型分布，倒 U 型顶部的年龄称为 “goldenage (黄金年龄)” <u>美国和中国的 2000 年以前，“黄金年龄” 稳定在 50-55 岁左右。2000 年以后美国继续不变，但中国的黄金年龄不断下降，到 2005 年以后降至 35 岁</u>，如下图所示，配图来自<span class="exturl" data-url="aHR0cHM6Ly93d3cubmJlci5vcmcvcGFwZXJzL3cyOTUyMw==">“GOLDEN AGES”:A TALE OF THELABOR MARKETS IN CHINA AND THE UNITED STATES<i class="fa fa-external-link-alt"></i></span></p><p><img data-src="https://wulc.me/imgs/golden_age.jpg" height="50%" width="50%"></p><p>我们曾默认劳动者随着工作年龄更长，经验增加，理所应当要拿到更高的回报，<strong>这种想法其实扎根于技艺意识、匠人意识，思路的本质是生产非标化</strong></p><p>但是工业化就是要打破非标，因为这是整个社会提升生产效率、降低生产成本的重要途径；工业化意味着标准化生产流程、自动化流水线、固定化设备，劳动力此时如同 “螺丝钉”，被打上了工业化的关键设定 ——“可替代性”。流水线要能正常运转，最可靠的办法是<strong>消除每个环节的非标准性和不可替代性</strong>，在所有时代都如此；而这也许就是 “危机” 的开始，这两年AIGX的快速发展给各个行业带来的危机，跟第一次工业革命里的纺织工人面对蒸汽机时感受到的危机，并无二样</p><p>当工业化进程逐渐发达，市场的必要性就突出了，用企业这种组织形式完成生产，加上用市场经济这种方式配置资源，成了最有效的发展方式；<u>我国的工业化进程在 1994 年市场化改革的深入后加速推进，非国有企业快速增长，1996 年，人事部《国家不包分配大专以上毕业生择业暂行办法》宣布大学生包分配制度正式退出历史舞台，1998 年至 2000 年，国有企业共下岗职工 2137 万人</u>，98年的大下岗，劳动力从生产设计的可替代化，变成了真正意义上可以随时替代掉的人，也让很多人意识到第一次真正意识到，没有铁饭碗，工作是可以丢掉的</p><p><strong>市场经济带来优胜劣汰，有下岗、有裁员，也就有了职场和就业的压力与危机</strong>。一言以蔽之，94 年之后劳动力要竞争上岗，用人单位需要选择性价比最高的劳动力，劳动力的职业发展有压力了</p><p>在 “GOLDEN AGES”:A TALE OF THE LABOR MARKETS IN CHINA AND THE UNITEDSTATES，将工资随着年龄变化的原因分解成三个部分：<em>工作经验、时间效应（不同年份的平均工资水平变化）和队列效应（每个世代的劳动者能力差异）</em>；研究显示美国不同年代的时间效应和队列效应很小，但在中国这两者影响巨大。如下图所示</p><p><img data-src="https://wulc.me/imgs/age_earnings_profiles.jpg" height="50%" width="50%"></p><p>从图中清晰可见，<u>大约从2005 年开始，35 岁开始工资随着年龄增长而下降。但美国不是这样，中国在 21 世纪以前也不是这样</u>。从生理上来说，35 岁并不是身体和心理素质全面转衰的开始，全球范围内中年危机往往也是在四五十岁才逐渐显现；而<strong>中国近二十年的 “35 岁危机”，有着更独特的背景原因：产业结构、劳动者教育水平高速变化而带来的劳动力价值高点前移现象</strong></p><p>从 94年至现在，我国的产业结构持续保持着 <em>“第一产业下降，第二产业缓慢增长，第三产业高速增长”</em> 的态势，互联网、金融业、地产、租赁和商务服务、科技服务、交通物流业一直呈现增长趋势，其中尤其以互联网、金融为代表，逐渐成为最有前景最受关注的产业，这些逐渐变得更重要的新经济相关行业都有一个共同的特点：相关知识和技术更迭非常快</p><p><strong>在这样的产业发展中发挥作用需要依赖优秀的学习能力和开放的心态，并且越年轻的互联网、移动互联网以及人工智能时代的 “原住民” 越有前人难以匹敌的优势</strong>。因此，年轻人逐渐成为更受青睐的选择，有经验的劳动者的价值意义下降。从这个角度来看，“35 岁危机” 来自于拿着 25 岁学的东西去面对当下的市场</p><p>对于学习新事物的开放性，英国科幻作家道格拉斯这样形容人性</p><blockquote><p>任何在我出生时已经有的科技，都是稀松平常世界本来秩序的一部分；任何在我 15-35 岁之间诞生的科技，都是会改变世界的革命性产物；任何在我 35 岁之后诞生的科技，都是违反自然规律要遭天谴的！</p></blockquote><p>因此，这样的产业结构的变化让新的主力产业对劳动力提出了更新的要求 —— 体力、心力、学习迭代能力，这些让年轻人成为了更合适的劳动力，也让我国的的人力资本高峰慢慢地从四五十往左移到了三十五</p><h1 id="人生的两座山">人生的两座山</h1><p>第二座山这个概念，来自这本书《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zNTA0ODUzMS8=">第二座山<i class="fa fa-external-link-alt"></i></span>》</p><blockquote><p>我们每个人都在攀登人生的两座山。如果说第一座山是关乎构建自我和定义自我的，那么第二座山则是关乎摆脱自我和舍弃自我的。如果说第一座山是关乎获取的，那么第二座山则是关乎奉献的。如果第一座山是精英式的独自攀登，那第二座山则是置身于有需要的人之间，并与他们手携手同行</p></blockquote><h2 id="第一座山">第一座山</h2><p>对于绝大部分的人来讲，第一座山的攀登会在读书择校、毕业是找工作出现，正处于鲜衣怒马少年时的学生，如果你去问他们当前最大的目标是什么，基本都会给出清一色的答案，找个好学校或好工作。名校光环、体面的工作，似乎成了第一座山的山顶</p><p>这当然无可厚非，因为那个就是绝大多数人所追求的阶段性目标和任务；对于绝大部分的毕业生包括笔者，在毕业的时候最大的问题是生存焦虑，彼时会像抓住救命稻草一样，抓住人生中的第一份工作，经历了一轮轮激烈的校招竞争后，然后开始在一个环境里勤勤恳恳地工作；至于自己该做什么、想成为什么样的人这些问题，会被压制在意识的水平线以下，暂时不重要，公司需要我成为什么样的人，我就成为什么样的人</p><p>老钱在播客里是这么说的，“北京的群山中，公司让我爬哪座山我就爬哪座。世界说我是什么我就是什么，我要付房租，要有积蓄，要生活，要年底给家里面打一笔钱，我变成了一个公立的实用主义者。‘怎样才能成功’很快战胜了‘我为什么要这么做’，我成了自己的老板，也成了自己的员工，实现了韩炳哲口中的自我剥削”</p><p>事实上，<strong>每一个人在攀爬第一座山时，都是在建立自己的社会身份的过程，也是走向自立的过程</strong>；离开父母、培养自己、完善自己，让自己有自力更生的能力，并且努力在这个世界上留下印记。此时大多数人需要的不是一个饱满的灵魂，而是拥有一套效率最大化的专业技能，成为一个精简的专业人士</p><p>这个过程让我们有各种名牌可以依附：上过的名校、取得的头衔。阶段性地说，这些东西都比寻找自我更重要，<em>第一座山和它所象征的成功学和精英制度，鼓励大家进入一种社会喜欢但也许我们个人并不喜欢的生活，一种并没有安全感但看起来又挺成功的状态</em>；我们热衷于在各个参考系中寻找自己的位置和排名，经常拿自己和别人比较，被自己的幻想所困扰，也会去羡慕别人的辉煌和快乐</p><p>有些人一直在爬第一座山，有些人已经在某种意义上登顶了，但是不可避免地，大家都会走向下山这条路。下山的路并不好走，走上坡辛苦，但下坡路走起来痛苦；但是再想想<em>能走下去，而不是滚下去，不是坠下去，这又何尝不是一种幸福</em>？而在谷底处，我们又能看到另一座更大的山，那是我们人生的第二座山</p><h2 id="第二座山">第二座山</h2><p>山谷并不只意味着人生低谷，它更像是一种心态、能量、思维层面的匮乏力。我们在第一座山中获得的财富、名望和成就并不能让任何人远离山谷，它更像是人生的一段必经路。<u>在山谷，我们不可避免会经历痛苦，它有很多形式，比如疾病、亲人的离世、意义感的丧失、失败、失业、重大亏损等等，攀登第一座山时所获得的各种名牌可能都会荡然无存。当然，痛苦也可能来得没那么有戏剧性，它可能是一种潜移默化的萎靡不振，对工作的麻木，对生活失去掌控感，被惯性主导</u></p><p>人生的低谷固然不好过，但恰恰是在低谷中我们塑造了自己。因为<em>痛苦和挫折，能够让我们看清平常生活中那些肤浅的一面，进一步的，我们能借此看到更深层次的自己，并慢慢发现我到底想要什么</em>；这是脱离了 “等我XXX，就会 XXX” 的答案，因为外部条件并不会回答内心中 “a why to livefor”，而有了这个 why，才能去忍受生活丢给我们的各种fxxking；而这也是尼采口中的 “一个人知道自己为什么而活，就可以忍受任何一种生活”，而这就是我们第二座山的起始点</p><p><strong>每个人的第二座山都不尽相同，但可以肯定的是，爬第二座山的意义是我自己赋予的，而不是世界赋予的</strong></p><blockquote><p>世界告诉我，要应该成为一个好的消费者，但也许我就是想过上很简单的低欲望的生活<br>世界告诉我应该独立自主，但是我就是想沉溺于温暖的人际关系网中<br>世界告诉我应该追求自由，但是我就是想要更多羁绊，对家人的责任和承诺<br>世界告诉我应该攀登阶梯，追求成功，但也许我就是想为别人而活</p></blockquote><p><strong>也许四十不惑，不光是没有困惑，也是不被诱惑</strong>，不被五光十色的世界诱惑，不被别人多彩多样生活诱惑，不被普世的价值观诱惑</p><p>穿过了人生的低谷，我们就有足够的勇气去放弃部分以前的自己。某种程度而言，爬过第一座山，努力过，跋涉过，走过下坡路，才会有深刻体会。走过下坡路，才会意识到，原来第一座山并非我所愿，山外还有另一座更大的山，那才是我的追求，那是我人生的第二座山</p><h1 id="爬过第二座山">爬过第二座山</h1><p>如何找到并爬过第二座山，播客以及书里都给了一些方法论，这里我愿意将其总结为：<strong>四种觉醒、三个老板和N 条出路</strong></p><h2 id="四种觉醒">四种觉醒</h2><p>播客将《中年觉醒》书里的内容总结成了四种觉醒：分别是智慧、观念、心态和关系</p><h3 id="智慧">智慧</h3><p>在爬第一座山的时候，无论是否已经登顶，无论是否原因，我们都会不可避免地走下坡路，哪怕再功成名就的人，也难逃斜率向下的宿命</p><p>《中年觉醒》这本书提到，统计数据发现科学家们常常在自己 30多岁时做出了伟大的发现；但是在 40 多岁、 50 多岁、 60多岁这几个时间段里面，有重大突破的可能性就急剧下降。一个人在 70岁时做出重大创新的概率，和 20 岁时差不多的都几乎为零，那原因是什么？</p><p>一个解释是，我们大脑的前额叶皮质的性能会随着时间而发生变化，<u>前额叶皮质是我们同年时期大脑发育最晚的一部分，但成年以后它又是最早开始衰退的习惯。它主要负责工作、记忆、执行能力，还有屏蔽与手头任务无关的信息。只有它足够强大，我们才能集中注意力去提高自己的核心技能</u> ;无论是处理法律案件、做手术，还是开公交车，但是人到中年，前额叶皮质的工作效率就是会降低，这意味着我们的快速分析和创新创造能力都会下降。其次它还意味着一些曾经很容易上手的技能，比如多任务处理也开始变得不再得心应手</p><p>所以，职业下行必然常态，这对所有人都是公平的，而且他比你想象中要来得更快；<em>几乎所有从事高技能型职业的人，在30 多岁到 50多岁之间的某个时间点都会开始进入下行通道，有可能是因为个人原因，也有可能是行业或者宏观因素的原因</em></p><p>更可怕的地方，一个人在事业巅峰期所做出的成就越高，那么他在下行期的表现往往也就越差，这就是所谓的飞得越高就跌得越痛。<strong>一个人在中年时期的失落感和他之前取得的成绩以及对过往念念不忘的程度是高度正相关的</strong>；如果一个人本来就对自己没有什么期待（日常语境中我们经常说的 “没有上进心”），但是人家可能就是过得比你快乐；偏偏是那些人上人爱好者、奋斗和增长成瘾者们的下坡路，可能会极为痛苦，会面临着多重打击，播客里是这么说的</p><blockquote><p>第一重是我们会不自觉地渴望更大的成功，用更高的二阶导增速来避免意难平，但这不太可能，高增速的好时光往往就那么一段儿<br>第二重打击是随着年龄的增长，我们真的很难维持现有的水平<br>第三重打击就是<em>当我们过分执着于更大的成功，同时伴随着职业技能下降的时候，很容易最终会陷入成瘾模式，比如变成工作狂</em>，以牺牲自己的健康与配偶、孩子、朋友们的深层关系为代价，并且没有人会共情你</p></blockquote><p>那怎么办？觉醒这本书说在你面前有三道门</p><ul><li>1号门：你可以拒绝接受这一切，否认现实，不甘平凡、愤怒的、固执的对抗下行，但可能会陷入不断的沮丧和失望当中<br></li><li>2号门：你可以耸耸肩，接受这一切，任命躺平，然后将人生的下坡路视为一场宿命般的不可避免的悲剧</li><li> 3号门：你还是得接受现实，那些曾经令你青云直上，功成名就的职业技能确实都成了过眼云烟，一切都归于平淡了，但是你可以<strong>带着自己的好奇心重新找点新乐子，学点新事</strong></li></ul><p>《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zNjkwNTE4OC8=">时间游戏<i class="fa fa-external-link-alt"></i></span>》里提到：终身学习并不是一个空洞的鸡汤式的口号，而是不管我们是否愿意，<u>我们一生中总会经历几次集体游戏的切换。每次换游戏的根本原因是为了解决新的问题，为此新的游戏会鼓励一些新技能，鼓励的方式就是给予掌握这项技能的人更高的估值，让这些人的社会地位上升</u>。所以<strong>学习新技能是为了适应新游戏，仅此而已</strong></p><p>因此，智慧觉醒意味着如果我们能顺势而为，借助某些方法，其实可以自然的变得更明智、更成熟。窍门在于<strong>理解并且利用那些年龄增长带来的新的优势</strong>，比如说当人的年纪变大，人的表达能力会变得越来越好，因为相比从前，自己的词典变得更厚了，思维方式也更成熟了，播客里将这归为了 “晶体智力”</p><p>所谓的 “晶体智力”，就是那些以习得的经验为基础的认知能力；与之相对的是 “流体智力”，也就是我们常说的先天智力，我们的阅读、数学能力都与 “流体智力” 相关，但不幸的是到了30 多岁、 40多岁的时候，流体智力就开始衰退了，相反地晶体智力会随着年龄地增长而增长</p><p><img data-src="https://wulc.me/imgs/two_intellegiences.jpg" height="50%" width="50%"></p><p>流体智力与晶体智力的变化，与人的人力资产曲线和金融资产曲线是非常相似的；关于人力资产曲线和金融资产曲线，在面基的《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY0ZDg1Y2JiODBjOWVjNGM1ZjFkMGY2Yw==">中产，一个阶层的自我修炼<i class="fa fa-external-link-alt"></i></span>》里是这么说的</p><blockquote><p><u>人一生的财富大体分为两部分，其一是呈现倒 u型曲线的人力资本，其二是曲线起伏但最终会朝着东北方向推进的金融资产</u>。所以度过中年在财务上的表达就是我们的人力资本曲线是向下的，但是在这个过程中，我们<em>用保险兜住了下限，再用金融资产所释放出来的现金流去进一步的弥补劳动收入的减少</em></p></blockquote><p>如果你的事业完全依赖于流体智力，那确实容易更早地到达事业巅峰，然后进入下行通道；但如果你的工作是更依赖于晶体智力，事业巅峰就会晚一些，上破路也会久一些。说的更直白点，就是偏理工科的岗位更依赖流体智力，偏文科的岗位依赖大量知识储备以及应用能力的岗位更依赖晶体智力，所以<strong>如果能从偏流体智力的行业切换到偏晶体智力的行业，就是一次比较成功的跳船，或者说职场转型</strong>；比如说原来你是偏向创新和实践的，那之后就可以往指导和培训去转型</p><p>但是我们不得不承认，不管是什么人生阶段，只要是转型期，就一定会面临着各种不确定性，这会让人本能地感到不安、自我怀疑，甚至恐惧</p><h3 id="观念">观念</h3><p>这部分讨论<strong>如何温和地走下第一条曲线，如何摆脱渴望成功、渴望增长的瘾</strong></p><p>《中年觉醒》这本书聊到了一个引人深思的案例</p><blockquote><p>一位女士在华尔街工作，有钱有地位，看起来是人生赢家；但同时也有很多问题：婚姻失败，轻度酗酒，和孩子们处的还行，但是孩子们都上大学了，彼此离得很远，很少见面。她没有什么真正的朋友，长期的加班也导致了身体的透支。所以<u>工作对她来说就意味着一切，这是一个巨大的难以摆脱的惯性，给他带来了几乎所有的意义感和成就感，当然还有那份丰厚的薪水</u>；但问题是她的流体智力也处于下行期了，所以现在自己做的这份工作越来越难以应付，以前他是团队的主心骨，但是现在即便是年轻的组员都有点信不过她了</p><p>她自己也意识到了这个问题，这样看起来问题似乎就很好解决了；因为都意识到了，那就着手挨个解决问题就好了。但令作者咋舌的是，这位女士面无表情地对作者说 “也许我更想要的就是成为人上人，而不是幸福。度假、和朋友家人一起待在一起，任何人都能做到，但不是每个人都能像我一样成就一番大事业”</p><p>作者本想反驳他，但是转念一想，回顾自己的人生，大多数时候，作者的选择和他一模一样。<u>这么多年，这位华尔街的成功人士精心打造了一个让旁人艳羡的角色，因为事业有成，勤劳敬业，财富增值，孩子们读了好大学的华尔街精英，她成功征服了自己的第一座山，但是现在她如坐针毡，<strong>工作给她带来的一切回报，边际效用都在降低</strong></u></p></blockquote><p>作者在书里也提到了原因：就是她所打造出的那个人上人的角色并不是一个完整的人，这位女士和自己做了一笔交易，她<em>用一个活生生的自我去交换了一个标签化、符号化的角色</em></p><p>而更深层次的原因，则是<strong>当一个人评价自己的标准过于单一，比如只有工作业绩或者是财富数字；如果有一天这个唯一的参考系崩塌了，这对TA来说，无疑是一种毁灭性的打击</strong>；这点也许对那些<em>工作狂的一种诅咒</em>，终有一天他们会发现自己也会走入那个不那么尽如人意的下半场，然后痛苦的追忆往日荣光，对自己失望，和家人朋友的关系日益紧张</p><p>我很喜欢这个例子，因为看过了太多的身边的人包括我自己，都有这样的问题；我们都非常擅长用简单的标签去物化别人，也会物化自己，我们可以将自己物化成人上人，用工作成功、世俗的认可和骄傲来定义自己</p><p>但比较现实的问题是，人的 golden age 就只有那么一段（上面提及的倒 U型曲线），所以也难免会给自己洗脑 “老天爷赏了你这碗饭，就老老实实的，在能吃的时候多吃几口，因为很可能过了这个村，你就再也吃不上这口饭了”；而事实上，像互联网、金融这些行业，是中国为数不多依然同工不同酬的行业，过了这村就没这店了，现在都缩编，跳槽机会也不是那么多，所以多干一个月，我就多赚一个月的工资，真的要走，也要拿着大礼包再走</p><p>因此，虽然喜欢书里的故事，但这个不是绝不是劝大家躺平或摆烂，这个作用，也许是当我们不得不告别的那天，能够更加坦然，对过往的收入、股票、地位等没有太多的执念和留恋；更重要的是，也许是<strong>在我们发现工作带来的边际效用在递减至一定程度时，我们可以尝试把工作的时间让渡给一些边际效用更高的事情，给自己多找一些参考系，比如说亲密关系、爱好等等</strong></p><p>给自己多找一些参考系很重要，<em>因为如果只有一个评分，其实某种程度上我们又回归到了学生时代的分数，就是一切丢掉一分落后千人的逻辑里了，所以会有骄傲、恐惧、攀比、戒断反应等等这些泥坑</em></p><p>对完美主义者（现在似乎不是那么好的一个词了）而言，骄傲和恐惧常常是伴生在一起，骄傲的人常常是恐惧的，他恐惧失败，那更可悲的是，一个充满了恐惧输不起的人，他也很难从自己获得的成就当中感到快乐。因为他们总是焦虑于在关键时刻掉链子，做事的动机也变成了害怕把事情搞砸</p><p><u>在与他人做比较时所产生的优越感暂时给了完美主义者安全感，但是这种想法又转过来，让他们充满了恐惧，因为失败是不可被接受的。一旦失败，它一定伴随着巨大的自我否定，而且很多对成功和增长成瘾的人都承认过，他们<em>经常认为他人之所得就是我之所失。所以当他们看到别人比自己更优秀的时候，会很搞笑的不由自主地认为自己是一个一败涂地的loser</em></u></p><p>这一切的根本，还是上面说的评价体系过于单一的问题，而观念上的觉醒，就是需要重构自己的价值判断体系，从更多维度来度量自己的价值</p><h3 id="心态">心态</h3><p>《中年之路》这本书基于荣格心理学的视角，逐步去回答这个问题：“除了我的过往以及我所扮演的角色，我究竟是谁？”</p><p>书里提到，我们都带着过去经历的痕迹、在无意识的生活，过往的经历在我们心中形成了一个内在的小孩，而社会化成长的过程就是我们与这个内心的小孩逐渐感到疏远的过程</p><p>所谓的<u>中年危机，其实是内在小孩和后天人格之间越发不一致、越发分裂所产生的痛苦导致的</u>。并且这种痛苦它不是坏事，因为痛代表了这个内在自我准备迎接新生的强烈要求</p><p>在荣格的理论中，人有两个成年时期，第一个成年期大概是生理年龄在 12 ~40岁左右，在这个阶段我们的人格是临时的，它不过是一个对外界反应的集合，我们还不完全了解这个世界，我们在学习，或者说我们是在模仿身边大人的态度和行为；第二个成年期则是等生理年龄到了中年的阶段才会开启，因为那个时候才有了一点闲暇和空余时间，才有了一些力量，可以稍微琢磨琢磨那个终极的人生命题 “我究竟是谁”</p><p>因此，《中年之路》这本书里，强调了中年危机的原因，不光是时代、宏观经济、家庭、财务责任等等外部因素导致的。哪怕没有这些因素，我们内在也会召唤中年危机，召唤我们让内心小孩这个临时人格走向真正的成年，从虚假的自我走向真实的自我，成为我自己</p><p>这个过程，往往会伴随着压力和痛苦，这是一场自我身份的危机，因为除了社会角色和心理投射之外，我们并不知道自己是谁，这些内在问题会外化出来各种各样的形式，比如无聊反复更换工作 / 伴侣、滥用药物、各种成瘾、自我毁灭的想法、不忠、抑郁、焦虑，还有各种各样的强迫倾向等；荣格派认为这种痛苦的内在危机出现的目的就是为了让我们去纠正自己的方向，而荣格给出的建议是鼓励我们<strong>敢于展示自己的弱点和不足</strong></p><p><u>精英的意思是一个人拥有少数人才拥有的优势，普通人只能对此望洋兴叹，靠精英文凭和人设并不能让很多人与你产生共鸣，它只会吸引来一批慕强的人，而且你最好不要暴露出半点软弱错误以及道德瑕疵，因为这很不 “精英”。所以苦难、困境、软弱这些状态就不应该出现，所以他当然也不能与其他人分享，这些事具有私密性，它令人羞愧，难以启齿，所以很多人转而去找心理咨询师倾诉</u></p><p>但事实上，人不可能是完美的，人因为有了弱点才变得真实，而一个人真实，他才可信，才会吸引过来那些对你也很真的人。所以，<strong>心态觉醒，意味着我们能坦然接受自己就是不如别人，就是有一堆臭毛病，能够诚实地面对自己的弱点，能够放过自己</strong></p><p>说到这里，我不禁想起《<span class="exturl" data-url="aHR0cHM6Ly95b3V6aGl5b3V4aW5nLmNuL24vbWF0ZXJpYWxzLzEwOTU=">我们都是不明真相的群众<i class="fa fa-external-link-alt"></i></span>》里方丈说的一句话：“在投资这件事上，发现自己傻 X 比证明自己牛 X 重要一万倍”；我想不仅仅是投资，在很多领域，承认自己的无知，向别人坦然示弱，而且不在乎他们的想法，能让自己活得更轻松一点；毕竟，人生就三万多天，装给谁看呢</p><h3 id="关系">关系</h3><p>TED 的一个演讲 《<span class="exturl" data-url="aHR0cHM6Ly93d3cudGVkLmNvbS90YWxrcy9yb2JlcnRfd2FsZGluZ2VyX3doYXRfbWFrZXNfYV9nb29kX2xpZmVfbGVzc29uc19mcm9tX3RoZV9sb25nZXN0X3N0dWR5X29uX2hhcHBpbmVzcz9zdWJ0aXRsZT1lbg==">Whatmakes a good life? Lessons from the longest study onhappiness<i class="fa fa-external-link-alt"></i></span>》，是关于哈佛大学的一项成人发展的研究项目，也可以说是史上最漫长的有关于幸福人生的跟踪研究，因为这个项目它持续了将近80 年的时间，跟踪了 724 个研究对象</p><p>研究对象分为两组，一组是当时哈佛的学生，在二战之前，他们在哈佛读书，其中很多人也上了战场。第二组对象人数更多，他们是来自波士顿贫民区的青少年，这些人普遍经历过大萧条年代，课题组年复一年的跟踪这724 个研究对象的工作、家庭生活、健康状况。这场耗时近 80年的研究，换了整整四代研究员</p><p>最终得出了什么结论？研究成果有点出乎大家意料，它的最明确的、最重要的研究结论就是<strong>良好的人际关系能让我们的人生更加快乐、幸福和健康</strong></p><p>那什么叫良好的人际关系呢？课题组给了三个比较重要的点</p><ol type="1"><li><strong>我们必须要保持社交关系，不能与社会绝缘，不能把自己封闭起来</strong>，因为孤独是有害的，它会让我们的中年阶段更加不快乐，也会让我们的大脑功能、健康程度下降的都很快。而那些与家人、朋友、邻居相处得很好的人，他们比那些离群所居的人更快乐，也更长寿<br></li><li>即便你有社交关系，也并不意味着你就不孤独。因为<strong>人际关系的重点并不是你有多少朋友或者有没有伴侣，关键是你拥有的这些关系的质量如何</strong>。那些成天吵架、没有爱的婚姻对健康的危害比离婚还要大，而幸福的婚姻生活还能减轻衰老带来的痛苦，哪怕你身体出现了各种毛病，但依然会觉得自己的日子过得很幸福<br></li><li><strong>良好的人际关系不光能保护我们的身体，还能保护我们的大脑</strong>。上了年纪以后，如果依然对另一半信任有加，知道对方在关键时刻能指望的上，连记忆力都不容易衰退</li></ol><h2 id="三个老板">三个老板</h2><p>这里的三个老板，是《中年，人生的第二座山》中提到的，分别是<strong>身体健康、内心和良好关系</strong></p><h3 id="身体健康">身体健康</h3><p>身体健康的重要性无需赘言，这是所有 0 前面的的1；成功可能有一千种方式，但没有一种是应该要以损害自己身体为代价的</p><p><strong>尽量别让自己生大病，因为生大病受损的是你的人力资本</strong>，会打断的你后面整个的现金流的节奏；因为除了医疗本省要花很多钱，身体受损了之后，精力体力不如从前的话，那在关键的攒钱的这一二十年可能状态也不行；这一点结合下面这张家庭现金流表来看就很清晰了</p><p><img data-src="https://wulc.me/imgs/family_cash_flow.jpg" height="50%" width="50%"></p><p>为了维持身体健康，老生常谈的就是<u>运动、饮食、睡眠、情绪</u>这几项了，这里不在赘述，推荐纵横四海的这一期播客<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY1ZjJjZDg0Njc2NDk1NzA3OTUwNTQ0Nw==">EP41《超越百岁》：如何在 100 岁的时候，还能去滑雪？<i class="fa fa-external-link-alt"></i></span></p><p>除此之外买保险也是一个选择（注意买的是保障性的消费险，不是投资险），来保护一下我自己这个的金融资产或者说人力资产</p><h3 id="照顾好内心">照顾好内心</h3><p>这部分在前面的第二座山部分以及观念觉醒也着重描述了</p><p>《<span class="exturl" data-url="aHR0cHM6Ly9tb3ZpZS5kb3ViYW4uY29tL3Jldmlldy8xNDk0OTQ2Mi8=">男孩、鼹鼠、狐狸和马<i class="fa fa-external-link-alt"></i></span>》中说到：“我们只能看到外在，但一切都发生在内在”。说 “一切” 当然有些绝对，但是人往往只关注外部世界，认为是外部世界导致了目前的境况，或者总希望在外部世界找到一个救世主或者解决问题的办法，却是很多人在解决人生困境的过程中，渐渐 “迷路” 的原因</p><p>大多数人梦想中的财务自由的退休和孩子的样子以及自己满意的自己，是被社会规训的惯性的想法，很多时候并不切实际；对于很多外部的无法改变的客观事实，我们需要做好 “内外” 与 “外在” 的课题分离，更多向内求，或者说追问清楚自己当下正真想要的是什么；</p><p>因为无论是“我们只能看到外在，但一切都发生在内在”，还是 “一个人知道自己为什么而活，就可以忍受任何一种生活”，都在告诉我们，看到自己的内在，才能知道自己要真正要去爬的第二座山，而不是被世界所塑造的第一座山</p><h3 id="良好的关系">良好的关系</h3><p>这里的良好关系跟前面的重合了，这里就不再赘述了；但是在两期播客里都强调了这一点，也足以见题重要也行</p><h2 id="n-条出路">N 条出路</h2><p>《<span class="exturl" data-url="aHR0cHM6Ly9tcC53ZWl4aW4ucXEuY29tL3MvYUVSRUFzRG50ck9lRE1paWU1dkU0QQ==">35 岁，中国式中年丨青山资本 2022 年度消费报告<i class="fa fa-external-link-alt"></i></span>》中，从宏观层面提出了解决中国式 “中年危机” 的新思路：<strong>制造业大国转向为服务业大国</strong>，而这里面也蕴藏着中年人的N 条出路</p><p>由于加入 WTO、信息产业和更多科技产业逐步发展以后，我国产业结构从第二产业向第三产业转移是必然的趋势，这个过程必然会让一些人失业，但是<em>让中年人失业的结构性变化，也在创造新的适合他们的就业</em>。服务业尤其是新服务业会承载新的价值创造，承接中年劳动人群。<u>社区的作用在生活中越来越明显，相关的生活服务需求也越来越需要成熟的产业来支持：维护、维修、零工、社工、月嫂、保姆、护理、保洁</u>；也许有一天，每个人都可以有自己的管家、生活助理、爱好伴侣、运动指导</p><p>事实上，当前已经有一类大规模的服务业，青山资本在一份报告里面把他们统称为平台工人，比如说网约车司机、货车司机、外卖员，还有达人、博主、号主、新媒体主理人、程序员这些都属于平台工人，因为这些人本质上还是要依附于平台，并没有自己的生产资料：<em>接不到外卖订单的小电驴不是生产资料，接不到平台派单的小轿车只能在马路上空跑，没有平台导流的直播间不是生产资料，一个被平台封禁了的公众号只会沦为一日谈资，然后被世界彻底遗忘</em></p><p><strong>当下服务业的一个很重要的特点，就是会催生出千奇百怪的供需，无论你的需求是多么小众，多么细分，都能找到供给，这也正是经年正在快速形成的新服务业</strong></p><p>不少新服务业方向已经在逐渐崭露头角：<u>老物件翻新、传统手工艺制作、手机装裱、宠物殡葬、娃娃改造、家庭整理等</u>。社交媒体上的长短视频让很多不容易被看到的角落里的新业态和老匠人越来越火，不说做多大的生意，但支撑自己的生活收入完全没问题。除了这些尚在形成职业的新工种外，国家已明确认可的新服务业类型也在不断增多。国家职业分类大典在于 2022 年末再次发布新版，新增了 150 多个职业，其中不乏许多服务业新职业。比如会议接待服务师、健康照护师、社群健康助理员、森林园林康养师、民宿管家、研学旅行指导师、家庭教育指导师、在线学习服务师等。</p><p>这些新服务业可以用 “<strong>反工业化</strong>” 来概括。追求效率的商品生产过程标准化，工具越来越发达，生产者越来越年轻；而另一类服务或产品，则追寻温度，关心情感连接，服务于人的社会性，消弭孤独感</p><p>服务业一定是中年人的一条路，但每一个服务行业，哪怕它再普通，想做好都不容易，也都有用心者在绞尽脑汁的琢磨如何在那些细微处给出更多的AHA时刻。没有同理心的人一定不会在服务业里出类拔萃，因为没有同理心也不太可能发泄和尊重别人的需求。另一方面，对平台工人来说，平台的演化、算法的更迭、新技术的导入，都可以轻易改变一个平台工人的工作。当然，这些让中年人失业的结构性变化，可能也在创造新的适合他们的就业岗位</p><h1 id="小结">小结</h1><p>人生的第二座山，也许是每个人的的生命旅途里都无法避免的一次挑战和机会；当我们从第一座山下来的时候，健康、收入、技能、社会地位等可能都会快速下滑，这是挑战；但同时也给我们一个机会，一个去看到更深层次的自己、慢慢发现我到底想要什么、找到自己的 “awhy to live” 的机会</p><p>绝大多数的人都不可能避免地会遇到这座山，只是由于我国近三十年产业结构、劳动者教育水平高速变化，让这座山开始前移到了35这个节点；每个人的第二座山都不尽相同，但可以肯定的是，爬第二座山的意义是我自己赋予的；同样的，如何爬过这座山，在方法上也是多种多样的，没有一个标准答案</p><p>服务好我们的 “三个老板”：健康、内心和关系，别让工作成为自己唯一的价值评判标准，诚实地面对自己的弱点并接纳自己，带着自己的好奇心重新找点新乐子，也许能让我们更好地从“N 条出路” 中找到独属于自己的第二条曲线～</p><hr><p>文中的一些参考资料</p><ul><li><span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY2ODM1ZjgwY2RkMjMwYjIzYjk2MTk3Mg==">中年，人生的第二座山<i class="fa fa-external-link-alt"></i></span></li><li><span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY2ZjI4YzM1MmFkZmU0OGI4MzE3YWM5Nw==">中年之路上的四种觉醒<i class="fa fa-external-link-alt"></i></span></li><li><span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zNTA0ODUzMS8=">第二座山<i class="fa fa-external-link-alt"></i></span></li><li><span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zNjEzOTM5MS8=">中年之路<i class="fa fa-external-link-alt"></i></span></li><li><span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zNjg3MDAyNC8=">中年觉醒<i class="fa fa-external-link-alt"></i></span></li><li><span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zNjkwNTE4OC8=">时间游戏<i class="fa fa-external-link-alt"></i></span></li><li><span class="exturl" data-url="aHR0cHM6Ly93d3cubmJlci5vcmcvcGFwZXJzL3cyOTUyMw==">“GOLDEN AGES”:A TALE OFTHE LABOR MARKETS IN CHINA AND THE UNITED STATES<i class="fa fa-external-link-alt"></i></span></li><li><span class="exturl" data-url="aHR0cHM6Ly9tcC53ZWl4aW4ucXEuY29tL3MvYUVSRUFzRG50ck9lRE1paWU1dkU0QQ==">35 岁，中国式中年丨青山资本 2022 年度消费报告<i class="fa fa-external-link-alt"></i></span></li><li><span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY0ZDg1Y2JiODBjOWVjNGM1ZjFkMGY2Yw==">中产，一个阶层的自我修炼<i class="fa fa-external-link-alt"></i></span></li></ul>]]></content>
    
    
    <summary type="html">&lt;p&gt;最近听了情感播客《面基》的两期关于中年的播客：《&lt;span class=&quot;exturl&quot; data-url=&quot;aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY2ODM1ZjgwY2RkMjMwYjIzYjk2MTk3Mg==&quot;&gt;中年，人生的第二座山&lt;i class=&quot;fa fa-external-link-alt&quot;&gt;&lt;/i&gt;&lt;/span&gt;》和
《&lt;span class=&quot;exturl&quot; data-url=&quot;aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY2ZjI4YzM1MmFkZmU0OGI4MzE3YWM5Nw==&quot;&gt;中年之路上的四种觉醒&lt;i class=&quot;fa fa-external-link-alt&quot;&gt;&lt;/i&gt;&lt;/span&gt;》后，也看了提及的几本相关的书:《&lt;span class=&quot;exturl&quot; data-url=&quot;aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zNTA0ODUzMS8=&quot;&gt;第二座山&lt;i class=&quot;fa fa-external-link-alt&quot;&gt;&lt;/i&gt;&lt;/span&gt;》、《&lt;span class=&quot;exturl&quot; data-url=&quot;aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zNjEzOTM5MS8=&quot;&gt;中年之路&lt;i class=&quot;fa fa-external-link-alt&quot;&gt;&lt;/i&gt;&lt;/span&gt;》、《&lt;span class=&quot;exturl&quot; data-url=&quot;aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zNjg3MDAyNC8=&quot;&gt;中年觉醒&lt;i class=&quot;fa fa-external-link-alt&quot;&gt;&lt;/i&gt;&lt;/span&gt;》以及一些研究报告；颇有感触，想写点东西来记录一下，于是有了这篇文章&lt;/p&gt;
&lt;p&gt;每次读到这类内容，都会有一种错觉，似乎听完后就可以合理化自己躺平，给自己不努力找一个借口；因为一命二运三风水、命运无常，在随机性面前的我们似乎无能为力（比较扎心的是，这的确是一个不争的事实）；但这并不意味着我们要躺平，原因在之前写的
《&lt;a href=&quot;https://wulc.me/2023/02/05/%E5%81%9A%E4%B8%80%E4%B8%AA%E6%B8%85%E9%86%92%E7%9A%84%E5%82%BB%E7%93%9C&quot;&gt;做一个清醒的傻瓜&lt;/a&gt;》中也提到了：&lt;strong&gt;“在努力还没达到一定程度前，我们连面对随机性的机会都没有，或者说幸存者偏差也是有门槛的，当你的能力不足时，进入决赛圈的资格都没有”&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;本文是写给自己的心理按摩，是为了让自己在 “尽人事” 后，能够更坦然地 “听天命”；是为了能在面对人生的第二座山的时候，能够更加从容；祝开卷有益～&lt;/p&gt;</summary>
    
    
    
    <category term="闲话几句" scheme="https://wulc.me/categories/%E9%97%B2%E8%AF%9D%E5%87%A0%E5%8F%A5/"/>
    
    
    <category term="闲话几句" scheme="https://wulc.me/tags/%E9%97%B2%E8%AF%9D%E5%87%A0%E5%8F%A5/"/>
    
    <category term="读书" scheme="https://wulc.me/tags/%E8%AF%BB%E4%B9%A6/"/>
    
  </entry>
  
  <entry>
    <title>关键跃升：角色</title>
    <link href="https://wulc.me/2024/09/17/%E5%85%B3%E9%94%AE%E8%B7%83%E5%8D%87_%E8%A7%92%E8%89%B2/"/>
    <id>https://wulc.me/2024/09/17/%E5%85%B3%E9%94%AE%E8%B7%83%E5%8D%87_%E8%A7%92%E8%89%B2/</id>
    <published>2024-09-17T03:08:18.000Z</published>
    <updated>2026-02-28T05:01:22.801Z</updated>
    
    <content type="html"><![CDATA[<p>在此前的文章 《<a href="https://wulc.me/2024/08/18/%E5%85%B3%E9%94%AE%E8%B7%83%E5%8D%87_%E5%BF%83%E6%80%81/">关键跃升：心态</a>》中，介绍了书的上半部分，即心态上的需要做出的一些改变，本文主要讲的是剑法法部分，即管理者需要扮演好四种角色 “<strong>鼓手、教练、政委、指挥</strong>”，这部分也涉及到比较多的方法论，值得一读～</p><span id="more"></span><p>怎么提升管理效率，书里给出了这个公式 “<strong>管理效率 = 动力 × 能力 × 沟通 × 协作</strong>”；管理者和团队的关系，就像赛车手和赛车的关系，管理者需要理解这辆车的构成，才能让这辆车跑起来；书里也把上面提到的四部分类比成了汽车的组成部分，如下图所示（ps，书里给出了很多直观易懂的图，而这也是高效沟通的方式之一，以图代写，后面也会提及）</p><p><img data-src="https://wulc.me/imgs/managing_efficiency.png" height="50%" width="50%"></p><ul><li>动力：员工愿不愿意干，除了员工自身的责任感，管理者要激励手段，扮演好 “鼓手” 的角色</li><li>能力：员工能不能干，激励不能获得能力，除了通过招聘筛选，管理者还需要投入精力培养员工，扮演好 “教练” 的角色</li><li>沟通：让整个团队更有凝聚力，需要建立管理者与员工的沟通机制，管理者需要扮演好 “政委” 的角色</li><li>协作：如何调配整个团队，让每个人能够各司其职，管理者需要扮演好 “指挥” 的角色</li></ul><p><strong>动力和能力是针对个体的，沟通和协作是针对整体的</strong>；四个要素彼此相乘，才能得到预期的效率。上面的公式之所以用乘法，是因为其中任何一个要素为0，都会导致团队满盘皆输；而合格的管理者需要拆解好这四个部分来提高团队效率</p><h1 id="鼓手动力">鼓手：动力</h1><p>作为管理者，你要通过别人，而不是通过自己完成工作了；以前你可能不需要理解 “人” 是怎么回事，但现在你必须理解了。因此<strong>学管理第一件要做的事情就是趴在地上学人性，而不是浮到空中指挥交通</strong></p><p><em>理解 “人” 的第一步，就是把人的 “动力系统” 拆开，仔细看清楚里边的结构</em>。然后针对不同的员工，用不同的方法去激发他们的动力，这样团队才能由一个火车头带动变成动车组联动</p><p>人心动力系统，包括四台发动机，即<u>防御动力、获得动力、结伴动力和学习动力</u>，方向、强度和持久性，就是人心发动机的性能特征。情绪是动力的燃料，6种燃料类型分别是<u>愤怒与恐惧、寻赏与意义，责任、爱好</u>，如下图所示</p><p><img data-src="https://wulc.me/imgs/power_system.png" height="50%" width="50%"></p><h2 id="防御动力">防御动力</h2><p>如何启动防御动力发动机？依赖的是愤怒和恐惧两种情绪燃料</p><p>愤怒和恐惧的动力强劲但不持久，管理者可以不常用，但一定要会用。恐惧会让人努力，如绩效考核、末位淘汰是最常见的借助恐惧情绪；设立各种排行榜是借助了愤怒情绪（好胜心）</p><p>书里给的办法是：<u>一只鸡、一条鱼、一个炉子和一个假想敌</u>，见下图</p><p><img data-src="https://wulc.me/imgs/defend_power.png" height="50%" width="50%"></p><ul><li>一只鸡：杀鸡儆猴</li></ul><p>遇到业绩不好的，一定要处理，要么进行降薪降职，要么调岗、淘汰。让 “南郭先生” 不能混日子，是对业绩好的人的尊重。<strong>对 “南郭先生” 的宽容，就是对努力干活人的残忍</strong></p><ul><li>一条鱼：鲶鱼效应</li></ul><p>要有优秀后备员工，这能给懈怠的老员工带来危机感</p><ul><li>一个炉子：热炉法则</li></ul><p>善用恐惧让员工远离不好的事情。如果员工违背企业文化，管理者应该批评他；如果员工违反规章制度，管理者必须惩罚他，这是用人的底线</p><p>热炉法则的四个原则：警告性（提前亮红灯，告知红线）、一致性（每次触碰都一定会收到到惩罚）、即时性（在触碰后立即启动惩罚，不拖延）、公平性（一视同仁）</p><ul><li>一个假想敌</li></ul><p>内部矛盾向外部转移，eg“我们的产品虽然在市场上相对领先，但又有一家创业公司发展起来了，又有一个新产品的势头起来了，这些对手对我们构成了巨大的威胁，我们必须打败他们”</p><h2 id="获得动力">获得动力</h2><p>寻赏与意义是获得发动机的燃料。寻赏就是找到大家最需要什么，比如常见的是升职加薪；意义则是给事情赋予更大的意义感，比如我们做的事情是在改变一部分人的生活</p><p>其中，寻赏是极为重要的燃料，因为对于绝大部分人来讲，工作就是为了养家糊口，升职加薪是很多人动作的最大动力。任正非说：​“钱分好了，管理的一大半问题就解决了。​”</p><p>赏罚需要分明，书里给出了三条原则</p><p>（1）<strong>要按照大家认可的规则</strong>，而不是按照自己的价值观来行使奖赏权力<br>（2）奖赏规则一定要在大家努力之前就制定好，<strong>不要等结果出来后再定</strong><br>（3）奖赏一定要<strong>跟个体的努力所做出的贡献相关</strong>，而不是跟群体的结果相关</p><p>对应着的反例，就是即兴分配、有结果再讨论分配以及无差别分配，如下图所示</p><p><img data-src="https://wulc.me/imgs/reward_principle.jpg" height="50%" width="50%"></p><p>关于第（3）点，主要是想强调不能吃大锅饭，这意味着要为每个人明确其具体职责，<strong>不要让间接影响结果的人，去承担直接的目标</strong>。比如说不能让技术人员去扛销售目标。为什么？因为技术人员的努力不能直接改变销售的结果。虽然技术人员的努力可以提高产品质量，并且产品质量提高了，肯定会影响销售结果，但是，这种影响是间接的。你可以为技术人员设定与产品质量相关的考核指标，让他直接对产品质量负责。但千万不要绕弯子，让他对销售结果负责</p><p>每个人都只能对自己直接能改变的结果负全责。所以，钱只能分给那些通过自己努力能够改变结果的人。这也叫 “<strong>责任承包制</strong>”​，管理者根据每个人的努力结果来赏和罚，要做到发货人只对发货的结果有责任，客服只对客服的结果有责任，技术只对产品的质量而不是销量有责任</p><p>获得动力的另一种燃料，是意义，这是一个听起来很虚的概念；因为对于大部分人来说，生存焦虑就够足够烦了，工作只是谋生的一种手段，没有太多意义；但是对于已经摆脱了生存焦虑的人，或者薪酬差不多情况下，选择更有意义的工作，也是一个合理的选择</p><p>书里对意义的定义也比较宏大：意义，就是比自身更重要的事情。意义是利他的，超越了基因所控制的生存、繁衍等人生目的，我们可以从中获得真正的自由。意义，是脱离了基本需求的、真正高级的人想要创造的人生价值</p><p>当然，如果意义连你自己都不信，你却要员工信，这就不叫意义了，而叫画饼，甚至是欺骗</p><h2 id="结伴动力">结伴动力</h2><p>结伴动力的燃料是责任感</p><p>书里把这里的责任感分为三大类：自我、团队和客户，如下图所示</p><p><img data-src="https://wulc.me/imgs/team_responsibility.png" height="50%" width="50%"></p><p>如何建立员工的责任感？除了员工自身本来的责任感，也有一些方法来实现这一点，有一个这样的例子</p><blockquote><p>一个下属把方案做砸了，你非常恼火。这时候你该怎么办？</p><p>是对他说 “这次做得不够好，说明你还有很大的提升空间”​，还是说 “你这个猪脑子，这种错你也能犯”​？建议都不要说。前者是压抑着怒火的鼓励，后者是情绪失控的批评，二者都不能解决问题，都不太好</p><p><strong>也许你可以对他说：最近你遇到什么事了吗？你一直是一个特别积极、特别为集体着想的人，但是在这件事上没有表现出来，到底是哪里出了问题呢？</strong></p></blockquote><p>建议的说法先给了对方一个认知 “你是一个负责的人”，然后说对方的行为跟这个不符，然后做出改变；那为什么这样说有效</p><p>有个概念叫 “认知协调”：<u>它是人的一种心理机制，让你的行为和你的认知始终保持一致。如果二者不一致，你就会难受。这种难受会促使你调整行为或者调整认知，最终实现协调</u>；而如果直接骂对方” 做事不负责 “，有可能会让对方心里也认同” 自己不负责 “的这个概念，然后在行为上也表现出跟这个说法不一致的情况</p><p>上面这个案例其实就是增加员工自我责任感的一种重要方法。尊重对方的高自尊，而不是PUA， 才是批评的基础</p><p>具体的实施过程跟上面的案例差不多，<em>你首先肯定他是对自己有高要求的人，这样他也会告诉自己：对啊，这不是我这样的人该做的事啊，到底出了什么问题？这样你们就可以平心静气地讨论问题，他才会改进，因为你很好地激发了他对自己名声的责任感。而在交代完任务之后，管理者可以表达自己对员工的期待：​“我认为你完全具备这个能力，好好做，别让我失望</em>。​” 某种程度上这是一种他人预言的实现</p><p>团队责任感，作者常跟员工说的一句话是：你的一言一行都代表着整个团队，而不仅仅是你自己；书里提到了一个 “月度感谢卡” 活动，用来增强团队责任感，简单来说就是每个月组织一个员工之间的感谢活动，核心的点有四个</p><p>1）感谢的事件要具体<br>2）感谢的事件不能是对方的本职工作；<strong>你感谢的内容，应该是对方在本职工作以外给你的帮助</strong><br>3）<strong>不能感谢上级，上级为你做的，都是他应该做的</strong><br>4）当面表达，如月度下午茶会</p><p>对于客户责任感，需要员工不仅仅关注数据和指标，而是要关注到使用这些产品的背后有血肉、有情感、有生活的人，才能激发员工对客户的的责任感；可以用客户的真实案例和反馈来建立员工的责任感。比如说让一些技术、产品等员工做客户回访</p><h2 id="学习动力">学习动力</h2><p>学习动力的燃料是爱好</p><p>几乎没有一个人的爱好是上班本身这件事，但是上班这个过程能给我们带来的一些附加物，这些附加物能够让我们在上班这件事上获得一些持续的动力</p><p>寻赏是群体的基本诉求，但爱好是个性化的诉求，爱好有三个源头：<strong>兴趣、成就感、成长</strong>；如下图所示</p><p><img data-src="https://wulc.me/imgs/hobbies.png" height="50%" width="50%"></p><p>1）兴趣：基本性格有关，比如说更喜欢做业务还是横向技术迭代<br>2）成就感：利用了人的反馈机制<br>3）成长：利用了人的上进心</p><p>具体的做法，上面图里也列出来了，在兴趣这一点上，多观察员工的兴趣点在什么地方，并经常跟员工聊一聊他喜欢做的事；在上成就感，尝试 “游戏化管理”，积分、勋章（比如说公司常见的各种奖励和头衔等，如优秀导师、xx奖项等）；成长则是尽量让一个人处于 “学习区”</p><p>什么是 “学习区”？当一个人做的是自己非常擅长的事情时，他处于 “舒适区”​，这时他是没有成就感的。当他做的是自己完全不擅长的事情时，他处于 “恐惧区”​，心理上的严重不适可能会让他崩溃。当他做的事在他擅长和不擅长之间时，他处在舒适区和恐惧区之间，也就是处在学习区，他会有一种攻克难关之后的成长的快乐，如下图所示</p><p><img data-src="https://wulc.me/imgs/learning_zone.png" height="50%" width="50%"></p><p>但坦白说，真的有人喜欢工作么？答案基本是否定了，但是在其位谋其职，需要把本质工作做好，同时如果能在这个过程中找到那么一点热情，会让自己、团队和公司都受益</p><h1 id="教练能力">教练：能力</h1><p>靠谱的员工是团队或者说公司最宝贵的财富，因此，管理者需要掌握的很重要能力，就是 “<strong>选、育、用、留、汰</strong>”，书里的这部分，不怎么包含 “选” 即面试选人这部分，但是其他几个部分都有涉及</p><p>从 IC 到manager，最容易犯的一个错误是<strong>认为员工不如自己</strong>；但是仔细想想，如果员工比你强，升职轮得到你么？他会服你么？答案显然是不（当然这里也有时机问题，比如很早进入了一家快速发展的公司，但是要相信随着时间，一切都会均值回归）</p><p>假如你有两个选择，一是你没升职，比你差的同事升职了，你有一个不行的上司，你痛不欲生；二是你作为最强的员工被提升为管理者，但有一届不行的员工，你苦不堪言。请问你选哪一个？</p><p>面对眼前的各种 “P0” 的任务，管理者把自己降级使用去干活当然可以，但是长期来看这样效率是很低，所以要开始担任起教练的角色，开始培养员工（不过同时也要保证自己有时刻能下场干活的能力）</p><p>管理者应该把 40% 的精力花在提升今天的业绩上，40% 的精力花在提升团队能力上，另外 20% 的精力花在提升自己的能力上；提升团队能力就等于提升明天的业绩</p><p><img data-src="https://wulc.me/imgs/improve_tomorrow_performance.png" height="50%" width="50%"></p><p>而作为教练需要做好三件事：<strong>训练、调岗和替换</strong>；训练是为了提高效率，调岗是为人找到更合适的岗位，替换是为岗位找到更合适的人</p><p><img data-src="https://wulc.me/imgs/coach_three_things.png" height="50%" width="50%"></p><p>除了鼓手，管理者很重要的身份是教练，如果一个运动员跟着教练学不到东西，那这教练还能叫教练吗？仔细想想很多人离职的原因，不就是因为 “一将无能” 么</p><h2 id="训练育">训练：育</h2><h3 id="做中学">做中学</h3><p><u>一个人能获得的成长，70% 是在工作中完成的，20% 是在与他人的互相学习中完成的，只有 10% 从课程等正式学习中得来</u>。因为在工作完成后，不可避免会思考、探索和改进工作的方法，这样员工通过工作本身就能够积累知识，即知识积累有时候不是 “学习” 的结果，而是 “工作” 的副产品，这种方式也叫 “做中学（learningby doing）”，是一种类似 “费曼学习法” 的学习方法</p><p>教练真正的重点并不是教，而是让员工去练；<strong>犯错、解决、改进、成长，这就是管理者对员工的培养过程</strong></p><p>管理者不能让员工一直做他熟悉和擅长的事情，而要让员工走出舒适区，去做一些他不熟悉和不擅长的事情。这就需要管理者具备一种修养，他要允许员工犯错，管理者要把员工犯错当成是培养的成本，然后跟员工一起来解决问题</p><p>管理者需要创造员工对工作不断思考的场景，可借助的工具：<strong>周记、分享和复盘</strong></p><p><img data-src="https://wulc.me/imgs/educate_tools.png" height="50%" width="50%"></p><ul><li>周记：不仅仅是用来检查进度，还需要做一些更深入的思考；<u>一种模板：我做对了什么，做错了什么（关注点在事，记录结果）​，收获了什么经验，有哪些今后要避免的教训（关注点在人，提升能力)</u><br></li><li>分享：如果管理者发现员工的周记中有特别好的内容，可以建议他给大家分享，讲讲做好这件事的原因是什么。因为这相比周记更加正式了，他就会想自己怎么讲比较好，然后进一步地思考，把自己的经历提炼成经验，再分享给大家<br></li><li>复盘：1）对事不对人 2）分析怎么能提高做事的效率，跟周记一样；不要让10 年工作经验，只是 1 年复制 10 次，下面给了一个复盘模板</li></ul><p><img data-src="https://wulc.me/imgs/double_quotation_template.png" height="50%" width="50%"></p><p>还有一个 “年度复盘” 清单，也能为写年度总结和规划文档提供一个思路</p><p><img data-src="https://wulc.me/imgs/yearly_double_quotation_template.png" height="50%" width="50%"></p><h3 id="传授">传授</h3><p>书里列举了传授的 5 种等级</p><p><img data-src="https://wulc.me/imgs/teaching_levels.png" height="50%" width="50%"></p><ul><li>白水级是最差劲，但也是最常见的，即<strong>只会情绪化地训人，俗称对人不对事</strong><br></li><li>啤酒级：传授<strong>经历</strong>，告诉员工自己或他人的经历，只是一个故事，如果员工不能悟出更多东西，实用性会有限<br></li><li>黄酒级：传授<strong>经验</strong>，分析成功原因（也许不全，但是属于充分发挥主观能动性里可以做的）；如这件事能成功是因为他做对了哪几件事，为了做对这几件事，需要拥有哪几种能力或者资源</li><li>红酒级：传授<strong>方法论</strong>，如一些工具、表格和流程</li><li>白酒级：总结<strong>方法论成立的条件和边界</strong>，抽象出理论</li></ul><p>对于白酒级中的抽象出理论，书里也提供了一套方法论：经历经验化、经验方法化、方法理论化</p><p><img data-src="https://wulc.me/imgs/summary_methodology.png" height="50%" width="50%"></p><ul><li><strong>经历经验化</strong>：跟前面的黄酒级一样，要说清楚某件事能成是做对了哪几件事，需要哪些能力和资源</li><li><strong>经验方法化</strong>：建立流程，比如医生在查房的时候会拿着一个本子，本子上有第一、第二、第三等事项。这叫检查清单 (checklist)，这说明医生已经把查房这件事变成流程步骤，形成一个方法论了</li><li><strong>方法理论化</strong>：找到方法适用的条件和边界；世界上所有的方法论都是有毒的。为什么？<u>同一个方法论在这种情况下特别有效，就一定会在某些情况下完全失效，因为条件和边界变了</u></li></ul><h3 id="培训">培训</h3><p>新任管理者往往都希望充分利用员工的时间，尽快创造价值，但是我们要思考一个问题：<em>我们是想用员工的时间赚钱，还是想让员工的时间更值钱？这中间需要一个平衡。让员工的时间更值钱的一个好办法就是培训</em></p><p>这里培训的定义，指的是<u>从团队外部获得不可能内生，或者内生速度太慢的知识、技能或态度，从而突破团队的能力天花板</u></p><p>培训有 3 件重要的事：1）认识培训的价值 2）善用资源 3）自律 + 他律</p><p><img data-src="https://wulc.me/imgs/train_3thing.png" height="50%" width="50%"></p><p><strong>1）认识培训的价值</strong></p><p>培训内容可以分为三类：<u>知识、技能和态度</u></p><p>知识培训是指讲解 “概率论”​“4P 理论” 等理论，它们对完整地认识和分析事物很有帮助。技能培训是指培训演讲技能、谈判技能等技巧和能力，技能培训需要大量地训练。态度培训是指塑造正确的价值观，说明如何做正确的事、如何协作、如何利他等，比如十几年前我接受的培训 —— 学习《高效能人士的七个习惯》​</p><p>技能比态度更可塑，因此如果你觉得这个员工待不长，可以培训他的技能；如果你觉得这个员工待的时间会比较长，可以培训他的知识；如果他待的时间会很长很长，你可以培训他的态度</p><p>这里还提到了培训与咨询的关系</p><p><img data-src="https://wulc.me/imgs/trainVSconsult.png" height="50%" width="50%"></p><p><strong>2）善用资源</strong></p><p>利用网络免费资源，或者需要付费但是费用并不高的资源，比如说员工可以凭借学完课程的电子版证书，公司报销一半，这个过程也能区分出谁更爱学习</p><p><strong>3）自律 + 他律</strong></p><p>建立共同学习的氛围（但因人而异，并不是每个人都这么喜欢学习的）</p><h2 id="调岗留与用">调岗：留与用</h2><p>当我们对一个员工进行了训练后，发现收效甚微，我们是继续培养吗？可是做中学​、传授和培训都试过了，他都没有明显的提升</p><p>这里有一个重要的理念：<strong>不需要培养每一个员工，因为管理者真正的任务是提高团队的总体能力水平，而不是提高每一个员工的能力水平</strong></p><p>通用电气有一个 <u>“271” 逻辑：20% 的 A 类人才、70% 的 B 类人才和 10% 的 C 类人才</u>。这在任何公司都是客观存在的一个规律。20% 的人是非常优秀的，他们不需要激励，或者被激励得很好了；他们的能力也很强，你告诉他们要做某件事，他们自己就能完成了。70% 的人是中间水平。还有 10% 的人，你给他们同样的任务和激励，他们的业绩始终是很差的</p><p>所以我们的方法论：重用 A 类员工，培养 B 类员工，去除 C 类员工​。<em>做中学​、传授和培训，这三件事其实都是在培养 B 类员工。B 类员工是可以培养的，不要把精力花在把 C 类员工变成 B 类员工上，但可以把精力花在把 B 类员工变成 A 类员工上</em></p><p><img data-src="https://wulc.me/imgs/classify_employee.png" height="50%" width="50%"></p><p>如何区分或划分 A、B、C，需要我们能够识人 7，对人要有的 3个基础的认知：1）认识到人的多样性 2）认识到错配3）“用对人” 大于 “培养人”</p><p><img data-src="https://wulc.me/imgs/put_employee_to_right_position.png" height="50%" width="50%"></p><p><strong>1）认识人的多样性</strong>：一些工具如 MBTI、DISC等，但这也是很粗糙的多样性</p><p><strong>2）认识人和岗位很可能是错配的</strong>，因为招人的时候很着急，同时面试者会迎合面试官的喜好来表演，所以很多时候匹配度是高估的（一些原因，首因效应、光环效应、近因效应）</p><blockquote><p>因为面试者会尽量展现出自己与这个岗位是很匹配的，而你又着急招人，就把他招进来了。要记住，在你很着急招人，而面试者又有很强烈的渴望得到这个职位时，你们彼此间认为的匹配度很有可能是被高估的，甚至很有可能出现错配。</p></blockquote><p><strong>3）用对人比培养人更重要</strong>，管理者重要的问题不是改变人，而是用对人</p><blockquote><p>管理学大师德鲁克有一个理念，管理者的任务不是去改变人，而是知人善用，清醒地认识到每个人都是不同的，把合适的人放在合适的位置上</p></blockquote><p>书里提出了一个 “能力胜任度模型”：即先把每个岗位抽象为若干种能力，然后把能力细化为四个级别，并具体描述每个级别要做到的程度；如果管理者想清楚招聘要求怎么写，这一点也就做到了</p><p><img data-src="https://wulc.me/imgs/wirte_job_description.png" height="50%" width="50%"></p><h2 id="替换汰">替换：汰</h2><p>如果你发现一个员工的成长速度与时间不成正比，或者总是没有成长，那么你必须学会亲手解雇一个员工，换上更合适的人。换人，其实就是用钱来买提升团队能力的时间</p><p>这里也有一个理念：<strong>团队不是越稳定越好，合理的员工流失率不是坏事，比如 10%</strong>，​“流水不腐，户枢不蠹”​；其次，流失率有好坏之分，20% 的优秀员工离职率，是坏流失率；10% 的末位员工离职率，是好流失率</p><p>管理者在此刻需要面对的问题，就是如何解雇不合格的员工？书里提到了 3个重点：1）识别 2）亲自解雇 3）组织的鲁棒性</p><p><strong>1）识别</strong></p><p>根据业绩和价值观，把员工分为了四个象限：明星、野狗、土狗和小白兔；书里提到土狗是要坚决被清除的，而在阿里，价值观无法改变的野狗和业绩持续很差的小白兔，都是要清除的</p><p><img data-src="https://wulc.me/imgs/dismiss_classify.png" height="50%" width="50%"></p><p><strong>2）亲自解雇</strong></p><p>亲手解雇一名不合格的员工，是管理者的 “成人礼”​：面对对方的恐惧，面对对方的愤怒，面对对方的失望甚至绝望时，能够温柔而坚定地说出解雇对方的决定，给出扎实的理由，并从感情上给对方以慰藉，这说明你已经完成了一场真正的 “成人礼”​。</p><p>换人听上去很残忍，但这是员工晋升为管理者后的一个 “成人礼”​，你必须亲自做这件事。面对对方的恐惧，面对对方的愤怒，面对对方的失望甚至绝望时，能够温柔而坚定地说出解雇对方的决定，给出扎实的理由，并从感情上给对方以慰藉。这时候你才完成了作为管理者的 “成人礼”​（慈不掌兵）</p><p><strong>3）组织的鲁班性</strong></p><p>即任何员工的劝退或离职，都不会影响团队的战斗力，书里也给了三个建议</p><p>一是不管每个职位是否满岗，管理者都要跟人力资源部沟通，大量地去看简历，保证能随时招人进来<br>二是招聘兼职或实习生，或找外部的人做临时项目，这能让管理者接触到外部的优秀人才<br>三是对于有资源的公司、团队，甚至可以做 “缓冲式招聘”​，设置 1～2 个冗余岗位，相当于打篮球有板凳队员，在场上队员出状况时能立刻上场救急</p><p>这一点在实操上，<em>可以让团队中的人两两互为备份，他们的工作可以无缝衔接</em>。同时利用代码审查和修改漏洞的时间，尽量让所有团队成员了解所有的代码</p><h1 id="政委沟通">政委：沟通</h1><p>动力和能力，能让员工成为 “超级个体”；但是在当前复杂的商业世界里，员工不太可能单兵作战；让 “超级个体” 变成 “超级集体”，有两种重要的粘合剂：**** 沟通和协作 ****</p><p>而除了鼓手和教练，管理者还要成为善于沟通的 “政委 “，因为管理者的工作不是 “干活”​，而是让一群人因为你而干出更多的活、更好的活、更有价值的活。而要做到这一点，核心就是靠 “沟通”​；作为管理者，需要<strong>具备” 想清楚，说明白 “，让员工” 能接受 “的沟通能力</strong></p><p>通过向员工宣导公司的文化内涵和价值观念，让公司的使命和愿景深入人心；通过与员工沟通交流，解决员工的思想问题和心理问题；更重要的是，让员工明白一个任务或项目的为什么 (Why)、是什么 (What) 和怎么办 (How)，减少信息不对称，提高员工的战斗力，这都是管理者需要通过沟通来达成的目标</p><h2 id="减少信息不对称惊喜与意外">减少信息不对称、惊喜与意外</h2><p>沟通是为了减少信息不对称，避免惊喜与意外</p><p>江湖上流传已久的一句话，员工离职无非两点：“钱没给到位，或者心委屈了”​。什么叫 “心委屈了”​？调查显示，绝大部分员工加入一家公司，是因为对这家公司抱有期待；而离开一家公司，主要是因为对直接上司很失望。你当上管理者后，开始成为员工离职的重要原因了。未来你的优秀员工离职，你要知道，很可能是因为你，因为你让他受委屈</p><ul><li>向下沟通</li></ul><p>避免出现这种委屈，管理者就需要学会向下沟通：<em>从 IC 到manager，需要从原来只 “向上沟通” 多拓展出向下沟通</em></p><p>日常向下沟通时候，需要注意一些细节，比如说沟通要做到对事不对人，比如说下面这个例子，你觉得员工没有团队合作精神。<u>如果你直接说 “我觉得你没有团队合作精神”​，这就是在评价人。而如果你说 “在这件事情上，我没有看到团队合作精神的体现”​，这就是在评价事。​“我觉得你工作不积极”​，这是在评价人。​“我没有在这个十万火急的项目上看到你积极的表现”​，这是在评价事</u></p><ul><li>减少信息不对称</li></ul><p>因为不可能每个决策都由管理者来做，很多需要员工来做；而要让员工做出有效的决策，就需要让员工有更充分和全面的信息</p><p>如何减少信息不对称？避免<strong>1）把信息当权利，即利用信息差来做管理 2）说好不说坏3）当老好人</strong>；2 和 3的主要原因是逃避沟通，即通过减少沟通来减少眼前的冲突</p><ul><li>想明白，说清楚，能接受</li></ul><p>想明白指的是给员工安排任务，要想清楚 4个问题，为什么做？怎么做？预期结果是什么？deadline 是什么时候<br>说清楚指的是表达要到位，考虑受众的认知水平选择语言<br>能接受指的是除了用权利（比如说 top-down的决策，没法改变），要尝试更多方面去让员工接受</p><blockquote><p>员工不能理解，不能接受，此时你用的是他的手员工能够理解，不能接受，此时你用的是他的脑员工能够理解，能够接受，此时你用的是他的心</p></blockquote><p>后面也主要围绕着 “想明白，说清楚，能接受” 展开这部分的方法论</p><h2 id="想清楚搞清楚-whywhathow">想清楚：搞清楚 why、what、how</h2><p>想清楚，意味着要在三个维度上理清楚：即 <u>“为什么”​“是什么”​“怎么做”（Why、What、How）</u></p><p>表达清楚的前提是能 “想清楚”，要清楚对方想听的是 “是什么”、​“为什么” 还是 “怎么做”；只有当你所表达的跟对方想听的相匹配时，沟通才是有效的，书里给了这么一个案例</p><blockquote><p>有一次，我和一组企业家开私董会。某个企业家的问题是：如何给高管降薪？如何招到 80 后的总管理者？现在请问：这是什么类型的问题？这是关于 “怎么做” 的问题。他想找到 “无痛解雇” 高管，以及招 “80 后” 总管理者的方法和步骤。他之所以这么问，是因为他心中已经有了两个确定的 “是什么”​，那就是：解雇高管和招 “80 后” 的总管理者。他觉得这两个 “是什么” 不需要讨论，这是确定的，只需要讨论 “怎么做” 就行了</p></blockquote><p>“为什么”​“是什么”​“怎么做”；三者的关系见下图</p><p><img data-src="https://wulc.me/imgs/why_what_how.png" height="50%" width="50%"></p><p>很多时候，<strong>当对方问 “怎么做​“的时候，先明确下对方的 “是什么”（结论）的原因，即 “为什么” 要这么做，因为有时候对方都不知道真正的原因，都是浮于表面的原因，实际上能够有更好的解法</strong>；书里给的三步是这样的</p><p>第一步，从 “是什么” 倒推出 “为什么”​</p><p>第二步，再从 “为什么” 推出新的 “是什么”​（即找到真正的原因）</p><p>第三步，再从新的 “是什么” 推出新的 “怎么做”​</p><p><strong>沟通模式应该始于 “为什么”，终于 “怎么做 “；没有这两者就是鸡汤</strong>；为什么有时你的员工不能接受？因为你没有讲 “为什么”​；为什么有时你的员工不会执行？因为你没有讲 “怎么做”​</p><p>管理者需要重视 “为什么”、​“是什么”、​“怎么做” 这个看起来简单的框架，如果一个管理者不能想清楚” 怎么做 “，某种程度上也是这个管理者不能解决这个问题的自检；如果认为自己所想的 “怎么做” 可能只是保底方案，那怎样引导员工提出一个更优的 “怎么做”​，是管理者需要思考的问题</p><h2 id="说明白听不如说说不如写写不如画">说明白：听不如说，说不如写，写不如画</h2><p>一个常见的问题是：下属没听懂，执行不到位，是谁的错</p><p>书里提到的观点是：“谁的损失最大，就是谁的错”，本质上是一种<span class="exturl" data-url="aHR0cHM6Ly9zb2xvbWUuanMub3JnL2RvY3MvdW5kZXJseWluZy1sb2dpYy9zdWJqZWN0LXNlcGFyYXRpb24v">课题分离<i class="fa fa-external-link-alt"></i></span>的做法</p><p>如果下属没听懂，显然是你的损失最大，你的兵出了问题你要负责，老板会骂你，所以这是你的错。要记住，谁的损失最大，就是谁的错</p><p><strong>所以不要问员工：你听懂了吗？因为这句话的主语是 “你”​，那听懂这件事就是他的责任，他一般不敢说 “我没听懂”​。在这种情况下，管理者要说：我讲清楚了吗？主语变成了 “我” 之后，责任就转移了，因为管理者能控制的是自己的讲，而不是别人的听</strong></p><p>因此，把信息传到位，确保员工能充分理解，主要责任在管理者层面；沟通有四维度：<u>听、说、写、画</u>，它们的信息沟通效率从左到右依次提升，降维沟通让接受信息的人面对的难度大大降低，但是对传递信息的人的要求大大提高。如下图所示</p><p><img data-src="https://wulc.me/imgs/listen_speak_write_draw.png" height="50%" width="50%"></p><p>用 8 个字来概括这张图，就是 “升维思考，降维沟通 “；前面介绍的<strong>“想清楚”，其实就是一个 “升维思考” 的过程；而 “降维沟通”，就是我们下面要说到的说明白：说替代听，写替代说，画代替写</strong></p><p>首先搞清楚 why；这里涉及到三个 “不如”：听不如说、说不如写、写不如画</p><ul><li>听不如说：听到的信息如果不复述出来，其实是会有较多损耗的，或者其实也没能很好理解</li><li>说不如写：<u>说话时思维是发散的，只有写清楚了，才真的是逻辑清楚</u>。因为 “说” 这件事，可以有信息的往来，可以有信息的重复，可以有口头禅，不需要找到观点与观点之间的先后次序和因果顺序。但 “写” 是不能这样发散的，写的时候你要思考内容的逻辑，你得把一条逻辑线索梳理出来。而卓越的写作能力，不仅有助于提升行政管理水平，还有助于显著提高企业管理者的效率，因为写工作计划、工作总结、演讲稿、会议稿、工作汇报等，都需要很强的写作能力</li><li>写不如画：简单来说就是一图胜千言，研究者有过分析，图像是具象的，调动的多是感性思维；文字是抽象的，调动的多是理性思维。人说到底是感性动物，所以更容易接受图像</li></ul><p>那该如何做？上面也提到了：说替代听，写替代说，画代替写</p><p><strong>说替代听</strong></p><p>在员工听完你的描述且表示清楚后，让员工复述一遍你说的话，在这个过程既能保证员工跟你的理解是一致的，能确保工作的正常进行，同时能检验你的沟通能力</p><p><strong>写替代说</strong></p><p>在常见的 11沟通后，让员工把今天沟通的内容写下来发给你，共同对齐聊过的内容；同样的，会议纪要也是想解决这个问题</p><p><strong>画代替写</strong></p><p>可以把你要讲的比较复杂的概念，通过图来呈现出来；这样对于你的讲解或员工的理解效率是更高的。咨询公司的核心能力之一，就是建模的能力。从某种意义上来讲，建模的能力就是深度思考的能力，就是 “画图” 的能力</p><p>书里提到了一些比较实用的学员案例</p><blockquote><p>我一直都有不善口头表达的心结，因此对沟通这件事心存敬畏。对于一些重要沟通，我会借助于思维导图和 visio 这样的工具，即使没有电脑也会借助清单工具，这种心态就像一个认为自己腿脚不利索的人给自己找了一对拐棍一样。但就是这对拐棍，让我在公司顺利完成了一个口齿伶俐的人都没能完成的需要多单位、多部门协作完成的工作</p><p>写不出东西，就意味着观点没逻辑、工作没思路、计划没统筹。所以，手不释卷、笔耕不辍，是任何一个管理者都必须坚守的修行方式。虽然过程可能很痛苦，但选择一条艰难而正确的路，才会越走越简单</p></blockquote><p>书里还提到了沟通的 7种武器：<u>一对一沟通、即时沟通、电子邮件、走动管理、例会、看板、周报</u></p><p><img data-src="https://wulc.me/imgs/communicate_tools.png" height="50%" width="50%"></p><ul><li><strong>一对一沟通</strong></li></ul><p>一对一沟通的目的，就是解决那些只有私下才能讨论的问题；具体执行上有三个点需要注意</p><p>第一，锁定时间段<br>第二，主要谈员工自己主动提出来的议题。比如谈遇到的职业困扰、家庭的情况、未来的发展规划，而不是谈工作进展。一对一沟通的目的是解决以上这些工作会议解决不了的问题，从而有效降低员工的离职率<br>第三，进行对事不对人的工作失误沟通。<strong>一对一沟通是非常重要的指出员工工作失误的时机</strong>，管理者要把这个失误明确地讲出来，但是要记住，要针对这件事本身，而不是针对这个人。<u>不要对员工说 “你不行，你怎么这么不努力”​，这是针对人的，而要说 “这件事没有达到我们预期的效果，这件事出了几个问题，必须加以改进”​</u></p><p>但有个问题是，一对一沟通往往是管理者发起的，对大部分原来来说，员工是不会做准备的，所以员工会用最简单的方式结束沟通，也就是说，他们沟通的目的是结束沟通；所以在一一沟通前，管理者要告诉员工想讨论什么可以先准备好，而如果管理者真的有问题想问，也可以给员工一张问题清单；如下</p><blockquote><p>最近有哪些让你特别振奋和惊喜的事情？<br>有哪些让你沮丧和纠结的事情？<br>你未来 3～5 年的职业目标是什么？和公司的目标怎么结合？<br>你最近在哪些地方可以提升？有什么计划？我如何帮你？管理者做哪些事情，你的业绩可以更好？<br>你还有什么问题问管理者？</p></blockquote><ul><li><strong>电子邮件</strong></li></ul><p>发电子邮件有一个重要目的，就是留下记录</p><p>电子邮件也适用于公开表扬。批评要私下进行，表扬要公开进行</p><ul><li><strong>走动管理</strong></li></ul><p>走动管理的意思是你不能天天坐在自己的办公室里，要经常走到员工中去，在员工的主场沟通，目的是 “闻味道”​，了解情况，展现亲和力。</p><p>比如说把自己的工位设置在每次从茶水间或卫生间走回去，都能看到所有人的工位；然后要想想，最近你和谁沟通得比较少。然后主动走到他旁边聊两句，问问他：项目最近进展得怎么样？你上次跟我说的那个困难，后来解决了吗？上次我们沟通过的问题，你后来想明白了吗？（存疑，不是所有人都喜欢这种方式）</p><p>走动管理能让员工感受到自己被重视，知道你在随时关注他的任务、关心他的细节</p><ul><li><strong>例会</strong></li></ul><p>开例会的关键，是设定项目检查点，并定期沟通。这其实是一种强制沟通，就是让大家把想说和不想说的问题都说出来，从而预先去解决问题</p><p>在例会上停止说 “这行不通”​，而是要引导员工思考</p><ul><li><strong>看板</strong></li></ul><p>这里特指项目管理工具。常见的如准备一块白板，把项目的进展展示到白板上，目的是让大家同步展示，知道彼此的进度</p><ul><li><strong>周报</strong></li></ul><p>周报的关键点，是管理者要以身作则。只有你带头写，员工才会有写的动力</p><p>梳理在这部分也给出了一个案例，用于说明这一点：<strong>文字是低维沟通，不要只依靠文字就乱猜测，要去升维沟通</strong></p><blockquote><p>与领导沟通，尤其要注意这一点，因为领导与你进行文字沟通时，通常很少用表情。有时候领导用微信问了一下你的项目进度，他可能是在表达对你项目进度的不满，也可能只是单纯地在问你进度，抑或是在关心你，向你示好。如果你的项目有一点延期，千万别自己瞎揣测领导的意思。面对这种情况，要努力做到把沟通 “升维”​，打个电话汇报一下，或者去领导办公室面谈</p><p>我曾经掉进过这个坑里，合伙人在群里跟我说了一句中性的话，当时正赶上我心烦，就 “曲解” 成他在找我的茬，差点一个电话打过去跟他鱼死网破。后来我冷静下来，问了几个关系不错的同事，他们纷纷表示合伙人说的这句话没问题，是我太敏感了</p><p>虽然情绪往往比逻辑跑得快，但也要用理性把情绪拉回来。面对不完整的信息，别自己瞎想，冷静下来，再次确认，把信息补全才是第一要务</p></blockquote><h2 id="能接受避免阳奉阴违">能接受：避免阳奉阴违</h2><p>一些管理者喜欢对员工采用服从性测试，书里举了以下的一些例子</p><blockquote><p><u>有些管理者喜欢用言语营造压迫感，制造不平等</u>。比如说，​“我不明白你在说什么”​，这句话其实是在对员工表达一种极度的不耐烦：你在说什么，连你自己都没有想清楚，就来找我说</p><p>有些管理者会对员工说 “直接讲重点”​。下属正在会议室里满心期待地讲着自己的计划和方案，精美的 PPT 还是昨晚通宵加班做的。但是管理者才听了几句就不耐烦了，一直催促着说：​“下一页，下一页…… 不用说了，我自己先看一看…… 再下一页，嗯，好，我看得差不多了，你直接说重点。​” 这句话背后的心智模式，是想表达你说的全是废话，你说的我全都不关心，别浪费我的时间了。这是想告诉别人：我的脑子转得特别快，我已经知道你想说什么了，你根本不具备用最有效的方式表达观点的能力</p><p>当一个管理者说出 “我这人说话比较直” 时，看上去他好像是想说我是个直接的人，其实他的潜台词是：下面我说的话可能会伤害到你，但是对不起，我对此毫不在意。而说出 “我就是这样的人” 的人，则是把自己的缺点标榜为特点：也许这是我的缺点，但是对不起，我不打算改了。会说这两句话的管理者，放弃了用员工更能接受的方式去沟通交流，也放弃了改变自我的意愿</p></blockquote><p>这些言行都会给行程一种<strong>压制</strong>，属于服从性测试，目的是强化地位的不平等，树立自身的权威</p><p>有些管理者是无意识间这么做了，他们是被不良的职场文化潜移默化地影响了。有些管理者则是刻意进行服从性测试，他们往往还会有后续的手段 —— 如果不服从，我就开除你，让那些愿意服从的人来做这件事</p><p><em>实行服从性训练，效果是有限的：第一，只能对一部分下属有用；第二，只在一段时间内有用；第三，只是表面有用</em></p><p>所以服从性测试往往只能获得 “阳奉”，它的副作用是 “阴违”；关键还是要<strong>提高员工的接受度，与员工建立信任</strong></p><p>这也是前面 “心态跃升” 中沟通部分提到的：权力分为三种，即法定权力、专业权力和魅力权力。想让自己的脑指挥别人的手，要充分理解并运用权力的作用机制，不要只用法定权利</p><p>具体的执行上，除了 “心态跃升” 中提到的 4 种话术，这里还给了 4条建议：<strong>没有私心、不要偏袒、赏罚分明和展示专业性</strong></p><p><img data-src="https://wulc.me/imgs/accept_strategy.png" height="50%" width="50%"></p><ul><li>没有私心：信任来自员工对你的品德的信赖，比如说你会对大家共同的业绩负责，但你对用不良手段获得业绩这件事完全没有兴趣，你要用实际行动来证明这一点</li><li>不要偏袒：怎么才能做到不偏袒？管理者不要跟任何一个员工走得太近，一旦走得太近，就容易造成偏袒</li><li>赏罚分明：很多管理者喜欢表扬和奖励员工，因为员工受到表扬和奖励后会很感谢他，他很享受这个过程。但是，员工犯了错误之后，他却不敢惩罚，因为惩罚可能会引起冲突，很多人是害怕冲突的。一旦不惩罚那个犯错的人，做对的人就会觉得特别不公平。他们就会因为你的懦弱而不敢相信你</li><li>展示专业性：在日常的一些发言中展示自己的专业性，在业务上做对一些决策，拿到成果</li></ul><h2 id="流程制度价值观">流程、制度、价值观</h2><p>有些约定成俗的东西，如果对不同的人一遍遍重复说，效率会很低下，这个时候就要依赖这里提到的三件套：流程、制度和价值观</p><p><img data-src="https://wulc.me/imgs/flow_institution_value.png" height="50%" width="50%"></p><p>流程、制度和价值观是穿越时间的沟通机制，分别对应着方法论、合规性和决策力</p><ul><li><strong>流程：方法论</strong></li></ul><p>制定流程的目的是提升做事的效率，把<strong>正确的事重复做</strong></p><p>整个公司就是个大流程，公司的小团队有自身的特殊性，有自己专门做的事，要给自己制定专门的小流程。制定小流程有个办法，叫 “最佳实践手册”​</p><ul><li><strong>制度：合规性</strong></li></ul><p>制度与流程有时候会比较相似，那这两者的区别是什么？这里可以借用 “章法” 这个词解释</p><p>“章”​（制度）​，是规定，是契约，关注的是什么能做，什么不能做；​“法”​（流程）​，关注的是做事的方法、做事的顺序，是如何做</p><p>比如说公司红线要求、上下班时间要求等规定，就属于制度，制度是用来保证合规性的</p><ul><li><strong>价值观：决策力</strong></li></ul><p>价值观很多时候听起来很虚，但是在很多时候，尤其是做比较高层的决策的时候，如果遇到多种方案都可行（往往很多时候都是这个样子），从技术、市场、成本等方面都无法做出决断的时候，那么最后的判断依据就是价值观</p><p>价值观，是让决策力穿越时间的沟通工具。树立了这个价值观后，大家做事就会保持高度的一致性</p><h1 id="指挥协作">指挥：协作</h1><p>在目标是 “突破自然效率” 的这辆赛车里，动力是燃料，能力是车辆架构，沟通是仪表盘，而接下来要说的协作，则是驾驶技术</p><p>如果说沟通的目的是要达成团队的<strong>意识一致</strong>，那么协作的目的就是要达成团队的<strong>行为一致</strong>，所以这一章会介绍一些团队协作的方法论</p><h2 id="执行提高与发展">执行、提高与发展</h2><p>这部分对应着书里的三个章节：<strong>执行靠闭环、提高靠循环、发展靠规划</strong>；分别对应着短期、中期和长期的策略，或者说<u>短期内完成任务靠闭环，中期的团队成长靠循环，长期的做大做强靠规划</u></p><h3 id="执行">执行</h3><p>当管理者把一些事情分发下去的时候，有时候会发现并没有收到员工的回应，这个仅仅是员工的错吗？</p><p>虽说这跟员工的责任感有一定的关系，但是跟管理者的管理方式也有关系，为了避免这种情况，书里提到要做好三件事：<strong>凡事有交代、件件有着落、事事有回音</strong>，亦即标题提到的 “闭环”；如下图所示</p><p><img data-src="https://wulc.me/imgs/execute_closed_loop.png" height="50%" width="50%"></p><ul><li><strong>凡事有交代</strong>：3W</li></ul><p>一句话说这部分，就是 “<em>谁在什么时间点前做完什么事情 (Who do what bywhen)</em>”。也可以称之为 “3W 方法”​：Who 就是指定人，What 就是说清事，When 就是卡时间。</p><p>如果任务需要几个人来协作完成，那么就需要分解任务，分别指派每个人做什么。而不是说，你们一起把这件事做了。因为，<strong>责任除以 2 等于 0</strong></p><p>另外，deadline 也是很重要的，毕竟 deadline 往往是第一生产力</p><ul><li><strong>件件有着落</strong>：工具 + 流程</li></ul><p>“凡事有交代” 的主体是管理者，​“件件有着落” 的主体是系统。系统就是 “<em>工具 + 流程</em>”</p><p>记忆是不靠谱的，且日常事情比较多的时候容易遗忘。所以要把这些事情记录下来，有各式各样的工具可用，如企业微信、飞书、钉钉、白板、进度跟踪邮件、贴在电脑上的小纸条、便利贴、日程表等</p><ul><li><strong>事事有回音</strong>：</li></ul><p>即不要允许一件事情不了了之，可以改指定人，改事情，改最后期限，甚至任务也可以 “明确” 放弃掉（说清楚放弃的原因），但是不能被默默地删除</p><p>任务如果经常不了了之，会造成以下两种情况：<br>（1）让接受任务的人觉得任务不完成也没事，领导不会说什么，以后的工作也可以不完成<br>（2）是质疑领导的权威性，这个任务也许就是个伪需求？领导怎么分配这种任务？</p><h3 id="提高">提高</h3><p>提高靠循环，书里认为每一个闭环的业务水平都比上一个闭环的业务水平有所提高，就称之为循环</p><p>书里提到的一个方法教 <u>PDCA 循环（又叫戴明环）​：周密计划 (Plan)、严格执行 (Do)、同步检查 (Check) 和及时调整 (Act)</u></p><p><img data-src="https://wulc.me/imgs/PDCA.png" height="50%" width="50%"></p><ul><li> 周密计划</li></ul><p>制订一个好的计划，不是要花大量时间在精美的表现形式上，比如高大上的图表设计或漂亮的 PPT，而是要花大量的时间在调查研究上</p><p>通往利益最近的道路，可能不是最正确的道路（短期与长期的问题）。你必须一开始就把目光放长远，在看到更大的地图之后，规划出那条最正确的路径，这就是周密计划。千万不要用执行的勤奋，掩盖计划的懒惰</p><ul><li>严格执行</li></ul><p>首先是要拆解清楚（心态跃升中提到了一个任务拆解的例子），有了基于计划分解的子任务后，需要明确分配到每个人任务栏里的、有时间限制的具体任务，执行就变得责任明确、优先级清晰</p><ul><li>同步检查</li></ul><p>检查现状相对于计划中设定的标准的偏移度</p><ul><li>及时调整</li></ul><p>基于检查出来的结果做及时改进，并把成功的经验加以推广，固化成流程或标准</p><p>每一次闭环都往上走一步，工作水平就能实现螺旋式上升。如果没有往上走，就是简单的重复；只有往上走了，就是迭代</p><p>书里举了一个利用了 PDCA 解决客户满意度不高的例子</p><p><img data-src="https://wulc.me/imgs/PDCA_example.png" height="50%" width="50%"></p><h3 id="发展">发展</h3><p>执行靠闭环，提高靠循环，其实讲的是短期和中期的事。短期内完成任务靠闭环，管理者有无数需要执行的事在手边，要靠闭环，不能有漏洞；中期的团队成长靠循环，就是闭环之间首尾相连，业务水平不断提高，团队能力才能不断增长。那长期呢？长期的做大做强靠规划</p><p>不要用战术上的勤奋掩盖战略上的懒惰，因为仅靠战术上的勤奋，打不下明天的山头</p><p>一个常见的管理者的现象：从早上 8 点到公司，一直到晚上 7 点多离开公司，他的时间被塞得满满当当。而且这种情况几乎是日复一日，每天都疲于奔命，只顾着处理这些眼前的事情，而忘了抬头想一想以后的发展规划</p><p><strong>时间管理的基本原则，首先要做重要又紧急的事，其次做重要但不紧急的事</strong></p><p>但很多人把重要又紧急的事做完之后，会接着去做紧急但不重要的事，因为它们迫在眉睫。<u>做紧急的事会让自己获得一种<strong>付出的安全感</strong> —— 快速完成任务后的安心与放松；做重要但不紧急的事，比如每天的学习任务，你很可能会觉得焦虑，因为它的效果没有完成紧急任务那么立竿见影。为了逃避焦虑，你会让紧急的事情塞满自己的时间，但它们基本都和发展、成长无关</u></p><p>管理者是通过员工来执行具体任务和完成目标的，执行者活在当下，眼中看到的可能都是紧急的事；可是成为管理者之后，你要培养管理者思维，活在未来，眼中看到的应该都是重要的事</p><p><img data-src="https://wulc.me/imgs/manager_vs_ic.png" height="50%" width="50%"></p><p>因此管理者要经常问自己的几个问题：<u>你要明确明天的目标是什么，打下明天的山头需要什么样的武器，带领明天的部队需要什么样的能力提升</u></p><p>具体规划的三步有三步:（1）练习做三年规划（2）确定最近一年要做的三件事（3）设定一年三件事的衡量标准</p><p><img data-src="https://wulc.me/imgs/three_steps4project.png" height="50%" width="50%"></p><p><strong>（1）练习做三年规划</strong></p><p>问三个问题</p><p><em>问题一：三年之后，我的业务是什么样子的？</em>即三年之后，我们获得了什么样的成就；我们为公司创造了多少利润；我们在别人心目中会获得什么样的认可</p><p><em>问题二：三年之后，我的同事是什么样子的？</em>即三年之后，他们达到什么样的水平，大概有哪些方面的能力，有什么样的背景</p><p><em>问题三：三年之后，我自己是什么样子的？</em>答案因人而异，作者的答案是公司一半以上的收入是与我自己的时间无关的，我可以去开拓公司的第四增长曲线、第五增长曲线</p><p><strong>（2）确定最近一年要做的三件事</strong></p><p>虽然事情多如牛毛，但真正对你和你的部门有重大影响的，一般不会超过三件事。贪多嚼不烂，一年聚焦三件事，足以让部门有所成长</p><p><strong>（3）设定一年三件事的衡量标准</strong></p><p>设定衡量指标的第一原则：有总比没有好。任何管理都需要评估，评估就需要衡量指标。没有衡量指标，就没办法客观地评价团队、评价自己。你可以不用衡量指标来考核，但一定要有衡量指标。它们就像汽车的仪表盘一样，指示着车辆的运行情况<br>设定衡量指标的第二原则：可衡量、数据化<br>设定衡量指标的第三原则：分清楚前置指标、后置指标</p><p>前置指标就是结果还没有发生，但你一看到前置指标，就能预测到这件事会出问题。比如说每天必须见 20 个客户，才会产生销售，这就属于前置指标；后置指标通常是财务指标，比如公司今年完成的销售额是 2000 万元。应该把关键的前置指标而非后置指标作为 KPI 考核指标（其实就是找好中间指标和过程指标）</p><h2 id="文化与流程">文化与流程</h2><p>管理者需要逐步降低自己的重要性，让自己在团队里越来越不重要。反之要让文化和流程变得更加重要，因为这两部分跟前面提到的穿越时间的沟通机制一样，是能够降低 “人” 的不确定性的重要方式，是提高效率的重要途径，是组织规模变大的必经途径</p><h3 id="健康靠文化">健康靠文化</h3><p>再小的公司，再小的团队，都是一个共同协作体，就像整个人类社会是共同协作体。要理解人类的协作，我们要先理解三件事：人性、道德和法律</p><p><u>人类社会是靠人性、道德和法律这三个因素来协作运行的。公司作为一种组织，带有人类社会的基因，也有三个类似的因素：利益、​（企业）文化和制度，它们与人性、道德和法律一一对应</u></p><p><img data-src="https://wulc.me/imgs/human_nature_morality_law.png" height="50%" width="50%"></p><p>文化不是刚性的约束，它是大家要倡导的东西，以此让整个公司运行得更好；文化某种程度上也可以理解为集体主义精神</p><p>打造健康文化的三个建议：（1）鼓励白、压缩灰和禁止黑（2）用人不疑，事情要查 （3）提高可预测性</p><p><img data-src="https://wulc.me/imgs/culture_3_tips.jpg" height="50%" width="50%"></p><p><strong>（1）鼓励白、压缩灰和禁止黑</strong></p><p>鼓励白。就是用 “利益” 来鼓励那些公司认为正确的事。比如，业绩好就给奖金；对公司的发展有巨大贡献，就给股份</p><p>压缩灰。比如员工只顾自扫门前雪，不去帮助别人，这就是灰度的。你不能说他是坏人，也不能因为这种行为把他开除，这时就要用 “文化” 来管理</p><p>禁止黑。禁止黑就是用 “制度” 来明确有些事绝对不能做。比如说做新媒体，抄袭就是一条刚性边界，绝对不能碰，哪怕抄袭一点点也是黑，必须严惩。要从第一天开始就依照制度禁止黑，否则以后很难往回收</p><p><strong>（2）用人不疑，事情要查</strong></p><p>“不疑” 的是一个人的用心，这是对人的一种信任；​“查” 的是这件事情本身的完成度。抱着 “<strong>不疑但查</strong>” 的心态，你才能用利益、文化和制度来鼓励和规范人们的行为</p><p><strong>（3）提高可预测性</strong></p><p>有的管理者认为不要让下属猜透自己的想法，要把话说得模棱两可，这样自己就不会犯错，就能保住自己的权威性</p><p>但实际上管理者提升自己的透明度和确定性，让员工可预测（包括管理者的决策可预测，自己的升职加薪可预测），都有利于提升协作效率。因为如果管理者的决策不可预测，所有的决策都要经过管理者才能拍定，这无疑是非常低消的</p><p>管理者的可预测性，带来决策的一致性，带来授权的可能性。只有可预测，管理者才能让自己变得越来越不重要，让利益、制度和文化变得重要，公司才能演变为生命体</p><h3 id="效率靠流程">效率靠流程</h3><p>流程就是把复杂的事情、类似的决策标准化。流程往往是是一个或一系列连续有规律的动作</p><p>流程有三点重要作用</p><p>（1）流程能够<strong>减少不必要的重复沟通</strong></p><p>（2）流程可以<strong>降低 “人” 的不确定性带来的系统性风险</strong>，对于企业已经探索过无数遍并已经找到最优路径的事情，就没有必要让员工再去自行探索，以免掉进陷阱带来系统性风险</p><p>（3）企业可以让员工凭借流程，获得可预期的、持续的、稳定的产出，跟前面提到的可预测性是一致的</p><p>跟流程出现的往往还有愿景和价值观；如果说流程是 “怎么做” 的标准化，那愿景是 “为什么” 的标准化，价值观是 “是什么” 的标准化</p><p><img data-src="https://wulc.me/imgs/flow_vision_value.png" height="50%" width="50%"></p><p>利用流程来提高效率的三个步骤：<strong>建立流程、优化流程、固化流程</strong></p><p><img data-src="https://wulc.me/imgs/use_flow.png" height="50%" width="50%"></p><h2 id="授权">授权</h2><p>管理的本质是通过他人完成任务，所以管理者是要依赖大家的，而不是大家依赖于管理者，那样管理者肩负重任，就走不了很远</p><p>一个反面例子是当看到员工做错事时，他会说，​“你放着，我来”​。当他熬夜帮下属做好，下属特别感激时，他自我感觉非常好：这才是当老大的样子，老大就是要有担当啊！其实这是不对的。<em>在这种状态下，他享受的不是 “管理者” 的成就感，而是 “被依赖者” 的成就感</em></p><p>授权有五个级别：指挥式、批准式、把关式、追踪式、委托时</p><p><img data-src="https://wulc.me/imgs/accredit_levels.png" height="50%" width="50%"></p><p>（1）<strong>指挥式授权：员工按照命令和指示工作</strong></p><p>自己是头，下属是手，完全不需要思考，自己说什么下属就做什么，这就叫指挥式</p><p>指挥式是很多管理者一开始最常用的授权方法，至少他把要做的具体事情交出去了，事情不是自己做了，而是别人做了</p><p>（2）<strong>批准式授权：员工在取得上司批准后工作</strong></p><p>员工思考，但是决定由经理来做，这是批准式</p><p>员工拿着两个方案过来找经理，经理问他：​“这个方案和那个方案的缺点分别是什么，怎么改进？​” 员工说，应该这么改进…… 经理听完，说：​“不错，你去干吧。​” 这就叫批准式</p><p>（3）<strong>把关式授权：员工在关键环节请示批准</strong></p><p>跟前面比较相似，只是员工请示的频率不太一样</p><p>（4）<strong>追踪式授权：员工在过程中先斩后奏</strong></p><p>在一件事的整个流程中，员工可以先斩后奏，可以不请示，但是做完之后还是得向经理报告</p><p>（5）<strong>委托式授权：上级只关注结果</strong></p><p>“你想怎么做就怎么做，别来问我，我只看最后有没有把‘城池’拿下”​，这就是委托式授权</p>]]></content>
    
    
    <summary type="html">&lt;p&gt;在此前的文章 《&lt;a href=&quot;https://wulc.me/2024/08/18/%E5%85%B3%E9%94%AE%E8%B7%83%E5%8D%87_%E5%BF%83%E6%80%81/&quot;&gt;关键跃升：心态&lt;/a&gt;》中，介绍了书的上半部分，即心态上的需要做出的一些改变，本文主要讲的是剑法法部分，即管理者需要扮演好四种角色 “&lt;strong&gt;鼓手、教练、政委、指挥&lt;/strong&gt;”，这部分也涉及到比较多的方法论，值得一读～&lt;/p&gt;</summary>
    
    
    
    <category term="管理" scheme="https://wulc.me/categories/%E7%AE%A1%E7%90%86/"/>
    
    
    <category term="读书" scheme="https://wulc.me/tags/%E8%AF%BB%E4%B9%A6/"/>
    
    <category term="管理" scheme="https://wulc.me/tags/%E7%AE%A1%E7%90%86/"/>
    
  </entry>
  
  <entry>
    <title>关键跃升：心态</title>
    <link href="https://wulc.me/2024/08/18/%E5%85%B3%E9%94%AE%E8%B7%83%E5%8D%87_%E5%BF%83%E6%80%81/"/>
    <id>https://wulc.me/2024/08/18/%E5%85%B3%E9%94%AE%E8%B7%83%E5%8D%87_%E5%BF%83%E6%80%81/</id>
    <published>2024-08-18T03:08:18.000Z</published>
    <updated>2026-02-28T05:01:22.865Z</updated>
    
    <content type="html"><![CDATA[<p>最近在看《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zNjk0NjkwNy8=">关键跃升<i class="fa fa-external-link-alt"></i></span>》，里面的不少观点还是颇有启发的，用作者的话来说，这是 “一本适合中国管理者的管理读本”；但无论是管理者还是被管理者，笔者觉得都有必要去了解一下管理的相关内容，才能更好地扮演自己在职场中的角色</p><p>书名的跃升，粗糙来说就是通过 “自己完成任务” 跃升到 “通过别人完成任务”；书里把这部分拆成了两部分：心法和剑法，翻译一下就是心态和行动上需要做出的改变；心法包括了 “<strong>责任、沟通、关系，自我</strong>” 四大块，剑法则是强调管理者需要扮演好四种角色 “<strong>鼓手、教练、政委、指挥</strong>”；整本书的内容脉络较为清晰，比较通俗易懂，值得一读；本文主要是心法部分～</p><span id="more"></span><p>书里一开始就提出了一个灵魂拷问：为什么 “不干活” 比 “干活” 的拿钱多？在数量上，这些 “不干活” 的管理者和干活的人相比，大约是 1:5 的关系。也就是说，大概每 5 个 “干活的人”​，就有 1 个 “不干活的人” 管着</p><p>这个自然是调侃的说法，<u>“不干活” 的管理者专注的事情是 “自然效率”的作战上，所谓 “自然效率”，就是在在 “自发分工，随机协作” 机制下的工作效率，往往是不高效的</u></p><p>而<strong>管理者的工作，即使是用管理效率打败自然效率，管理者的价值，就体现为在有你和没你两种情况下团队所创造的价值的差额</strong>，即如下的公式</p><p>你的价值 = 团队价值 ×（管理效率 - 自然效率）</p><p>所以，书里的观点是，管理者最重要的工作不是直接撸起袖子去干活，而是要把管理效率提升上去；不过笔者觉得这里要考虑到管理者的团队规模，对于规模不大的团队，通过流程机制去提升效率有限，而管理者本身能够亲自下场把手弄脏也是有必要的</p><p>那怎么提高管理效率？靠的就是上面提到的 “心法 + 剑法” 部分，这里主要讲心法部分，也就是心态上的需要做出的一些转变；因为在成为管理者后，首先需要改变的就是心态</p><p>心态跃升包括了四部分：责任、沟通、关系和自我，而这四部分，是从 “自己做事” 到 “通过别人做事” 需要的四个心理上的跃升；这里还是用书里的一张图来讲述</p><p><img data-src="https://wulc.me/imgs/managing_mentality.png" height="50%" width="50%"></p><h2 id="责任">责任</h2><p>责任跃升，简单来说就是要<u><strong>从对任务负责过渡到对目标负责</strong></u></p><p>书里列举了四种类型的责任感：时间、任务、目标、使命；如下图所示</p><p><img data-src="https://wulc.me/imgs/sense_of_responsibility.png" height="50%" width="50%"></p><p><em>对时间负责的人，遇到挫败时会说 “我一直都在忙，又没闲着”​；对任务负责的人，遇到挫败时会说 “该做的我都做了，问心无愧”​；对目标负责的人，遇到挫败时会说 “一定有办法能走出去，继续寻找”​</em>；对目标负责，管理者需要为不如意的结果与员工犯的错无限兜底，俗称 “能扛事”</p><p>对目标负责，涉及到的很重要的一环是要把目标拆解成任务，这个需要对业务足够了解，并借用一定的方法和技巧，书里就给了这么一个例子，虽然不是非常严谨，但是也给了我们一个新思路：“<strong>先拆解，再拆分；拆解是做乘除法，拆分是做加减法</strong>”</p><blockquote><p>今年要完成 5000 万元的服装销售额。管理者立马跟我聊：​“我的团队里有 5 个小伙伴，每人完成 1000 万元行不行？​” 我说：​“这是不行的，这是做加减法，是拆分，不是拆解。​”</p><p>拆解是做乘除法。基于对业务的深度理解，可这样拆解销售目标。<u>销售目标 = 店铺粉丝数 × 转化率 × 客单价</u>，然后可以针对目标拆解出来的每一项再做专项提升</p><p>拆分是做加减法。以粉丝数的拆分为例，将达成 17.5 万粉丝的目标拆分为季度目标：第一、第二季度的任务要更重些，这样上半年的业绩数据才不至于难看。然后怎么做？第一，通过优质短视频加粉；第二，通过裂变加粉，以打折等优惠活动推动用户分享店铺给朋友，朋友加粉后再分享给各自的朋友；第三，通过平台做推广活动，用便宜商品引导加粉。这三个任务分别由不同的员工负责。</p></blockquote><p>管理者把目标拆解为任务之后，每个员工就可以专心去忙自己的任务。如果之后还是没达成目标呢？这时候管理者要记住一句话，​“降妖除魔你去，背黑锅我来”​。管理者要扛住这个责任，因为团队管理者要承担目标层面的后果，而员工只承担任务层面的后果</p><h2 id="沟通">沟通</h2><p>沟通跃升，简单来说就是<u><strong>从用自己的手到用别人的脑</strong></u></p><p>在这个过程中由于涉及到了多层漏斗，往往会出现低效的问题；因为过去你自己能完成的任务，现在要通过员工来完成，<em>沟通机制发生了变化，你正在从 “无损沟通” 走向 “有损沟通”​</em>，原因如下图所示</p><p><img data-src="https://wulc.me/imgs/inefficient_communication.png" height="50%" width="50%"></p><p>沟通是一个很大的话题，在后面会有专门一章来讲这部分，这里主要提出了让沟通尽量无损的方式是，对员工<strong>不做直接的否定</strong>，书里针对这点给了4 种话术，如下图所示</p><p><img data-src="https://wulc.me/imgs/no_deny.png" height="50%" width="50%"></p><p><strong>（1）不要说 “这不行”​，而要说 “如果…… 就……”</strong></p><p>从不直接否定别人，而是以建设性的方式跟人沟通，员工缺块砖，你就应该给员工加块砖，员工缺根木头，你就应该给员工加根木头。用好​“如果…… 就……”​，<strong>​“如果” 的后面就是你加上去的建议</strong></p><p><strong>（2）不要说 “but”​（但是）​，而要说 “yes…and…”​（是的…… 同时……）</strong></p><p>这个跟 “如果…… 就……” 有点像，不直接否定，<em>因为一说 “但是”​，你就和对方站在了对立面。而只有你和对方站在同一边的时候，才更加有助于达成共识</em></p><p><strong>（3）“你是不是这么觉得的？​”</strong></p><p>当对方一通说，可能你没有很好抓住对方重点时，可以尝试说 “我帮你总结一下，你是不是这样觉得的？”，然后说出第一点、第二点、第三点……；这个过程会考验你的理解和总结能力；同时这样做还有一个好处，就是当你帮对方总结，对方也会把你整理过的内容当做他的观点</p><p><strong>（4）“我知道你是出于善意”</strong></p><p>这种话主要是应用在这种场景下：你在与下属沟通时，有时他是抵触的，有时他就是想让你难堪，有时他只是要证明自己能力强，跟你观点不一样。这个时候不要跟下属直接吵起来或当面对质，因为没有人会认为自己是那个 “坏人”​，就算他做了坏事，他也一定为自己找好了理由。哪怕你戳穿了他，他也一定会本能地从认知协调出发，维护自己的动机，于是他就会记仇</p><p>这个时候我们可以这么沟通：<u>我注意到你最近做了件什么事（描述行为）​，我知道你是出于善意（肯定动机）​，我看出来了，你还瞒着我，我非常感激。虽然这份善意没有真的起到作用，甚至对我有一些不好的影响，但我还是很感激（表达善意）​。如果你能这样做，就更好了（给出建议）​</u></p><p>这几种谈话方式，都对管理者的胸怀、格局以及情绪控制等能力都有一定要求，因为善意待人并不是每个管理者都能做到的，尤其是在面对业务压力、来自上一级的压力的情况下；但是如果能做到了，必然是个有魅力的老板</p><p><u>权力分为三种，即法定权力、专业权力和魅力权力</u>。想让自己的脑指挥别人的手，要充分理解并运用权力的作用机制。如果你只有法定权力，现在年轻的员工根本就不听你的，因为 “90 后”​“95 后” 年轻人的成长环境更多元，家境相对优越，个体意识很强，对权威不盲从。所以<strong>团队管理者应将其他两种权力发挥到极致</strong>，也就是说，要想指挥优秀年轻人的手，你有两条路：一是让他们佩服你，二是让他们喜欢你；而良好的沟通，在其中是一个很重要的途径</p><h2 id="关系">关系</h2><p>关系跃升，简单来说就是<u><strong>从左右的伙伴到上下的战友</strong></u></p><p>在心理上，<strong>管理者需要意识到，员工的关系既不是家人关系，也不是朋友关系，而是战斗友谊</strong></p><p>因为公司或团队是一个战斗单元。是战斗，就有战斗目标。大家是为了达成目标而集结的，一旦目标达成，可能就会解散。这个战斗单元会长期存在，但是战斗单元中的人会时常更换，有人会加入，有人会离开。在战斗中，大家会结下深厚的情谊，但这种情谊依然是战斗情谊。我们在这里际会，但我们不是家人关系，也不是对人不对事的朋友关系</p><p>在行动上，<strong>管理者要和员工保持亲而不密的关系</strong></p><p>什么叫 “亲而不密”​？管理者对员工一定要认真地关心，比如关心他们的身心健康，关心他们的持续成长，但是不要保持那么亲密的关系，<em>因为越亲密的关系，越容易导致对人不对事</em>。作为管理者，你要让员工明白，他能如鱼得水，一定是因为承担了更大的责任，而不是跟你有更近的关系</p><p>那该如何做到 “亲而不密”？书里给了两点建议 1）不要拿员工的一针一线2）日常交际不要关系过于亲密</p><p>第一点是因为书里提到的一个现象：有的员工送多了东西，觉得自己跟管理者更亲近，甚至会恃宠而骄，仗势欺人，制造团队分裂。但是实际中，会有员工真的因为感激老板这一段时间的帮助和教导，而愿意请老板吃饭或者送一些东西的，即使两者不再</p><p>另外书里的学员案例，还给出了一些比较实用的案例，值得参考</p><ul><li>从你被提拔到管理岗位到大家认可你的管理，是存在时间差的。在这个时间窗口，<u>不要一上来就啃硬骨头，跟 “反对派” 死磕，死磕往往是磕不动的，因为你缺乏根基。你应该先好好工作、展现实力，争取得到上级领导的肯定和下属中中间派的拥护</u></li><li>我有一次开会时与一个资深组员争执得面红耳赤，谁都说服不了对方。那时我忽然意识到，其实我们的方案都有合理的地方，但是碍于面子谁都不愿意退让。于是，后来我在<u>需要做重要决策的会议前，都会先私下跟组员沟通，了解每个人的想法和诉求，再做一些协调工作，确保跟每个组员都能基本达成一致后，再开会把事情敲定下来。这样一来，激烈的争执就不会发生了</u>（体面）</li><li>上司不讲情面，按照要求该批评就批评，该严厉就严厉，坚定地对团队目标负责，看似心硬、心狠，其实这才是真正为所有人好</li></ul><h2 id="自我">自我</h2><p>自我跃升，简单来说就是<u><strong>从小我的满足到大我的成就</strong></u></p><p>职场上一直有这一种说法：不要轻易在老板面前提出反对的观点，老板不会表现出自己是同意的，因为他没有办法在下属面前承认自己是错的。书里把这个现象叫 “瞬间顽固症”​：即证明他是对的，比证明这件事本身是对还是错更重要；而原因则是个人的心中的自我 (ego) 边界太小，能量太强</p><p>那什么是自我？猎豹移动（原金山网络）CEO 傅盛对 “自我” 的看法是这样的：<u>​“自我” 是非常感情化的东西，它会在人的内心建立起一种心理防御机制。因为你不喜欢犯错误的感觉，你的本能就总想强行辩驳，别人一批评，你就怒了；因为你害怕面对复杂的东西，你就本能地希望把问题简单化。你的出发点不是为了面对现实，而是充满了 “我我我”—— 这就是自我的障碍</u></p><p>这个防御的围墙，就是自我边界，或者更通俗来讲就是常说的 “格局”；自我边界会把 “我” 以及 “我关心的” 和他人隔离开，你的同事做得比你好，你会有点嫉妒，因为同事在你的自我边界之外；但是你的孩子做得比你好，你会嫉妒吗？不会的。你甚至会因为孩子做得比自己好而更加高兴，因为孩子进入了你的自我边界内</p><p><strong>一个人的成长，就是从没有自我边界到形成自我边界，再到延展自我边界的过程</strong></p><p><img data-src="https://wulc.me/imgs/self_ego.png" height="50%" width="50%"></p><p>当你是员工的时候，有较小的自我是可以的。但是从员工晋升到管理者后，这就有问题了，你会不断面临关于自我的挑战，可能会产生三种重要的害怕：<u>（1）怕自己被证明是错的（2）怕下属的能力超过自己（3）怕下属的影响力超过自己</u>；这会几大影响自己和员工的关系</p><p>那管理者怎么扩大自我的边界？书里给的建议是：关注全局效率，把关注点放到更大的格局上，找两个榜样，父母和君王。管理者要向他们学习，从追求 “小我” 的满足，变成追求 “大我”—— 团队和企业的成就，这样才能拥有更广阔的一片天</p><p><img data-src="https://wulc.me/imgs/global_efficiency.png" height="50%" width="50%"></p><p>一个人的格局、胸怀、气度，指的就是这个人的自我包含了多少东西。管理者要靠团队的成功来获得成功，这就至少要走出第一步，把自我的边界往外扩一层，把下属全都划进来。放大自我并不意味着牺牲自己，下属的成功就是你的成功，他们的快乐就是你的快乐</p>]]></content>
    
    
    <summary type="html">&lt;p&gt;最近在看《&lt;span class=&quot;exturl&quot; data-url=&quot;aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zNjk0NjkwNy8=&quot;&gt;关键跃升&lt;i class=&quot;fa fa-external-link-alt&quot;&gt;&lt;/i&gt;&lt;/span&gt;》，里面的不少观点还是颇有启发的，用作者的话来说，这是 “一本适合中国管理者的管理读本”；但无论是管理者还是被管理者，笔者觉得都有必要去了解一下管理的相关内容，才能更好地扮演自己在职场中的角色&lt;/p&gt;
&lt;p&gt;书名的跃升，粗糙来说就是通过 “自己完成任务” 跃升到 “通过别人完成任务”；书里把这部分拆成了两部分：心法和剑法，翻译一下就是心态和行动上需要做出的改变；心法包括了 “&lt;strong&gt;责任、沟通、关系，自我&lt;/strong&gt;” 四大块，剑法则是强调管理者需要扮演好四种角色 “&lt;strong&gt;鼓手、教练、政委、指挥&lt;/strong&gt;”；整本书的内容脉络较为清晰，比较通俗易懂，值得一读；本文主要是心法部分～&lt;/p&gt;</summary>
    
    
    
    <category term="管理" scheme="https://wulc.me/categories/%E7%AE%A1%E7%90%86/"/>
    
    
    <category term="读书" scheme="https://wulc.me/tags/%E8%AF%BB%E4%B9%A6/"/>
    
    <category term="管理" scheme="https://wulc.me/tags/%E7%AE%A1%E7%90%86/"/>
    
  </entry>
  
  <entry>
    <title>把手弄脏，去填补认知的缝隙</title>
    <link href="https://wulc.me/2024/07/14/%E6%8A%8A%E6%89%8B%E5%BC%84%E8%84%8F%EF%BC%8C%E5%A1%AB%E8%A1%A5%E7%9F%A5%E8%AF%86%E7%9A%84%E7%BC%9D%E9%9A%99/"/>
    <id>https://wulc.me/2024/07/14/%E6%8A%8A%E6%89%8B%E5%BC%84%E8%84%8F%EF%BC%8C%E5%A1%AB%E8%A1%A5%E7%9F%A5%E8%AF%86%E7%9A%84%E7%BC%9D%E9%9A%99/</id>
    <published>2024-07-14T08:51:23.000Z</published>
    <updated>2026-02-28T05:01:22.752Z</updated>
    
    <content type="html"><![CDATA[<p>过去较长一段时间，一直有这种感觉：对于某个事情或想法，<strong>“听到了” 跟 “理解了” 中间有一段距离，“理解了” 跟 “实现了” 中间又有一段距离，“实现了” 跟 “做成了” 中间则会有一段更大的距离</strong>。简单来说，就是 “知” 与 “行” 之间存在着巨大的鸿沟，且仅站在 “知” 这一端的人往往是看不到这个差距所在的</p><p><img data-src="https://wulc.me/imgs/gaps_in_understanding.png" height="20%" width="20%"></p><p>最近听到的这期播客 《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY2NDMwMGU0MjUxYmQ5NmU2YzJlNTdhNg==">E35.知识的缝隙<i class="fa fa-external-link-alt"></i></span>》，更为系统和深入地探讨了这个现象及其底层原因，也让笔者对上面的 “距离” 有了更深的理解，用播客的话来说，这些距离就是那些认知的缝隙。播客从费曼学习法开始说起，逐步揭开了那些看似光滑的认知弧线下存在的缝隙，而躬身入局、把手弄脏，去填补这些认知的缝隙，也许就会有想不到的收获</p><p>写这篇的文章的过程，亦是笔者在填补自己认知的缝隙的过程，文章可能有点发散，祝开卷有益～</p><span id="more"></span><h2 id="从费曼学习法说起">从费曼学习法说起</h2><p><span class="exturl" data-url="aHR0cHM6Ly9iYWlrZS5iYWlkdS5jb20vaXRlbS8lRTglQjQlQjklRTYlOUIlQkMlRTUlQUQlQTYlRTQlQjklQTAlRTYlQjMlOTUvNTA4OTUzOTM=">费曼学习法<i class="fa fa-external-link-alt"></i></span>,可以算是一个耳熟能详的方法了，这是一个以教为学，让输出倒逼输入的方法</p><p>费曼学习法的基本流程是，就是给一个完全不懂某个理论或方法的人（有请小孩和老奶奶出场）去介绍这个理论或方法，然后在这个过程中，你会发现自己也不是非常理解其中的细节，不能用自己的话去把这部分说明白，然后需要回头去调研学习这部分，直至能够清晰地描述清楚；这个过程不断循环往复，也就是你学习的一个过程了</p><p>而其核心的点，就是在给其他人讲述过程中，你就会发现大量此前自己可能只听过但不求甚解的细节，即下图的gaps in your understanding，而这，就是本文描述的认知的缝隙</p><p><img data-src="https://wulc.me/imgs/feyman_learning.png" height="60%" width="60%"></p><p>费曼学习法，最大的受益人，其实是讲述的那个人，因为在这个过程中，他填补了过去自己一直忽略的那些认知的缝隙</p><p>对于这一点，笔者在写 blog过程中也是深有体会，每当笔者希望写一个感兴趣的话题时，脑子里的会冒出一个个的想法，这些想法就像一个个孤立的dots；当我们尝试通过文字和逻辑来 connect the dots时，你会发现需要你不断地理清楚需要用哪些线，来把哪些 dots给连接起来；那些你 “听过了”，甚至以为 “理解了” 的dots，此刻就像一个个犹抱琵琶半遮面的羞涩少女，让你见不到其庐山真面目</p><p>而当你去反复去查漏补缺，去把那层若影若现的面纱揭开时，你找到的那些用来连接的线，恰恰就是在不断地填补你认知的缝隙的，当你完成这个拼接的过程后，就能得到一张更加全面的知识的图谱</p><p>无独有偶，查理芒格的 “猩猩效应”，从另一个角度来阐述这些认知的缝隙是如何被填补的，在《<span class="exturl" data-url="aHR0cHM6Ly94dWVxaXUuY29tLzQ4NjYwMjEzMzQvMjQ5NjIwOTM1">2022 年度伯克希尔哈撒韦致股东的信<i class="fa fa-external-link-alt"></i></span>》中是这么说的</p><blockquote><p>教学和写作一样，帮助我发展和理清了自己的思路。查理称这种现象为猩猩效应：如果你和一只猩猩坐在一起，仔细地向它解释你的一个宝贵想法，你可能会留下一只迷惑不解的灵长类动物，但你自己的思维会更清晰</p></blockquote><p>编程中的 <span class="exturl" data-url="aHR0cHM6Ly96aC53aWtpcGVkaWEub3JnL3dpa2kvJUU1JUIwJThGJUU5JUJCJTg0JUU5JUI4JUFEJUU4JUIwJTgzJUU4JUFGJTk1JUU2JUIzJTk1">小黄鸭调试法<i class="fa fa-external-link-alt"></i></span>，也是在阐述这个道理，只是在这个过程中，费曼学习法中的小孩和老奶奶、查理芒格的那只猩猩，变成了你桌上的那只一语不发，但是你一旦跟它交流，便能发现自己的认知的缝隙的小黄鸭</p><blockquote><p>许多程序员都有向别人提问及解释编程问题的经历，而对象甚至可能是完全不懂编程的人。而就在解释的过程中，程序员可能就发觉了问题的解决方案。一边阐述代码的意图，一边观察它实际上的行为并做调试，两者间的任何不协调都会变得更明显，使人更容易发现错误所在。</p></blockquote><p>说到这里，又想起了在《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY1NTMxN2RhOWY0NDBmNTQ0MzM5ODQ2OQ==">中<i class="fa fa-external-link-alt"></i></span>》的那一期，孟岩提到的一个观点：<em>任何道理、方法，都是描述一个人的体验，都是观察世界的一个角度。如果这个角度或者方法足够的深刻、底层或者通用，你一定还能找到其它人的描述</em>（ps，这期播客很棒，推荐一听）</p><p>因此，无论是费曼学习法、猩猩效应，亦或是小黄鸭调试法，我想都是从多个角度观测到了这一点：认知的缝隙无处不在，当我们尝试把那些看似 “理解了” 的知识再说一遍时，也许就能发现这些缝隙所在</p><h2 id="看到那些认知的缝隙">看到那些认知的缝隙</h2><p>工作中，老生常谈的一个问题是，深度与广度，是持续精进一个方向，还是扩大自己的知识面，当然这二者并不矛盾，但是在时间有限情况下，深度还是广度，的确是需要做出抉择，否则就真的要成了 “吾生也有涯，而知也无涯。以有涯随无涯，殆已”</p><p>有一种好奇心爆棚的人（包括笔者），不断学习新知识，来喂养那个嗷嗷待哺的装着你的好奇心的婴儿，是一个乐此不疲的过程，因为一直学的都是新知识，且<span class="exturl" data-url="aHR0cHM6Ly96aC53aWtpcGVkaWEub3JnL3dpa2kvJUU1JUFEJUI4JUU3JUJGJTkyJUU2JTlCJUIyJUU3JUI3JTlB">学习曲线<i class="fa fa-external-link-alt"></i></span>在学习的初期并不陡峭，只了解个所以然，犹如柯立芝效应那般的新鲜感，是能够支持你废寝忘食去做这个事情的</p><p>但如果只有广度，持续这样停留在对浅层知识仅仅是了解的层面，很容易出现一种情况，即看起来好像什么都能做，但又什么都做不精，或者说上手去做的时候，才发现自己此前选择性地忽略了很多细节。而这，恰恰是那填补些认知的缝隙所需要的，就比如我们都知道把一头大象放进冰箱只需要3 步：打开冰箱 -&gt; 把大象放进去 -&gt;关上冰箱，但仅仅依靠这些信息，我们真的能够把大象放进冰箱么</p><p>只有广度没有深度，我们很容易有一种 “<strong>知识的错觉</strong>”，误以为 “听到了”，就是 “理解了”，而 “理解了” 又差不多算 “实现了”；但真的想真的擅长一件事儿，做成一件事，绝不是听到了就可以了，而是需要填补很多很多的空隙</p><p><span class="exturl" data-url="aHR0cHM6Ly96aC53aWtpcGVkaWEub3JnL3dpa2kvJUU5JTg0JUE3JUU1JUFGJUE3LSVFNSU4NSU4QiVFOSVBRCVBRiVFNiVBMCVCQyVFNiU5NSU4OCVFNiU4NyU4OQ==">邓宁克鲁格效应<i class="fa fa-external-link-alt"></i></span>提到：<strong>你的能力越差，就越意识不到自己的能力有多差</strong>；同样的，我们填补的空隙越多，就会知道有更多的空隙我们看不到，引用在格雷厄姆的《<span class="exturl" data-url="aHR0cHM6Ly9wYXVsZ3JhaGFtLmNvbS9ncmVhdHdvcmsuaHRtbA==">How to Do GreatWork<i class="fa fa-external-link-alt"></i></span>》中的一段话，是这么说的</p><blockquote><p>Once you've found something you're excessively interested in, thenext step is to learn enough about it to get you to one of the frontiersof knowledge. Knowledge expands fractally, and <strong>from a distanceits edges look smooth, but once you learn enough to get close to one,they turn out to be full of gaps</strong>.</p><p>The next step is to notice them. This takes some skill, because<strong>your brain wants to ignore such gaps in order to make a simplermodel of the world</strong>. Many discoveries have come from askingquestions about things that everyone else took for granted</p></blockquote><p>随着我们知道的越多，我们不知道的必然也会越多，在 <span class="exturl" data-url="aHR0cDovL21hdHQubWlnaHQubmV0L2FydGljbGVzL3BoZC1zY2hvb2wtaW4tcGljdHVyZXMv">TheIllustrated Guide to a Ph.D.<i class="fa fa-external-link-alt"></i></span> 有一个形象的描述</p><p>想象一个包含所有人类知识的圆圈。你读完小学的时候，你知道的是其中的一个点（蓝色）。当你高中毕业时，你知道的更多了，是图中绿色的环。有了大学学士学位，你就获得了一个专业，图中红色区域属于你的状态（基础知识和突出的专业）。硕士学位深化了这个专业，深红色冒出的区域。在博士期间，阅读研究论文会把你带到人类知识的边缘（圆周）。一旦你到了边缘，你就会聚焦于边缘上的某点</p><p><img data-src="https://wulc.me/imgs/guide_to_phd.jpeg" height="50%" width="50%"></p><p>你在边缘上努力工作了几年，直到有一天，边缘被你突破了，你创造了新的知识）。那个你凸起的鼓包，叫博士学位</p><p><img data-src="https://wulc.me/imgs/phd_spot.jpeg" height="60%" width="60%"></p><p>当我们懂得越多，代表我们知识的那个圆的面积越变越大时，我们会发现我们对这个世界不了解的地方也会越来越多（圆的周长越来越大）</p><p>在这个过程中，人很容易从慎重的初学者到无意识的无能者，可能圆就不会再变大的；用播客的话来说就是 <em>“因为大脑在我们的脑海中绘制了一条看似光滑的弧线，这条光滑的弧线会欺骗我们已经懂了这件事，但下面其实有很多缝隙”</em>，如果没法突破这一点，我们很可能一辈子就在那个小圆里坐井观天，固步自封了</p><p>在我很喜欢的一期播客《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzYxYmZlYWY0MmQyMjM4NTVlZDBhZjU5OA==">我们都是不明真相的群众<i class="fa fa-external-link-alt"></i></span>》里，方丈提到的几个观点，无论是 “在投资上，发现自己傻 X 比证明自己牛 X 重要一万倍”，还是 “在更长的时间维度面前，再聪明的人也是一个傻瓜”，都在时刻提醒我们去承认自己对绝大多数事情知道得并不多，去注意到那些认知的缝隙（ps，这期播客也很棒，推荐一听）</p><p>因此，我们对待知识，要足够的诚实和耐心，引用《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zNDk5Nzk3NS8=">文明、现代化、价值投资与中国<i class="fa fa-external-link-alt"></i></span>》里面一段话是这么说的</p><blockquote><p>知识是慢慢积累起来的，但是你必须一直抱有对知识诚实的态度，这个概念非常重要，因为人很难做到真正的客观理性。人都是感情的动物，我们相信的东西，对我们有利的东西通常就会成为我们的预测。我们总是去预测这个世界对我们很好，而其实客观上我们都明白这个世界不是为你存在和安排的。所以做到对知识的诚实很难，但是非常重要。</p><p>知识是一点一滴积累起来的，当你用正确的方法去做正确的事，你会发现知识的积累和经济的增长是一样的，都是复利的增长。过去所有学到的经验都能够互相印证、互相积累，慢慢的你就开始对某些事情有把握了 (能力圈）</p></blockquote><h2 id="把手弄脏填补缝隙">把手弄脏，填补缝隙</h2><p>纸上得来终觉浅，绝知此事要躬行，把手弄脏，或许是我们去填补认知的缝隙里绕不过去的一环。把手弄脏，这里的一层含义是要亲自去体会与实践，另一层含义，则是需要我们在这个过程中有足够的耐心，去发现那些细微的差异，那些常常被忽略的认知的缝隙</p><p>播客里举了一个史蒂夫・乔布斯对咨询行业的看法的例子，乔布斯很不喜欢咨询行业，他认为own something（承担责任）和 do something（把手弄脏）是完全不同的事情；dosomething非常重要，但咨询行业不是这样，他们没办法在从建议到实施的所有行动阶段都能清楚看到自己的建议，也没法看到那些根本想象不到的细节。他们无法在这个过程中面对失败，积累经验、学习新东西，更无法自己振作起来，重新出发，继续尝试</p><p>就好像我们去理解香蕉这个水果，如果你只是隔岸观火的话，你得到的仿佛是一副挂在墙上的、二维的香蕉的照片；你可能拥有一整面墙的香蕉、苹果、草莓的照片，向别人去炫耀你懂多少，但那些照片只是二维的，如果你没有亲手把弄，它永远不可能变成三维的；你永远不知道那些你根本不知道的细节，也不知道这些水果的滋味</p><p>我们经常在学习，也经常给出建议，但如果不承担风险和责任，也不参与具体的实施过程，这里有大量的缝隙是我们根本不知道的；比如说我们都知道把一头大象放进冰箱只需要3 步：打开冰箱 -&gt; 把大象放进去 -&gt;关上冰箱，但是以何种角度放进去能最节省冰箱的空间、怎么能够在下次打开的时候更好把大象拿出来，如果我们不躬身入局、把手弄脏，是无法切身体会到的</p><p>《<span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvUmljaF9EYWRfUG9vcl9EYWQ=">Rich Dad,Poor Dad<i class="fa fa-external-link-alt"></i></span>》有一句话 “<strong>intelligence is the ability to makefiner distinctions</strong>”, 翻译过来就是 “智慧，是区分细微差别（finerdistinction）的能力”</p><p>Finerdistinction，就是在我们在填补了认知的缝隙后，所获得的一种觉察能力，是我们对一个东西或者一件事情足够专注，观察得足够多面、挖得足够深，是我们对一件事情不停地放大、对这条弧线背后的缝隙都看得更清楚之后，所拥有的那种更精细、更微妙、更具体的理解；而当我们对一件事情的了解和体验越多的时候，当我们越能拥有finer distinction的时候，我们的大脑就可以将这些东西和其他事物联系在一起。同时我们也可以越来越无意识地去做这些事情，然后有带宽腾出来处理其他事情；达到那种 “无他唯手熟尔” 的境界</p><p>当你对一件事情专注足够长的时间，挖得足够深的时候，你就会在这件事情上发展出极其细微的差别和专业技能，这在《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zNjQxMzQ1OS8=">10x is easier than2x<i class="fa fa-external-link-alt"></i></span>》 中被称为 <strong>uniqueability</strong>。简单来说，就是做同样的事情，你得到的结果可能比别人要强很多很多倍，同时你付出的成本，比如说时间、心情等，这些要低很多，也就是我们常说的能力圈了</p><p>无论是 finer distinction，还是 uniqueability，都是需要我们把手弄脏，去填补那些认知的缝隙后，才能获取到的；那具体到方法论，我们又该怎么做？</p><p>首先就是要<strong>对知识诚实，需要承认自己可能对绝大多数事情知道的并不多</strong>，我们对这个世界的认知的过程，就仿佛在一个巨大的房间里摸索，如盲人摸象般只能看到其中一隅，而承认自己的无知，拥有开放的心态，才会有把手弄脏的意愿；在躬身入局后，<strong>不要默认所有东西都是合理的，反之需要不停的追问和思考，就像拿着一个放大镜在看一样，不停发现那些缝隙</strong>；当我们循环这个过程足够长的时间后，finerdistinction 也许就会自动浮现出来</p><p>《异类》这本书提出了著名的一万小时定律，但我们<strong>需要的不是 1 万个小时，而是 1 万次迭代</strong>。因为如果 1 万小时都是不停的重复的话，你就不会去看到那么多的空隙，也不会去填满那么多的空隙</p><p>无论是一万小时定律还是一万次迭代，都需要很长的时间，以及很深的专注能力。如果你把这些时间看作是成本，恐怕很难坚持下去，但如果这本身就是你很喜欢的事情，热爱、兴趣和好奇心，就会驱动着你去做足够长的时间，挖得足够深，观察得足够多面，放大得足够多，填满足够多的缝隙；别人把这些时间和付出当作成本，需要 “忍耐”、需要 “熬”、需要 “坚持”，而对你来说，这个过程像是在玩儿，而这也是unique ability 产生的必经路径</p><p>在如何培养自己的 unique ability ，格雷厄姆在《<span class="exturl" data-url="aHR0cHM6Ly9wYXVsZ3JhaGFtLmNvbS9ncmVhdHdvcmsuaHRtbA==">How to Do GreatWork<i class="fa fa-external-link-alt"></i></span>》也给出了一个建议</p><blockquote><p>The factors in doing great work are factors in the literal,mathematical sense, and they are: <strong>ability, interest, effort, andluck</strong>. Luck by definition you can't do anything about, so we canignore that. And we can assume effort, if you do in fact want to dogreat work. So the problem boils down to ability and interest. Can youfind a kind of work where your ability and interest will combine toyield an explosion of new ideas?</p></blockquote><p>播客里提到一个概念叫 ikigai，如下图所示</p><p><img data-src="https://wulc.me/imgs/ikigai.png" height="60%" width="60%"></p><p>简单来说，它分了四个维度，分别为：</p><ul><li><p>What you LOVE：你的热爱</p></li><li><p> What you are GOOD AT：你的擅长</p></li><li><p> What the world NEEDS：世界需要什么</p></li><li><p> What you can be PAID FOR：你的工作</p></li></ul><p>然后这几个圈的交集，分别代表了激情（热爱和擅长的交集）、使命（热爱和世界需要的交集）、专业（擅长和工作的交集）、职业（工作和世界需要的交集）；而如果如果把这四样都集齐了，那就是Ikigai 的状态</p><h2 id="小结">小结</h2><p>零零碎碎说了这么多，最后还是用播客的一段话来总结，因为写的真的是太好了</p><blockquote><p>当我们认识这个世界的时候，那些看似完美的认知弧线的背后有无数的知识的缝隙，对知识缝隙的足够了解变成了finer distinction。那对一件事的 finer distinction 会变成我们的 uniqueability，就是独特的能力，而这个独特的能力将在自由市场上换回相匹配的超额收益。但所有这些都需要漫长的时间和足够的专注，也就是需要足够的长度，足够的深度。</p><p>我们如何才能支付这种成本呢？那就是兴趣、热爱和好奇心（笔者觉得还要加上一个时间），这些将把别人眼中的努力变成我们自己内心的游戏。当然没几个人一开始就知道我们自己喜欢干什么，这基本是件不可能的事儿。所以也许最重要的是开始是我们把手弄脏去和真实的世界接触，同时在这个过程中保持开放，不断给自己的生活增加一些方差，去尝试一些新的东西。那在这个过程中勇敢的追随自己的审美、兴趣和好奇心，慢慢排除选项，同时让自己不断成长</p><p>最终如果你足够幸运的话，就有可能碰到自己的一生所爱。希望那个时候你已经设计好了能够让自己自由选择的环境，我想这整个过程也就是ikigai</p></blockquote><p>还记得很早之前看到的这个回答，<span class="exturl" data-url="aHR0cHM6Ly93d3cuemhpaHUuY29tL3F1ZXN0aW9uLzMzNTQ2MzA3My9hbnN3ZXIvMjgwMzczOTk1Ng==">到底经历了什么，才会让一个二十出头的年轻人对生活失去希望？<i class="fa fa-external-link-alt"></i></span>，当时看到高赞的回答似懂非懂，但是在写完这篇文章后，似乎更能理解了</p><blockquote><p>是他的灵魂走在了年龄前面</p><p>如果你没有去亲身实践你所懂得的道理，当这样的道理越多，你就越割裂，就越无法走在人生的道路上，在短暂的年纪里，懂得太多，知道的太多，接触的太多，想要的太多，你害怕的就越多，失望的就越多，感觉无能为力的就越多，继而生活的灰色地带也就越多</p><p>如果感觉思想停滞不前，那就说明一定是思想走得太快了，你需要去等等你的身体，需要你去花费时间在实践上，然后，你的思想才能更进一步。这二者永远是相辅相成的</p></blockquote><p>所以去躬身入局、把手弄脏吧，去填补那些认知的缝隙，去实践那些 “没能让你过好这一生的道理”，去找到属于我们的ikigai～</p>]]></content>
    
    
    <summary type="html">&lt;p&gt;过去较长一段时间，一直有这种感觉：对于某个事情或想法，&lt;strong&gt;“听到了” 跟 “理解了” 中间有一段距离，“理解了” 跟 “实现了” 中间又有一段距离，“实现了” 跟 “做成了” 中间则会有一段更大的距离&lt;/strong&gt;。简单来说，就是 “知” 与 “行” 之间存在着巨大的鸿沟，且仅站在 “知” 这一端的人往往是看不到这个差距所在的&lt;/p&gt;
&lt;p&gt;&lt;img data-src=&quot;https://wulc.me/imgs/gaps_in_understanding.png&quot; height=&quot;20%&quot; width=&quot;20%&quot;&gt;&lt;/p&gt;
&lt;p&gt;最近听到的这期播客 《&lt;span class=&quot;exturl&quot; data-url=&quot;aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY2NDMwMGU0MjUxYmQ5NmU2YzJlNTdhNg==&quot;&gt;E35.
知识的缝隙&lt;i class=&quot;fa fa-external-link-alt&quot;&gt;&lt;/i&gt;&lt;/span&gt;》，更为系统和深入地探讨了这个现象及其底层原因，也让笔者对上面的 “距离” 有了更深的理解，用播客的话来说，这些距离就是那些认知的缝隙。播客从费曼学习法开始说起，逐步揭开了那些看似光滑的认知弧线下存在的缝隙，而躬身入局、把手弄脏，去填补这些认知的缝隙，也许就会有想不到的收获&lt;/p&gt;
&lt;p&gt;写这篇的文章的过程，亦是笔者在填补自己认知的缝隙的过程，文章可能有点发散，祝开卷有益～&lt;/p&gt;</summary>
    
    
    
    <category term="闲话几句" scheme="https://wulc.me/categories/%E9%97%B2%E8%AF%9D%E5%87%A0%E5%8F%A5/"/>
    
    
    <category term="闲话几句" scheme="https://wulc.me/tags/%E9%97%B2%E8%AF%9D%E5%87%A0%E5%8F%A5/"/>
    
  </entry>
  
  <entry>
    <title>创作者变现与加热</title>
    <link href="https://wulc.me/2024/05/03/%E5%88%9B%E4%BD%9C%E8%80%85%E7%9A%84%E5%95%86%E6%9C%BA%E4%B8%8E%E5%8A%A0%E7%83%AD/"/>
    <id>https://wulc.me/2024/05/03/%E5%88%9B%E4%BD%9C%E8%80%85%E7%9A%84%E5%95%86%E6%9C%BA%E4%B8%8E%E5%8A%A0%E7%83%AD/</id>
    <published>2024-05-03T08:08:44.000Z</published>
    <updated>2026-02-28T05:01:22.804Z</updated>
    
    <content type="html"><![CDATA[<p>最近一段时间都在做一些跟创作者相关的业务，相较于商业传统的三方（平台、用户、广告主），创作者是随着内容平台崛起而诞生的第四方，与其他三方的关系可以参考笔者之前文章<a href="https://wulc.me/2024/04/05/Yet%20Another%20Overview%20of%20An%20AD%20System/">YetAnother Overview of an AD System</a></p><p>本文也是对之前的文章里创作者相关的部分做进一步的展开，主要是商机和加热两大块，前者主要是包括对商机部分中涉及到的各个链路的职责，以及各个链路之间的联动关系；加热中的自投与代投的产品形态，以及在流量上与广告流量的协同关系等。</p><span id="more"></span><h1 id="商机">商机</h1><p>市面上<span class="exturl" data-url="aHR0cHM6Ly93d3cueGluZ3R1LmNuLw==">星图<i class="fa fa-external-link-alt"></i></span>、<span class="exturl" data-url="aHR0cHM6Ly9wZ3kueGlhb2hvbmdzaHUuY29tLw==">蒲公英<i class="fa fa-external-link-alt"></i></span>、<span class="exturl" data-url="aHR0cHM6Ly9rLmt1YWlzaG91LmNvbS8=">聚星<i class="fa fa-external-link-alt"></i></span>、<span class="exturl" data-url="aHR0cHM6Ly9odWFodW8uYmlsaWJpbGkuY29tLw==">花火<i class="fa fa-external-link-alt"></i></span>这一类合作平台，就是为创作者提供商机的官方平台（也有不走官方平台达成合作的，后文统一称为水下）</p><p>在用户的角度，这些产品连接着客户 (B) 和达人 (K)，是一个供需撮合平台；B在平台通过一口价或招募的方式与 K 达成合作，付费后让 K创作与发布内容，相当于 B 付费购买 K 的内容和流量</p><p>在平台的角度，这些产品连接着社区和广告，一端连接着社区，是创作者运营和成长的重要工具，另一端连接广告，是广告素材的一种重要的内容供给；因此这些产品往往需要同时考虑K 端和 B 端两侧业务目标</p><p>在具体的实现上，这些产品一般会涉及到三条链路：撮合链路、推荐链路和广告链路，如下图所示，各个链路的职责如下：</p><ul><li>撮合链路：B 找到对应的 K 创作相应的内容（视频，图文，直播等）<br></li><li>推荐链路：K 发布对应内容，推荐链路将 K发布的内容分发，获得自然流量<br></li><li>广告链路：B 或 K决策是否要额外付费加热相应的内容，或利用这些内容来投广</li></ul><p><img data-src="https://wulc.me/imgs/creator_3links.jpg" height="60%" width="60%"></p><p>这部分会针对这三条链路的细节展开</p><h2 id="撮合链路">撮合链路</h2><p>撮合链路最基础的职责就是让 B 和 K 达成合作（通过 1v1 和 1vN的模式），即为 B 在平台上推荐的达人，类比常见的 C端的推荐系统，这其实算一个 B端的推荐系统，只是候选集和系统的复杂度是远比不上 C 端的推荐系统</p><p>这个系统最终的优化指标就是 BK 的撮合流水，但除了流水，K的商机的分布、B 和 K的操作体验等也是平台需要关注的部分，因为撮合链路上往往会遇到下面的问题</p><p>（1）变现产品体验不佳，如变现模式不够丰富、易用性差、审核规则不清晰等</p><p>（2）K 的变现经验不足，缺乏引导，不知道该如何变现</p><p>（3）流水的行业集中度高，总体集中在某几个头部行业，其他行业供需失衡</p><p>（4）......</p><p>在链路上的效率优化上，撮合链路往往也是有较大的挑战的，因为不像常见的C端流量实验，由于流量比较大，指标相对来说较好观测（如广告的展点消等），这类B 端的实验由于流量有限（只有 B 侧用户）、成单周期长（30天 +），很多产品能力是比较难做效率的迭代的，或者说观测周期需要非常长</p><p>从技术视角来看，常见做法是挖掘和提升与流水相关的中间指标，但就笔者经历来看，成单过程中的各种中间指标（如B 在页面上对 K 的 ctr、B在网页上的停留时长等），跟最终的成单行为的相关性并不是那么强，因此想通过提升这些中间指标进而带动最终流水的上涨，也是有难度的</p><p>因此在撮合链路上，算法侧在优化链路效率的时候，没有特别好的可观测指标，这是技术优化一个比较痛的点；所以往往优化的方向是提升撮合能力多样性，即为B 侧找博主提供更丰富的途径和工具，如可以让 B 侧提供多样的表达，eg通过人群包来找博主，除了 1v1 的精准定向方式，也可以通过 1vN的招募方式、cpm/cpa/cps 等结算方式，共同激发 K的创作积极性，尤其是腰围部的 K</p><p>参考<span class="exturl" data-url="aHR0cHM6Ly93d3cueGluZ3R1LmNuL2hlbHAtY2VudGVyL2F1dGhvci8xMDkxOTQ=">星图<i class="fa fa-external-link-alt"></i></span>，撮合产品的形态往往是比较多样的</p><p><img data-src="https://wulc.me/imgs/match_link_types.jpg" height="100%" width="100%"></p><p>另一个在撮合较为常见的优化方向是分行业建设（跟广告类似），重点挖掘需求强 (B) 但供给不足 (K) 的行业，提供更多分行业解决方案</p><h2 id="推荐链路">推荐链路</h2><p>B 和 K 达成合作后，K会发布其创作的内容，这个时候笔记就会进入第二条链路：推荐链路，而这部分也是技术侧重点优化部分，因为涉及到了分发相关的流量侧机制，同时也是影响其他两条链路的关键地方</p><p>这里先说下这类撮合产品最容易遇到的问题，即 “水下” 问题；这里有个概念需要说明，水上即是走官方合作平台的BK 撮合，需要给平台交一定的手续费；而水下指的是 B 不通过平台与 K直接建联</p><p>站在平台的视角，肯定是希望 BK撮合都走水上，因为除了手续费作为利润，还能对平台的这类商机有更好的管控；但在B的视角，走水下既能省手续费，内容又能更原生（有些平台对水上的内容会明确打标），因此水下与水上的博弈，会是一个平台长期需要解决的问题</p><p>因此为了让更多的预算从水下翻水上，平台需要做好两件事</p><p>（1）提升撮合平台的易用性与效率，即平台需要让 B 和 K 的建联更容易</p><p>（2）流量分发上，水上需要建立与水下有差异的分发机制，并对 B侧透出笔记走水上的权益</p><p>第（1）点主要跟撮合链路挂钩；第（2）点则是跟这里说的推荐链路强相关，因为BK 撮合的笔记跟 K自己发布的笔记在形式上基本是无差异的，一般都是走大盘的分发，在这种方式下，相当于水上笔记与水下笔记的流量分发没有任何差异，这样B 走水上的意愿就没有那么高了</p><p>所以要做水下翻水上，水上的流量分发需要做出差异，需要更多考虑 B侧的权益；而实际上，<strong>K 与 B的权益 / 目标并不是二元对立的，本质上是平台对 B 的钱袋子在不同 K的分配之间做干预，所以首先要服务好愿意出钱的 B，然后需要考虑如何在不同 K之间做好分配</strong></p><p>而 B侧往往是有营销诉求的，在星图、蒲公英等平台上买到的素材，会是其投广素材的一个很重要的来源，且这个素材的在K 发布后获取到的自然流量的效果，是影响 B拿这个素材投广的一个很关键因素；如下图所示，在 B掏钱买 “素材 + 流量” 的模式下，推荐链路获得的自然流量，会同时影响其在前后链路的效率</p><p><img data-src="https://wulc.me/imgs/creator_recommend_link.jpg" height="60%" width="60%"></p><p>因此，有差异的流量分发，就是指这部分自然流量的分发方式和效果，在实际中，可以考虑为这部分流量加入一些B侧更关注的营销目标作为排序公式的一部分，然后在这部分流量上也做好归因并透出给广告主</p><h2 id="广告链路">广告链路</h2><p>前面提到，广告主会拿 BK撮合产出的素材来投广，实际中往往也能观测到这种现象，利用 BK撮合产出的素材来投广，其效果是要更好的；原因往往是；如下图是星图统计的结果（from<span class="exturl" data-url="aHR0cHM6Ly9ieXRlZGFuY2UubGFya29mZmljZS5jb20vZmlsZS9Ib011YjZPOXJvdnd1WXhUa3JJY082Q3duT2M=">2024巨量引擎营销通案<i class="fa fa-external-link-alt"></i></span>）</p><p><img data-src="https://wulc.me/imgs/creator_bk2ad.jpg" height="60%" width="60%"></p><p>而决策内容是否投广的一个重要依据，就是这些素材在自然流量上的效果；从技术视角来看，这两部分流量分发是两条独立的链路，分发目标不同，因此存在流量相关性弱的问题，流量数据对B侧投广参考价值小；大白话就是客户如果拿一篇在自然流量上数据好的笔记来投广，实际的投广效果不一定好，客户缺乏选择素材投广的方法论</p><p>从技术视角，技术上可以做功的一个方向就是增强这部分自然流量与广告流量相关性，即让客户的体感上这两部分流量的相关性是存在的；因为这部分投广素材的自然流量，某种程度上算是笔记投广的冷启动流量，利用好这部分冷启动流量，更好辅助客户的投广，进而撬动更多的这些撮合素材投广，预期是能带来撮合流水和广告流水的增长</p><p>在具体的技术手段上，前面提到，可以在推荐链路的分发中加入一些 B侧更关注的营销目标作为排序公式，在这个基础上，对这两部分流量的特征 / 样本做互通，可以增强广告冷启动效果；而在自然流量上好的素材，在其被应用来投广后，也可以尝试更激进的广告出价策略等</p><p>对这两部分做得更极致的联动，则是类似<span class="exturl" data-url="aHR0cHM6Ly93d3cueGluZ3R1LmNuL2hlbHAtY2VudGVyL2F1dGhvci8xMzgxMzQ=">星广联投<i class="fa fa-external-link-alt"></i></span>的产品，这个产品不再是先有自然流量，再有广告流量的顺序，而是利用客户的预算，在自然流量和广告流量上同时做营销，流程如下图所示</p><p><img data-src="https://wulc.me/imgs/xingguangliantou.jpg" height="60%" width="60%"></p><p><img data-src="https://wulc.me/imgs/xglt.jpg" height="60%" width="60%"></p><h1 id="加热">加热</h1><p>加热往往与商机相辅相成，加热是创作者用于辅助其成长的付费工具，成长到一定体量的粉丝量后，就需要通过商机来变现；有点类似B 侧视角的种草和拔草</p><p><span class="exturl" data-url="aHR0cHM6Ly9kb3VqaWEuZG91eWluLmNvbS8=">dou+<i class="fa fa-external-link-alt"></i></span>、<span class="exturl" data-url="aHR0cHM6Ly9tcC5rdWFpc2hvdS5jb20vZG9jcy9pbnRyb2R1Y3Rpb24vcXVpY2tTdGFydEd1aWRlL2J1c2luZXNzL2NvbnRlbnQtaGVhdGluZy5odG1s">粉条<i class="fa fa-external-link-alt"></i></span>、<span class="exturl" data-url="aHR0cHM6Ly93d3cud29zaGlwbS5jb20vbWFya2V0aW5nLzU0NTc4MzMuaHRtbA==">薯条<i class="fa fa-external-link-alt"></i></span>这一类产品，就是用来服务所有创作者的内容加热工具</p><p>这些产品对创作者的内容质量有要求，往往要求营销感不能太强，有专门的内容审，也不打标；“加热” 也意味着优化目标不强，一般是阅读，赞藏，主页访问，加粉等比较浅层的目标</p><p>同时，dou+ 也支持强营销感目标如获客、商品购买、直播间推广等，如下图所示；与前面的浅层营销目标的一个较大的区别是其服务对象，加热的一般是创作者在投，主要目标是自身的成长，而强营销目标则是素材制作能力强的广告主在投，这部分广告总体还是会考核成本、roi等目标，这里其实也涉及到下面要提的流量机制</p><p><img data-src="https://wulc.me/imgs/dou+_marketing_type.jpg" height="60%" width="60%"></p><h2 id="出价与预算">出价与预算</h2><p>因为创作者对广告竞价理解有限，所以往往在出价方式上，会选择 nobid类的出价方式，从而降低创作者对成本、赔付等成本类出价的理解门槛；这里有一个比较有意思的问题，就是从出价角度来看各个产品的预算增长逻辑</p><p>先看看成本类出价，像 ocpx这种成本类出价，预算增长的逻辑是通过出价、模型等优化，让实际转化成本更贴近广告主的出价，然后随着大盘的竞价的能力变强、总体ecpm水位上涨，广告主需要提高出价才能拿到更多的量，相当于<strong>广告主愿意为一个转化付出更多的钱，平台把转化卖得更贵，进而带来大盘收入上涨</strong>（打平转化数）</p><p>而 nobid 类出价往往是能把预算都花完的，所以 nobid类出价的预算增长，往往是让转化成本下降，广告主的 roi变好，然后广告主愿意投入更多的预算</p><p>nobid的成本需要持续下降，看起来似乎跟前面的成本类出价的是矛盾的，并且从长期大盘消耗aa 增长的角度来看，adload、ctr、cvr都是有上界的，即转化数是有限的，因此持续让转化成本下降，相当于是让大盘收入持续下降</p><p>所以<strong>不能让 nobid类的出价产品的成本持续下降</strong>，前面提到的 “广告主的 roi变好，然后广告主愿意投入更多的预算”，是一个比较长期的预算 aa增长逻辑，在这个过程中，往往会带来成本的上涨，比如说两个 nobid计划，除了预算不同，其他的配置都相同，在这种配置下，往往是高预算的计划的成本比低预算的要高，因为在一段时间的流量池里，便宜的流量是有限的</p><p>所以问题会变成：当广告主在 nobid类出价产品提升预算，带来的成本与跑量的同时上涨后，成本是否还在广告主心里预期的roi 红线以内，如果还在，那是有可能接受成本的上涨的，因此，nobid的消耗增涨逻辑变成了：<strong>平台通过效率优化不断优化广告主的成本，进而吸引广告主增加预算（在成本可接受范围内），进而带动总体的消耗增涨（因为nobid 的预算总是能花完的）</strong></p><p>这样看来，nobid 的增长逻辑跟 ocpx是类似的，也是在广告主心里预期可接受范围内，把转化卖得更贵，只是在 ocpx这类产品中提 bid 的操作变成了 nobid 中提预算的操作</p><h2 id="流量机制">流量机制</h2><p>由于加热产品本质上是平台在卖流量（与广告主产品一样）；因此在流量分发上，一个很直观的做法就是将这些不打标的内容与打标的广告共同竞价，即精排基于ecpm 与广告混竞、混排有相同的约束，与广告共享 ad load</p><p>但这样做会观察到的一个现象，就是一旦遇到 618、双 11之列的大促，在混竞情况下，这类加热产品的 load就会下降，同时各种营销目标的转化成本也会上涨</p><p>究其原因，还是因为在混竞的情况下，这类加热内容是在广告竞争流量的，因此成本是与会随着广告竞价大盘的成本水位上涨而上涨，成本无法做得比较低；而创作者预算少、出价能力弱，在跟大广告主混竞情况下，容易受到大广告主的挤压，或者说<strong>内容优质 + 不打标带来的ctr、cvr 优势，弥补不了 bid 的劣势</strong></p><p>因此这类不打标的付费加热内容（有些平台也叫原生广告），往往需要独立排序链路和load，同时在混排需要有独立的约束（首坑、最小gap），或者说作为一路跟硬广和推荐内容做混排，从而避免被硬广积压得太狠</p><p>某种程度上这算是一个流量价值洼地，因为创作者加热产品，其实还肩负着创作者成长的，丰富平台内容的生态价值，所以这部分流量也算是对创作者成长的某种扶持</p><h2 id="自投与代投">自投与代投</h2><p>一般创作者加热产品都是自投或代投，即创作者自掏腰包为自己的作品加热，或者是创作者的粉丝自愿为创作者的笔记掏钱加热，总体的预算普遍还是小的，容易受到大广告主的挤压</p><p>但是还有一种稍微有点不同的代投模式，即平台为大广告主优选 ugc的笔记，然后大广告主对这些 ugc笔记做加热，比如说以原神这个游戏为例，会有很多的 ugc笔记，而平台在中间通过 “撮合” 的方式，让广告主愿意为这些 ugc笔记加热，直观来看，会是一个三方共赢的模式</p><ul><li>对于用户，只要做好内容，就有机会被平台和广告主选中，给予流量补贴（品牌付费）和现金补贴（可选）<br></li><li>对于广告主，节省了素材制作的成本，平台会从海量的 ugc笔记中优选出营销感更弱的笔记给品牌投放<br></li><li>对于平台，能以这种方式引入更多预算（也有可能是转移），同时利用品牌方的钱来辅助做创作者成长</li></ul><p>但是产品本身也会存在一些限制</p><ul><li>基本只有大品牌 / 广告主才适用，因为需要品牌被用户熟知才能被有大量的ugc 笔记<br></li><li>大品牌方如果通过这种方式把预算较好花完，可能就不会在前面提到的撮合平台再买素材了，可能会对撮合流水有一定影响</li></ul><p>在技术实现上，总体与常规的加热差异不大，主要区别是涉及到了笔记的优选过程，包括投前的圈选和投中的优选等；因为往往ugc笔记的数量都是比较大的，如果通过算法手段选择出合适的笔记供品牌选择投放，或者做成托管的方式在投中做优选，是一个需要考虑的问题</p><h1 id="小结">小结</h1><p>本文主要讲了与创作者相关的两个事情：商机和加热，前者是创作者赚钱的手段，后者则是创作者花钱做成长的途径</p><p>平台推出的撮合产品是完成商机的重要工具，一个完整的生命周期往往涉及到撮合链路、推荐链路和广告链路这三条链路，其中推荐链路中的流量分发是尤为重要的一部分，因为会同时影响B 对 K的笔记质量判断以及后续的投广决策，进而影响撮合流水，以及广告主的投广预算等</p><p>平台推出的加热产品是辅助创作者成长的重要工具，本文探讨了这类加热产品常用的nobid类出价的预算增涨逻辑、流量机制以及代投的一种新的产品形态，在这个过程中，平台需要充分发挥主观能动性，尤其是流量机制这部分，不能只从收入考虑这部分流量的价值</p>]]></content>
    
    
    <summary type="html">&lt;p&gt;最近一段时间都在做一些跟创作者相关的业务，相较于商业传统的三方（平台、用户、广告主），创作者是随着内容平台崛起而诞生的第四方，与其他三方的关系可以参考笔者之前文章
&lt;a href=&quot;https://wulc.me/2024/04/05/Yet%20Another%20Overview%20of%20An%20AD%20System/&quot;&gt;Yet
Another Overview of an AD System&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;本文也是对之前的文章里创作者相关的部分做进一步的展开，主要是商机和加热两大块，前者主要是包括对商机部分中涉及到的各个链路的职责，以及各个链路之间的联动关系；加热中的自投与代投的产品形态，以及在流量上与广告流量的协同关系等。&lt;/p&gt;</summary>
    
    
    
    <category term="计算广告" scheme="https://wulc.me/categories/%E8%AE%A1%E7%AE%97%E5%B9%BF%E5%91%8A/"/>
    
    
    <category term="计算广告" scheme="https://wulc.me/tags/%E8%AE%A1%E7%AE%97%E5%B9%BF%E5%91%8A/"/>
    
  </entry>
  
  <entry>
    <title>Yet Another Overview of an AD System</title>
    <link href="https://wulc.me/2024/04/05/Yet%20Another%20Overview%20of%20An%20AD%20System/"/>
    <id>https://wulc.me/2024/04/05/Yet%20Another%20Overview%20of%20An%20AD%20System/</id>
    <published>2024-04-05T08:08:44.000Z</published>
    <updated>2026-02-28T05:01:22.939Z</updated>
    
    <content type="html"><![CDATA[<p>之前写的 <a href="https://wulc.me/2021/05/05/An%20Overview%20Of%20Ad%20System/">AnOverview of an AD System</a>,从技术原理上介绍了各个模块（召回、精排、出价、冷启动等）的基本职责和原理，几年过去了，这部分的认知虽然还没过时，但是经历了更多业务后，对整体的商业化也有一个更全面认知，本文尝试从另一个更系统的角度去理解一个广告系统</p><p>传统认知中的 ad system一般是三方：广告主 / 代理、平台、用户；但是随着内容平台（如抖音、快手、小红书、bilibili 等）的迅速发展，涌现了越来越多的UGC内容，创作者在商业变现中的影响也越来越难被忽视，所以这里基于三方增加了代表创作者的第四方，如下图所示</p><p><img data-src="https://wulc.me/imgs/YAOAS_relationship.jpg" height="60%" width="60%"></p><p>以上的四方比较复杂的关系，一般是存在于 “一方流量”（参考一方数据的概念）上，即抖音 / 快手 / 小红书 /bilibili 这类有能力搭建自己的一方流量的变现团队，在自家的流量上变现；相较于 “一方流量”，“三方流量” 的场景一般只需要关注客户和平台的关系，典型的就是联盟的场景（穿山甲、优量汇、快手联盟等），对用户侧没有强体验约束，因为本质上联盟就是个倒卖流量的生意，相关技术与一方流量差不多，但是对C 端的用户体验以及创作者部分基本不怎么关注。</p><p>本文重点在一方流量上，下面的内容会根据上图中提到四方依次讨论每一方本身的一些职责、与其他各方的关系，内容会比较发散，祝开卷有益～</p><span id="more"></span><p>上图中的箭头可以理解为一方与另一方之间的需要交付的目标，以平台为例，作为连接各方的枢纽，平台需要承担以下的职责</p><ul><li>对于用户，需要保证营销内容对用户体验损失在红线以内，一般量化的指标是dau loss；常见的 load约束、频控、负反馈策略，混排时的一些硬约束等，都是在尝试在优化这部分；而商业化的目标，就是在dau loss 红线内，最大化商业化收入<br></li><li>对于客户 (广告主)，是平台需要重点关注的对象，因为客户就是平台的平台的金主，一句话描述这部分：需要在客户表达预算和素材后，保证约定的成本约束下，最大化跑量；为了精细化地服务好客户，还会分行业（电商、游戏、教育等）、分客户类型（KA、SMB）等去进行优化，提供更丰富的营销目标与更好的投放体验，为客户在平台的长期经营提供更好的土壤<br></li><li>对于创作者，平台需要为创作者提供变现商机（促成创作者与客户的合作，在<span class="exturl" data-url="aHR0cHM6Ly93d3cueGluZ3R1LmNuLw==">星图<i class="fa fa-external-link-alt"></i></span>、<span class="exturl" data-url="aHR0cHM6Ly9wZ3kueGlhb2hvbmdzaHUuY29tLw==">蒲公英<i class="fa fa-external-link-alt"></i></span>、<span class="exturl" data-url="aHR0cHM6Ly9rLmt1YWlzaG91LmNvbS8=">聚星<i class="fa fa-external-link-alt"></i></span>、<span class="exturl" data-url="aHR0cHM6Ly9odWFodW8uYmlsaWJpbGkuY29tLw==">花火<i class="fa fa-external-link-alt"></i></span>等官方合作平台上完成），平台在这个过程中也需要考虑各种问题（创作者生态、内容生态、水下问题等）；同时也要考虑创作者成长，为其提供一些机制策略，各种流量加热工具（付费or 免费），相应地创作者需要为平台创作好的内容</li></ul><h1 id="平台">平台</h1><p>前面提到，作为连接各方的枢纽，平台肩负着体验（C 端与 B端）、变现 (平台与创作者)、生态 (客户、创作者与内容) 等各个职责，需要为各方交付相应的业务指标</p><h2 id="体验c-端与-b-端">体验：C 端与 B 端</h2><p>根据用户的分类，这里的体验又可以分为 C 端用户与 B 端的广告主</p><p>平台需要为 C 端交付的体验，就是用户体验；最直接衡量指标就是 dauloss，即不能因为营销内容过多或者内容不符合用户的兴趣，而导致了用户的流失；技术手段上，无论是load约束、频控 / 负反馈 / 分人群等策略、或者混排时的一些硬约束（广告首位，min-gap等），都是尝试在优化这部分；在后续的用户部分会展开这部分</p><p>平台需要为 B端交付的体验，就是广告主的体验；一般直接的度量指标就是广告主的 nps调研，但这个指标往往没法做直接的优化；而计划起量、掉量、跑量、成本、系统variance 等问题，都会影响广告主的体验，直接或间接地影响广告主的 nps以及在平台上的长期预算，解决这些问题是有可能提升 B端的用户体验的；其中成本问题是基础也是最重要，往往是通过 ctr、cvr的预估准确性做基本保障，同时通过 “出价 + 计费” 的方式来做兜底，另外针对计划的掉量、拿量波动的问题有稳定性专项、针对计划的起量问题有冷启动专项等</p><p>前面提到，商业化的目标粗略来说，就是在对 C端用户体验损害的红线约束内，最大化商业化收入， C端的用户体验这部分有比较明确的度量指标：ad load 与 dauloss，前者比较好度量，后者往往观测性没那么好，需要把观测周期拉的非常长，往往需要找一些关联的中间指标如时长等来做直接的优化，但总体优化方向是较为明确的</p><p>但对于 B 端广告主，没有那么直接可度量的指标，nps也许算一个，但不是能够直接优化的指标，所以往往会将广告主体验部分拆成好几个方向来进行，如起量（通过冷启动扶持来加速计划的起量）、掉量（掉量的识别与扶持等）、系统variance（计划的复制与裁剪）、成本（纠偏与出价）等，这些体验的交付，最终是为了B 端的广告主能够在平台长期投入更多预算</p><h2 id="变现平台与创作者">变现：平台与创作者</h2><p>变现也分为两部分：平台变现与创作者变现：平台变现就是常规的通过卖流量的广告变现，创作者变现指的创作者通过为客户或平台创作好内容获得报酬，也是近几年在内容平台发展过程中逐步衍生出来的一个方向</p><ul><li><strong>平台变现</strong></li></ul><p>平台的变现即广告变现，往往需要把下面三件事情做好，而一些互联网公司也会根据这几个方向来建设相应的组织架构（排序组、流量组、行业组）</p><p><strong>1、排序效率</strong>：提升链路的排序效率，如模型auc，链路一致性</p><p><strong>2、流量机制</strong>：明确链路的排序公式和一些辅助策略，以满足流量需要交付的目标（消耗、体验、生态等）</p><p><strong>3、客户产品</strong>：服务于客户的诉求（营销目标多样性、成本、跑量、低门槛投放、数据隐私等）为客户提供的各种广告主产品，这部分会在客户部分详细展开</p><p>从技术原理上来讲，上面这几件事情都是在让平台匹配效率最大化，或者说流量售卖效率的最大化，因为本质上<code>收入 = cpm × ad_load</code> ；ad_load基本是一个固定的值（虽然有很多变相扩 load的方法如全域推广），在技术方向上的需要优化的点就是 cpm的增长；如果简单拆解 cpm，可以粗略认为<code>cpm ≈ bid × ctr × cvr</code>，为了提升cpm，需要分别考虑这几项：bid、ctr、cvr</p><ul><li><strong>因素一：bid</strong></li></ul><p>先看 bid，直观上看就是竞价流量的 bid 平均水位，对于大部分的 oCPX广告，这里的 bid 也往往是广告主的平均出价水位（nobid类产品没有广告主出价，但是 bid也能一定程度上反映广告主的预算），系统不能在广告主的 bid基础上无约束地提，因为广告主的出价表达了其对转化成本的预期，如果一个劲儿地提bid，成本是没法很好地保证的，所以这里的 bid基本上能理解为 “<strong>广告主在某个媒体平台上愿意为一个转化出的价格</strong>”，而影响广告主出的bid 高低有很多，这里重点讲以下 2 个因素：</p><p>（1）<strong>广告主的生意模式</strong>：一个比较关键的因素是转化对于广告主而言有没有除了这个转化以外的价值</p><p>一般的白牌商家的预算都属于纯效果预算，都是有比较严格的 roi的考核的，这种情况下广告主愿意出的价格在各个媒体上也是比较固定的，与之相反的是纯品牌预算，即对转化基本没有太多考核，像gd很多时候就是在溢价买流量，这个时候广告主会根据平台的影响力，或者说流量价值来出价；</p><p>而实际中，很多预算其实是介于纯效果预算和纯品牌预算之间的，所以广告主的出价的时候也会根据平台的转化是否能带来外溢价值，来对出价做相应的调整；如广告主在小红书等种草平台是能接受赞藏、加粉等成本，比抖音、快手等竞品要更高，因为在广告主心里会认为这些种草平台的一个转化能够带来更多外溢价值</p><p>（2）<strong>平台的竞争激烈程度</strong>：即广告主能否在平台上卷起来</p><p>在一个媒体平台上，如果竞争不够激烈，如最极端情况下只有一个广告主，那转化的定价权基本上就掌握在广告主的手里（而这也是广告主生态需要解决的问题之一）；当广告主数量变多后，蓝海变成红海，广告主在总体roi还是为正的前提下，还是有动力降低自己的利润、在平台提升转化出价的成本来做营销的</p><p>所以，假设广告主出价是理性的，那要提高公式里的bid，平台长期要做的就是提升其流量价值（比较虚的概念，与市场认可度与声量相关），满足更多广告主的营销诉求，引入更多的广告主进入平台，营造一个良性的竞争环境，这部分主要上面提到的第3 部分即客户产品来承当，当然也会涉及到第 1 部分（如ctr、cvr 预估准确性）第 2 部分（如流量策略影响广告主生态）</p><ul><li><strong>因素二：ctr × cvr</strong></li></ul><p>其他两项是 ctr 和 cvr，因为比较相似，就放在这里一并说了，提升 ctr 和cvr 也有多个因素，这里重点说以下两个：</p><p>（1）首先能想到的就是模型的排序效率，模型的职责就是在用户到来时，为用户选择出ctr、cvr 最高的 item，所以模型的 auc 提升，理论上是能够带来 ctr、cvr的提升</p><p>但实际上在广告系统里排序公式不是 ctr，cvr 最大化，往往是<code>ecpm + hidden_cost</code>, 前者 <code>ecpm=bid × ctr × cvr</code>是收入最大化，后者 hidden_cost则是为了满足收入以外的目标而加上的各项（如冷启动、掉量等问题）；因此，提升模型的auc ，不一定能带来最终的 ctr、cvr 提升，因为本身的排序公式就不是仅由ctr、cvr 决定的（比如说 ctr、cvr 不是最高的但是 bid足够高，综合起来是有可能排在第一位的）</p><p>但是总体来说，模型长期的迭代预期是能带来后验 ctr、cvr上涨的，因为对于广告主来说，用低 ctr、cvr素材但是高出价不是一种良性的方式，且不是平台所提倡的（平台会引导广告主制作好素材）；因此，对于广告主而言，通过制作好素材提升ctr、cvr 来跑量，才是一种更加可持续的方式</p><p>（2）另一个重要的因素就是素材，素材质量的优劣直接影响着用户的点击率、转化率等指标，需要提高优质素材的供给；比如说通过撮合平台让K 给 B 提供更多高质量素材，通过 AIGC的方式生成更多优质素材等，然后平台侧结合模型的排序效率、素材优选等方式，提升总体的ctr、cvr，平台侧这些动作的一些拓展文章可参考 <a href="https://wulc.me/2022/02/01/Dynamic%20Creative%20Optimization%20in%20Online%20Display%20Advertising/">DynamicCreative Optimization in Online Display Advertising</a> 和 <a href="https://wulc.me/2022/03/05/A%20Hybrid%20Bandit%20Model%20with%20Visual%20Priors%20for%20Creative%20Ranking%20in%20Display%20Advertising/">AHybrid Bandit Model with Visual Priors for Creative Ranking in DisplayAdvertising</a></p><p>这部分主要上面提到的第 1 部分（模型效率）和第 2部分（排序公式，hidden_cost 的组成）来支持</p><ul><li><strong>创作者变现</strong></li></ul><p>创作者随着内容平台的发展而发展，当前已经在广告系统中是一个重要组成方，肩负着创作好素材的职责，与之相关的就是创作者变现这个大话题，毕竟创作者不能单纯 “用爱发电”，而是需要有稳定的收入来支撑做内容</p><p>创作者的变现的途径有很多，包括来自 B端（如商单推广、直播带货）、来自平台（如平台的补贴）、来自 C端（如直播打赏、充电等）等，参考 <span class="exturl" data-url="aHR0cHM6Ly93d3cuYmlsaWJpbGkuY29tL3JlYWQvY3YzMzI2ODg3NC8=">B站的创作者变现介绍<i class="fa fa-external-link-alt"></i></span></p><p><img data-src="https://wulc.me/imgs/bilibili_up.jpg" height="60%" width="60%"></p><p>来自 B端的商单是最常见的方式，客户（以下简称 B）侧找到创作者（以下简称 K）侧写对应的推广的内容，这是一个典型的撮合过程，很多内容平台也建立相关的官方平台（<span class="exturl" data-url="aHR0cHM6Ly93d3cueGluZ3R1LmNuLw==">星图<i class="fa fa-external-link-alt"></i></span>、<span class="exturl" data-url="aHR0cHM6Ly9wZ3kueGlhb2hvbmdzaHUuY29tLw==">蒲公英<i class="fa fa-external-link-alt"></i></span>、<span class="exturl" data-url="aHR0cHM6Ly9rLmt1YWlzaG91LmNvbS8=">聚星<i class="fa fa-external-link-alt"></i></span>、<span class="exturl" data-url="aHR0cHM6Ly9odWFodW8uYmlsaWJpbGkuY29tLw==">花火<i class="fa fa-external-link-alt"></i></span>）来促成 B 与 K 的合作，B侧走官方平台报备，除了需要为 K提供一口价结算或效果化结算（即根据转化数来结算），还需要为平台提供一定比例的佣金，这部分的内容我们称为 “水上内容”</p><p>但除了 “水上内容”，还有不少内容会走 “水下”，即 B 与 K不走以上提到的官方平台，而是直接达成合作，B是有动力去做这件事的，因为这样最直接的收益就是 B侧没有了额外的需要支付的佣金，且内容更贴近 ugc的（一些平台对于走了撮合的内容是要打标的）；但是对于平台而言，肯定是希望这些内容都能够走官方合作平台的，一是佣金；二是平台会希望能够对K 制作的内容了解并有一定的管控能力，包括了解 K变现的行业、粉丝量分布，并通过影响 K 的商机分配来影响 K内容制作方向等</p><p>因此，在创作者变现上，平台的愿景往往是：（1）更多的创作者能够在平台变现（走水上的方式），即变现人数与撮合流水能够持续增长（2）为平台共享贡献好的内容</p><p>而在这个过程中，平台需要解决的一个大问题，就是<strong>“水下翻水上”</strong>，即如何让 B侧更多的预算走水上，这部分会在后面创作者重点介绍</p><p>除了来自 B端，平台的补贴也是创作者变现的一个来源，一般的补贴包括现金和流量两种；如很多内容平台都会有创作者激励计划，即根据内容播放量或浏览量来给创作者结算；也会有一些流量扶持，如流量券、特定话题下作品的流量扶持等</p><h2 id="生态客户创作者与内容">生态：客户、创作者与内容</h2><p>生态一般是平台发展到一定规模后才需要考虑的问题；这里的生态指的是非红线的生态问题，即不会一旦出现了平台就要倒闭的那种（比如政治敏感话题）；而是短期不管看不出什么大问题，但是放任不管，不利于平台长期可持续发展，如计划冷启动、广告主的多样性、素材多样性、创作者变现分布等等</p><p>这是个比较典型的规模与生态的问题，规模小的时候这类问题不显著，或者说当时阶段增长是最重要的点，但是当规模变大后，必然会出现一些不健康的问题，通俗点讲就是 “林子大了，什么鸟都有”，这个时候生态问题就不能忽略了</p><ul><li><strong>客户生态</strong></li></ul><p>常见的客户生态包括：客户结构（如大广告主与小广告主、广告主的行业分布情况）、客户操作习惯（如频繁改出价、复制计划、微改素材等行为）等</p><p>前面提到，最极端情况下平台只有一个广告主，这样流量的定价权就在这个广告主手里了；因此平台肯定希望提升广告主的多样性，让平台总体cpm 水位能在广告主的竞争中水涨船高</p><p>但是广告系统里往往又存在着马太效应，即大部分的钱是由小部分的广告主花的；其原因是很多长尾的中小广告主由于竞价能力、投放经验不足等问题与大广告主不太可比，这部分广告主在投放链路中会由于数据量少，链路相关模型学习不充分等原因，进一步加剧这个问题。这个时候需要平台对这部分中小的广告主做一些特定的优化，成立对应的中小专项来优化，这部分的一些手段会在客户部分详细说明</p><p>另外一个常见的客户生态问题就是客户的投放操作问题，比如说频繁改出价，正常oCPX广告中，广告主的出价就是其对转化成本的预期，而这个成本理论上应该是固定的，不过会因为在投放初期由于没有固定成本预期而去调价做试探，比如说一个点赞在不同媒体平台上的成本是不一样的，广告主在一个平台切换到另一个平台后需要做调整，但这种改动也不会很频繁；所以频繁改动出价往往是广告主hack 平台的一种手段，如把出价从低调到高来 hack赔付的漏洞，或者在预算不足的时候出一个很大的 bid 来 hack刹车漏洞，因次平台要有相应的规则来回避这些问题，同时需要有相应的投放引导</p><p>除了出价，广告主往往也存在不断复制计划来 hack系统的行为，因为系统的排序模型往往会使用很多 id 类特征，带来的就是系统的variance 问题，如两个计划的投放设置、素材都一致，但是很可能因为计划 id不一致，导致投放效果的不一致，所以广告主有动力通过复制计划来跑更多的量，但这样给平台带来的问题有（1）工程上的压力，如召回的计划或素材变多了（2）素材重复度高；这其实也算是素材生态问题，微改素材的问题也属于同一类问题；因此，平台侧需要考虑使用id 类特征带来的问题，或者使用了 id类特征后需要通过额外的策略来保证广告主的复制是无效的，如托管控制客户复制计划的行为、相似计划的限制剪裁策略、相似素材识别等</p><ul><li><strong>创作者生态</strong></li></ul><p>创作者的生态，跟客户生态一样，也需要分结构和行业来看，因为创作者变现本身也是个供需的生意，需要明确分粉丝段或分行业的供需问题，如创作者变现的粉丝量分布是否健康，是否只有头部作者有变现，但大部分长尾的创作者压根没有变现；行业上也是类似的，因为内容平台是希望提升其内容的多样性的，对应的需要提升创作者行业的多样性，因为创作者是ugc 平台素材的一个很重要的供给</p><p>除了上面的问题，前面也提到内容平台往往存在 “水下” 问题，即创作者的撮合不走官方撮合平台，而是B 直接找 K来达成合作，这会影响平台对营销内容的管控、平台的营收等；这部分会在下面创作者部分详细展开</p><ul><li><strong>内容生态</strong></li></ul><p>在内容生态上，除了一些红线问题（如政治、色情内容等），更多的生态问题在于内容的多样性和内容质量等问题上</p><p>内容多样性问题前面也提到，分别涉及到客户投流内容多样性和创作者创作的内容多样性</p><p>对于客户，多样性问题体现在客户投放不把重心放在素材制作，而是放在了计划复制等各种投放的 “骚操作” 上，导致素材重复度高，用户审美疲劳，长期对广告交付的用户体验指标、广告相关转化率都有负向影响；针对这一点，需要平台侧应做相关的引导，引导客户去把精力放到素材制作上，巨量引擎的<span class="exturl" data-url="aHR0cHM6Ly93d3cub2NlYW5lbmdpbmUuY29tL2JhaWtlL2p1bGlhbmdndWFuZ2dhb3NoZW5namliYW4xLmh0bWw=">创意型自动化投放平台<i class="fa fa-external-link-alt"></i></span>做的就是这件事情，巨量平台上对广告主的引导也是希望广告主通过创意驱动生意（下图来自<span class="exturl" data-url="aHR0cHM6Ly9ieXRlZGFuY2UubGFya29mZmljZS5jb20vZmlsZS9Ib011YjZPOXJvdnd1WXhUa3JJY082Q3duT2M="> 2024巨量引擎营销通案<i class="fa fa-external-link-alt"></i></span>）</p><p><img data-src="https://wulc.me/imgs/ad_creativity.jpg" height="60%" width="60%"></p><p>对于创作者，多样性问题体现在其内容是否足够多样，一般而言，内容的多样性与创作者的多样性挂钩，因为往往每个创作者都有自己的创作偏好；因此平台首先需要引进足够多样的创作者，同时平台侧会希望能够有相应的抓手来影响创作者的创作倾向，一般是商机和流量，即把商机和流量更多倾向给平台侧需要扶持的创作者类型</p><p>内容质量问题是个很泛的问题，如视频拍摄质量、内容抄袭、内容反智、营销感强等等都算内容质量问题，这些一般需要依靠审核（人 + 机）的方式来识别与降权；另外针对创作者的撮合往往还存在着 “代写代发” 的问题，即创作者并非在真诚分享，而是直接发布B 写好的笔记（B为了更多创作者为品牌背书会这么做，创作者也只需要发布写好的笔记就能拿到钱），这样不仅容易导致总体内容营销感强，同时也会带来创作者变现变现的不良风气和现象，需要平台通过机制来抑制这样的趋势</p><h1 id="客户">客户</h1><p>前面提到，客户在内容平台上有营销诉求，为了服务好客户的各种诉求：如成本、跑量、低门槛投放、营销目标多样性、数据隐私等，平台需要为客户提供的各种投放产品；同时需要给客户交付好投放体验与投放效果，投放体验是客户在平台上投放时，产品能否满足广告主的具体需求，如易用性是否足够好；投放效果也有多种，最常见的是成本稳定，跑量最大化，同时也会有跑量稳定性等诉求</p><p>在投放效果上，成本问题是最基础也是最重要的部分，从技术上来讲，ctr、cvr的预估准确性是最基本保障（所以相较于推荐，广告在 ctr、cvr 目标上一般会有calibration 这个模块），同时通过出价和计费来做兜底；这里的兜底主要是指对ctr、cvr 预估不准的兜底，即出价会基于后验的转化与消耗来做 pacing来保成本；除了出价，在扣费阶段，也可以基于计划当前的状态对计划少收钱或多收钱。出价和计费，除了是对ctr、cvr预估不准确的兜底，也是对常见的二价收费带来的二价差的一种缓解。这里不详细展开这部分了，相关的内容可以看之前写的<a href="https://wulc.me/2021/05/05/An%20Overview%20Of%20Ad%20System/">AnOverview of an AD System</a></p><p>下面主要从 “平台希望客户做长期经营” 的思路，介绍一些相关动作</p><h2 id="行业化场景化">行业化 / 场景化</h2><p>一般广告系统在发展到一定的规模后，就会出现分行业的优化诉求，其原因不同行业的营销目标与范式等不太一致，只用一个大一统的方案往往很难满足广告主的所有诉求，所以需要分行业来进行优化和推荐；行业的分类有很多标准，如果参考<span class="exturl" data-url="aHR0cHM6Ly93d3cub2NlYW5lbmdpbmUuY29tL3Byb2R1Y3Rz">巨量<i class="fa fa-external-link-alt"></i></span>给出的标准，主要是 4个场景 / 行业：电商、下载、本地、线索</p><ul><li><strong>电商</strong></li></ul><p>电商一般分为闭环电商和引流电商两种，前者是站内转化，预算类型商家预算，后者是站外转化，预算类型是商家预算 + 平台预算；商家预算的营销目标基本是商品购买、进店 / 直播间等，平台预算的基本目标就是拉新或拉活。因为预算类型有重合，闭环电商与引流电商的优化目标与路径也有较多相似之处，较大不同的点有这两个</p><p>（1）数据的完备性与实时性，由于转化在站外，引流电商的数据完备性和实时性是不如闭环电商，往往需要通过外部数据合作的方式来获取外部的数据进行建模；也容易遇到数据安全等问题，一般需要通过<span class="exturl" data-url="aHR0cHM6Ly9iYWlrZS5iYWlkdS5jb20vaXRlbS8lRTklOUElOTAlRTclQTclODElRTglQUUlQTElRTclQUUlOTcvNTg1NzU1Mzk=">隐私计算<i class="fa fa-external-link-alt"></i></span>等方式来进行跨域的数据交互</p><p>（2）全域推广，做引流的商家的经营阵地可能不在对应的媒体平台上（如从抖音引流到淘宝的商家，主要经营阵地在淘宝），这种商家一般不会在抖音上做日常内容的运营（即自然流量少），投引流也是考核roi是否达标；但是闭环电商的商家是有动力在平台上做内容来获取自然流量的，对于这部分商家，业界推出了 “<span class="exturl" data-url="aHR0cHM6Ly93d3cuemhpaHUuY29tL3F1ZXN0aW9uLzYxOTg1MDAyNA==">全域推广<i class="fa fa-external-link-alt"></i></span>” 类产品来让商家更好获取自然 + 广告流量</p><p><img data-src="https://wulc.me/imgs/roi2_product.jpg" height="60%" width="60%"></p><ul><li><strong>下载</strong></li></ul><p>下载更准确来说是个转化目标，会如游戏、网服、电商的平台预算等行业都有下载类预算；游戏是下载类行业中优化目标网深去做的最早行业，从开始的下载，到后续的次留、付费次数，付费金额等目标，游戏广告主是最早接受深度转化目标优化的一批广告主</p><p>优化目标变深，更贴近广告主的营销诉求，是平台在往效果广告演进中不得不经历的一个过程；在这个过程中往往会遇到从浅度目标切到深度目标后，roi变好但是跑量下降的问题；这个时候需要权衡能否接受短期的消耗的 “损失”，但是给广告主带来了更多价值的决策，因为只有服务好广告主，才能给平台可持续的收入和增长</p><ul><li><strong>线索</strong></li></ul><p>线索也是一个比较泛的概念，涵盖非常多的行业；房产、汽车、教育、医美等需要提供服务等行业，都涉及到线索；常见的电话表单或私信等方式，都算线索，是广告平台需要优化的转化目标</p><p>但是线索会面临的一个问题是线索的有效性，即很多提供了电话或私信的客户发生后续转化的概率并不高，这样并不能给商家带来实际的转化价值，因此线索的深度转化也是线索行业中的一个老大难问题，基本解决思路就是跟广告主有更多的建联，把更多的深度转化数据汇创到平台侧，巨量提出了一个方法论，如下图所示</p><p><img data-src="https://wulc.me/imgs/clue_deep_conv.jpg" height="60%" width="60%"></p><p>线索存在着很多中小商家的行业（电商也一样），因为在很多卖服务和商品的行业，有很多规模不大的生意，这部分小商家也是有做营销的意向的，但是因为其预算小，投放经验不足等问题，往往会遇到更多问题，这部分的一些解决思路会在后面的中小商家提到</p><ul><li><strong>本地</strong></li></ul><p>本地与前面几个场景不少内容有重叠，其一大特点其服务在地理上是会被限制在一定半径内的，且需要到店才能提供相关服务（在这一点上其实跟线索广告很像）；在优化手段上跟其他行业没有太大差异 (除了地域上需要做一些限制)</p><p><img data-src="https://wulc.me/imgs/local_ads.jpg" height="60%" width="60%"></p><h2 id="ka-与-smb">KA 与 SMB</h2><p>根据客户的经营规模、预算等因素，可以粗略把客户分为 KA（KeyAccount）客户和 SMB（Small and Medium-sizedBusiness）客户两大类，前者往往有较为充足的预算与成熟的投放能力，后者则往往是预算不多、投放经验一般较少；且SMB 客户的数量级往往会高于 KA 客户</p><p>但是广告系统里又存在着马太效应，即大部分的钱是由小部分的广告主花的，其原因是很多长尾的SMB 广告主由于竞价能力、投放经验不足等问题与 KA广告主不太可比，这部分广告主在投放链路中会由于数据量少，链路相关模型学习不充分等原因，进一步加剧这个问题</p><p>但平台长期的收入、cpm的增长，会比较依赖广告主数量增加带来的更剧烈的竞价环境，因此 SMB广告主对平台而言也是不可忽略的，要服务好这部分SMB，需要平台对这部分中小的广告主做一些特定的优化</p><p>困扰 SMB客户的两个问题主要是素材和投放；前者是因为客户不是专门的内容创作者，没法制作很好的素材，同时往往没有额外的素材预算，没法买到很好的素材；后者则是对平台的规则、投放的流程等不熟悉，操作成本高</p><p>因此平台针对这部分 SMB广告主的投放产品要做到易用性足够好，包括提供更低便捷的投放入口和投放引导，简化创编流程，同时提供一些自动的素材生成和编辑能力，提升这部分广告主使用平台的便捷性</p><p>此外在流量分发上，SMB 广告主由于竞价能力弱 ecpm 低，是竞争不过 KA广告主的，往往需要平台给予相应的流量的激励和扶持，而这种扶持是会对平台大盘的消耗是可能有损的，因为破坏了平台以收入为最大化的分发机制</p><p>针对线索行业的中小客户，巨量给出的解决方案的思路基本就是上面提到的，同时还提供了私信的智能客服</p><p><img data-src="https://wulc.me/imgs/smb_solution.jpg" height="60%" width="60%"></p><p>电商的中小的解决方案类似</p><p><img data-src="https://wulc.me/imgs/smb_solution2.jpg" height="60%" width="60%"></p><h2 id="经营">经营</h2><p>随着营销的精细化，平台会倡导客户在平台做营销过程中往经营方向去转变；因为站在客户和平台视角，相对于仅靠广告来买流量来触达用户，另一种更可持续的方式是通过广告来度过冷启，然后通过好内容 + 好服务持续吸引与留住用户</p><p>巨量把这个定义成营销力（见下图），即客户除了仅砸钱投广告，还需要有制作好素材能力（获取更多自然流量）以及提供优质服务的能力（口碑有保证，留住用户），对客户和平台来说，才是一种更可持续发展的方向；而这也是笔者这里讲的 “经营” 所表达的意思是一样的，经营在笔者的理解就是通过好内容或钱来获取流量（前者是自然流量，后者是广告流量），然后基于这些流量触达到的客户，来进一步拓展用户群</p><p><img data-src="https://wulc.me/imgs/manage_marketing.jpg" height="60%" width="60%"></p><p>平台在这个过程中，需要提供一些更好的方法论和工具来指导广告主，如抖音的 “<span class="exturl" data-url="aHR0cHM6Ly93d3cuaWhlaW1hLmNvbS9hcnRpY2xlLTM2MzgwNS5odG1s">星推搜直<i class="fa fa-external-link-alt"></i></span>” 方法论、小红书的<span class="exturl" data-url="aHR0cHM6Ly96aHVhbmxhbi56aGlodS5jb20vcC81OTYyNzUzMTY=">KFS<i class="fa fa-external-link-alt"></i></span>方法论，都是在指导广告主怎么更好地整合平台提供的营销能力，包括素材的生产、投放的方法论等</p><p><img data-src="https://wulc.me/imgs/x_t_s_z.jpg" height="60%" width="60%"></p><p>除了方法论，平台也需要提供对应的能力和工具，如经营诊断、资产管理（人群资产如抖音的5A 人群），具体可参考下面这张图，这里就不详细展开了</p><p><img data-src="https://wulc.me/imgs/manage_tools.jpg" height="60%" width="60%"></p><h1 id="创作者">创作者</h1><p>创作者是平台优质内容的重要来源，为了让创作者能够持续在平台上创作出好内容，平台往往需要为创作者提供两个能力：商机和加热；商机就是创作者变现的撮合机会，也是上面提到的星图等各个平台的支持的能力；加热则是为创作者提供的买流量的产品，是创作者成长的一个很重要的工具</p><h2 id="商机">商机</h2><p>通俗来讲，平台为创作者提供的商机就是 B 与 K 的撮合，即 B 付费给 K写笔记 + 发布笔记，买的是 K 的内容和流量</p><p>因此平台需要保证撮合能力的完备性与易用性，完备性指的是平台提供的撮合能力需要涵盖基本的范式，如一般的撮合有1v1 的精准模式、1vN 的招募模式，计算方式有一口价结算，也有根据效果的 cps类结算</p><ul><li><strong>1v1 与 1vN</strong></li></ul><p>1v1 的撮合和一口价是比较基础的模式，就是 B 在平台上选择对应的K，然后付款让 K 写笔记后发布；而 1vN 和 cps结算类，是更偏效果化的方式，同时为更多的中长尾 K提供变现机会，其模式一般是 B 表达其需求，然后平台将需求发布给一批 K，B再根据 K创作的笔记带来的实际效果（如曝光、点赞等）进行结算，这种模式相较于1v1，相当于把 B 的预算从原来的只分配给 1 个 K，变成了分配给多个K；星图的<span class="exturl" data-url="aHR0cHM6Ly9kZXZlbG9wZXIub3Blbi1kb3V5aW4uY29tL2RvY3MvcmVzb3VyY2UvemgtQ04vbWluaS1nYW1lL29wZXJhdGlvbjEvYWR2ZXJ0aXNlci9wdWIvaW50cm9kdWN0aW9u">发行人计划<i class="fa fa-external-link-alt"></i></span>就是个典型的1vN 模式</p><p><img data-src="https://wulc.me/imgs/xingtu_cps.jpg" height="60%" width="60%"></p><ul><li><strong>水上与水下</strong></li></ul><p>这类官方撮合平台，往往面临着预算走 “水下” 的问题；这里有个概念需要说明，水上即是走官方合作平台的BK 撮合，需要给平台交一定的手续费；而水下指的是 B 不通过平台与 K直接建联</p><p>站在平台的视角，肯定是希望 BK撮合都走水上，因为除了手续费还能对平台的这类商机有更好的管控；但在 B的视角，走水下既能省手续费，内容又能更原生（有些平台对水上的内容会明确打标），因此水下与水上的博弈，会是一个平台长期需要解决的问题</p><p>为了让更多的预算从水下翻水上，平台需要做好两件事</p><p>（1）提升撮合平台的易用性与效率，即平台需要让 B 和 K 的建联更容易</p><p>（2）流量分发上，水上需要建立与水下有差异的分发机制，并对 B侧透出笔记走水上的权益</p><p>这里重点说一下第（2）点，因为 BK 撮合的笔记跟 K自己发布的笔记在形式上基本是无差异的，一般都是走大盘的分发，在这种方式下，相当于水上笔记与水下笔记的流量分发没有任何差异，这样B 走水上的意愿就没有那么高了</p><p>所以要做水下翻水上，水上的流量分发需要做出差异，需要更多考虑 B侧的权益（因为一般创作者的笔记都是在推荐分发，B侧的相关目标往往不是大盘分发的目标）；而实际上，K 与 B的目标并不是二元对立的，本质上是平台对 B 的钱袋子在不同 K的分配之间做干预，所以首先要服务好愿意出钱的 B，然后需要考虑如何在不同 K之间做好分配</p><p>而 B侧往往是有营销诉求的，在星图等平台上买到的素材会是其投广素材的一个很重要的来源，且这个素材的在K 发布后获取到的自然流量的效果，是影响 B拿这个素材投广的一个很关键因素；有差异的流量分发，就是指这部分自然流量的分发方式和效果，在实际中，可以考虑为这部分流量加入一些B 侧更关注的影响目标作为排序公式的一部分</p><ul><li><strong>内容投广</strong></li></ul><p>前面也提到了， B 往往是有营销诉求的，会利用 K创作好的素材进行投广等操作，因此创作者为 B创作的内容，是商业化素材很重要的一个来源；所以在水上的流量分发中，除了考虑并透出更多水上流量的权益，还能引导客户用更多的素材投广，因为水上流量的效果，往往是客户判断素材优劣的一个很重要因素</p><p>通过素材在水上流量的效果让客户决策投广，是一个比较间接的方式；相较于这种方式，<span class="exturl" data-url="aHR0cHM6Ly93d3cueGluZ3R1LmNuL2hlbHAtY2VudGVyL2RlbWFuZGVyLzEzODEzMw==">星广联投<i class="fa fa-external-link-alt"></i></span>则是一个更直接的方式，这种方式跟前面提到的全域推广有点像，也是同时考虑了客户在自然流量和广告流量的效果</p><p><img data-src="https://wulc.me/imgs/xingguangliantou.jpg" height="60%" width="60%"></p><h2 id="加热">加热</h2><p>如果说商机是创作者变现的部分，加热就是创作者付费的部分：付费为自己的内容加热，像市面上的<span class="exturl" data-url="aHR0cHM6Ly9kb3VqaWEuZG91eWluLmNvbS8=">dou+<i class="fa fa-external-link-alt"></i></span>、<span class="exturl" data-url="aHR0cHM6Ly9tcC5rdWFpc2hvdS5jb20vZG9jcy9pbnRyb2R1Y3Rpb24vcXVpY2tTdGFydEd1aWRlL2J1c2luZXNzL2NvbnRlbnQtaGVhdGluZy5odG1s">粉条<i class="fa fa-external-link-alt"></i></span>、<span class="exturl" data-url="aHR0cHM6Ly93d3cubmlhb2dlYmlqaS5jb20vYXJ0aWNsZS02MDMwMTgtMS5odG1s">薯条<i class="fa fa-external-link-alt"></i></span>等都是创作者加热工具</p><p>加热本质上就是花钱买流量，这一点跟广告是一样的，最大的区别是创作者对投放与商业不是非常熟悉，跟中小客户一样需要提供一些低门槛的投放产品和能力</p><p>而在流量分发上，虽然这部分流量是创作者花钱买的，理论上应该跟广告混竞，但是创作者一般的竞价能力是不如大广告主的，与广告混竞往往会存在着竞争不过大广告主的问题，或者说相关的曝光、转化成本会跟商业流量的水位一样，这样给创作者带来的体感就是流量很贵，性价比远不如自己发内容获取到的自然流量</p><p>但平台是需要提供一个付费买流量的工具给到创作者的，因为这是也是创作者成长很重要的一个能力；因此这部分流量是需要独立来分发的，避免被广告的挤压，且在混排时有更宽松且独立的首位、min_gap等限制；同时，这部分素材一般比起硬广的素材质量也会更优，素材也往往不用打标</p><h1 id="用户">用户</h1><p>在商业系统中，与用户较为相关就是体验相关的事项，量化的指标往往是 dauloss；从这个角度来讲，商业化就是在用 dau loss来换钱，且需要持续把这个兑换比变得更高；但 dau loss需要长期的实验才能观测到显著的变化，所以往往会把 dau loss拆解出很多中间指标 (如使用时长、次留、负反馈等) 进行观测</p><p>为了防止 dau loss 超红线， ad load限制是最基础的约束，在此之上就是各种体验的流量策略，包括频控、排序公式加入体验项、混排约束等</p><h2 id="流量策略">流量策略</h2><p>频控是最常见的体验策略，即控制同一内容 / 同类内容等在 xx天内不能给用户曝光超过 xx次之类的，这类频控比较硬，所以往往也会有针对不同给用户 xx是不同的软频控策略，本质上其实是个分人群策略</p><p>排序公式里加入体验项也是常见手段，商业化的分发公式中的基础项 ecpm，是以收入最大化作为目标的，在 hidden_cost中可以加入负反馈项、停留时长项等影响相关的体验项，但这破坏了以收入最大化的分发目标，对收入来说肯定不是最优的，而这本质上就是在用收入来兑换相关的体验</p><p>混排一般会有较多的约束，其目的也是约束广告对用户体验的损害，如广告的首位，广告位置之间的gap 约束，广告曝光的时间 gap的限制，但是很多策略其实都在尝试把硬规则软化，所以也有一些思路是把这些比较硬的规则做成软化的loss，详见 <a href="https://wulc.me/2023/02/26/%E6%B7%B7%E6%8E%92%E9%82%A3%E4%BA%9B%E4%BA%8B/#%E7%A1%AC%E8%A7%84%E5%88%99%E6%98%AF%E5%90%A6%E6%9C%80%E4%BC%98">混排的那些事儿</a></p><p>上面提到的这些策略，其实都在做的都是个性化策略，或者说分人群策略；因为不同用户之间的差异是比较大的，如果对用户做聚类，一般可以从“价值 × 对广告敏感” 的角度把用户划分成 4个类比；不同类比的用户往往需要不同策略（个性化策略），如广告多出在高价值低敏感的用户，少出在低价值高敏感的用户上，带来的dau 收益和商业化收入的收益，肯定是要更大的</p><p>回到上面的软频控、排序公式加入体验项打分、混排硬约束的软化，其实都是在做分人群的策略，都会把广告更多地出在那些高价值低敏感的用户，这不是个显式的策略，是各个策略基于后验数据建模，再作用到系统上的自然结果</p><p>值得注意的是，高价值不敏感用户的标签并非会一直不变，当各类营销内容（电商、直播、广告）都在挑这部分人群时，有可能因为营销内容过多而离开平台；所以监控dau loss 时，也可以分人群做监控，把这部分核心人群单独监控起来</p><h2 id="素材">素材</h2><p>另一个优化用户体验的重要方向就是素材了，包括素材的质量与多样性，这部分在前面都提及到了，这里就不再展开</p><h1 id="小结">小结</h1><p>传统的广告系统一般需要处理好三方的关系：广告主、平台和用户，但是随着内容平台的发展，创作者在商业变现中的影响也越来越难被忽视，本文主要就是讲了这四方的相互关联、相互作用而构成的商业系统</p><p>作为连接各方的核心枢纽，平台是最重要也是最需要发挥主观能动性的一方；这里主要从体验、变现和生态三个方面讲述平台的职责。在体验上，需要为C 端用户交付好 dau loss，同时也要给 B端用户提供良好的投放体验；在变现上，需要最大化售卖 adload，同时为创作者提供一个好的变现环境；在生态上，客户与创作者的生态都需要分结构来看总体分布，而在内容上，也都需要保证内容的优质性</p><p>客户作为平台的金主，是平台需要重点服务的客户，无论是分行业 / 场景的优化，还是针对SMB客户有更多低门槛的投放，都是在尝试把每个广告主服务好，让广告主能更好的做好自己生意，在平台上做长期的经营</p><p>创作者是平台优质内容的重要来源，无论是给 C 端的用户的消费还是 B端的用户的营销；创作者在平台上持续创作出好内容，往往会有两个诉求：商机和加热，前者是供创作者变现，后者则是创作者的成长，平台需要提供相应的能力</p><p>用户是平台的根基，商业变现不能无底线地损失用户体验，需要在体验的红线指标内最大化分发效率，通过各种精细化的流量策略，优质的素材等，降低对用户体验的损失</p><p>从最开始门户网站的 banner ads，到搜索引擎的 searchads，再到内容平台的 feedads，每一次的变革都为广告业带来了新的可能性和挑战，商业变现的多样性与复杂性也是前所未有的；本文所简述的内容也只是冰山一角，很多内容没有详细展开，有更多在冰山之下，隐藏着更多值得我们去探索和了解的知识，也欢迎交流指导～</p>]]></content>
    
    
    <summary type="html">&lt;p&gt;之前写的 &lt;a href=&quot;https://wulc.me/2021/05/05/An%20Overview%20Of%20Ad%20System/&quot;&gt;An
Overview of an AD System&lt;/a&gt;,
从技术原理上介绍了各个模块（召回、精排、出价、冷启动等）的基本职责和原理，几年过去了，这部分的认知虽然还没过时，但是经历了更多业务后，对整体的商业化也有一个更全面认知，本文尝试从另一个更系统的角度去理解一个广告系统&lt;/p&gt;
&lt;p&gt;传统认知中的 ad system
一般是三方：广告主 / 代理、平台、用户；但是随着内容平台（如抖音、快手、小红书、bilibili 等）的迅速发展，涌现了越来越多的
UGC
内容，创作者在商业变现中的影响也越来越难被忽视，所以这里基于三方增加了代表创作者的第四方，如下图所示&lt;/p&gt;
&lt;p&gt;&lt;img data-src=&quot;https://wulc.me/imgs/YAOAS_relationship.jpg&quot; height=&quot;60%&quot; width=&quot;60%&quot;&gt;&lt;/p&gt;
&lt;p&gt;以上的四方比较复杂的关系，一般是存在于 “一方流量”（参考一方数据的概念）上，即抖音 / 快手 / 小红书 /bilibili 这类有能力搭建自己的一方流量的变现团队，在自家的流量上变现；相较于 “一方流量”，“三方流量” 的场景一般只需要关注客户和平台的关系，典型的就是联盟的场景（穿山甲、优量汇、快手联盟等），对用户侧没有强体验约束，因为本质上联盟就是个倒卖流量的生意，相关技术与一方流量差不多，但是对
C 端的用户体验以及创作者部分基本不怎么关注。&lt;/p&gt;
&lt;p&gt;本文重点在一方流量上，下面的内容会根据上图中提到四方依次讨论每一方本身的一些职责、与其他各方的关系，内容会比较发散，祝开卷有益～&lt;/p&gt;</summary>
    
    
    
    <category term="计算广告" scheme="https://wulc.me/categories/%E8%AE%A1%E7%AE%97%E5%B9%BF%E5%91%8A/"/>
    
    
    <category term="计算广告" scheme="https://wulc.me/tags/%E8%AE%A1%E7%AE%97%E5%B9%BF%E5%91%8A/"/>
    
  </entry>
  
  <entry>
    <title>Systematic Trading-Avoid Flawed Human Brain with Systematic Trading Rules</title>
    <link href="https://wulc.me/2024/03/10/Systematic%20Trading/"/>
    <id>https://wulc.me/2024/03/10/Systematic%20Trading/</id>
    <published>2024-03-10T13:53:19.000Z</published>
    <updated>2026-02-28T05:01:22.930Z</updated>
    
    <content type="html"><![CDATA[<p>《<span class="exturl" data-url="aHR0cHM6Ly93d3cuc3lzdGVtYXRpY21vbmV5Lm9yZy9zeXN0ZW1hdGljLXRyYWRpbmc=">SystematicTrading: A unique new method for designing trading and investingsystems<i class="fa fa-external-link-alt"></i></span>》 is a comprehensive guide for traders and investors seekinga structured approach to the markets.</p><p>Aimed at both novices and experienced traders, the book offerspractical insights and applications, making it a pretty good resourcefor anyone looking to enhance their trading methodology with asystematic approach.</p><p>This is not a book totally about automating trading strategies. It’spossible to trade systematically using an entirely manual process withjust a spreadsheet to speed up calculations, so automation is notnecessary, the key word if "systematic". This passage mainly covers thefirst two chapters, providing a rough overview of this book. Hope youcan enjoy it</p><span id="more"></span><h1 id="flawed-human-brain">Flawed Human Brain</h1><h2 id="three-types-of-traders">Three types of traders</h2><p>There are three types of traders in this book. To a certain extent,these three types are determined and classified by the degree ofautomation with which they execute transactions.</p><p><strong>1. asset allocating investor</strong></p><p>Asset allocators can use systematic methods to avoid the short-termchasing of fads and fashions that they know will reduce their returns.They might be lazy and wise amateur investors, or managing institutionalportfolios with long horizons such as pension funds.</p><p>Asset allocators are sceptical about those who claim to get extrareturns from frequent trading. For this reason <strong>the basic assetallocation principle assumes you can’t forecast how asset prices willperform</strong>.</p><p><strong>2. semi-automatic trader</strong></p><p>Semi-automatic traders think they are superior to simple rules whenit comes to forecasting by how much prices will go up or down; insteadthey make their own educated guesses</p><p>They would like to <strong>place those bets inside a systematicframework which will ensure their positions and risk are properlymanaged</strong>. This frees them up to spend more time making the rightcall on the market.</p><p><strong>3. staunch systems trader</strong></p><p>The staunch systems trader is a true believer in the benefits offully systematic trading. Unlike the semi-automatic trader and the assetallocating investor, they embrace the use of systematic trading rules toforecast price changes, but within the same common framework forposition risk management.</p><h2 id="avoid-mistake-instead-of-silver-bullet">Avoid mistake instead ofsilver bullet</h2><p>This book claims that there is no magic system that willautomatically make huge profits for you, and you should be wary ofanyone who says otherwise, especially if they want to sell it toyou.</p><p>Instead, <strong>success in systematic trading is mostly down toavoiding common mistakes</strong> such as over complicating your system,being too optimistic about likely returns, taking excessive risks, andtrading too often.</p><p>The aim of this book isn’t just to offer a single predefined systemfor trading, but to provide a modular framework which can be adapted tomeet your needs. Part three describes the framework in detail. Just likeyou can choose different engines and tyres on a car, my frameworkincludes options for different trading rules and position sizingcalculations.</p><h2 id="overconfidence-leads-to-flawed-human-brain">Overconfidence leadsto flawed human brain</h2><p>Meddling is due to the biggest cognitive bias of all:<strong>overconfidence</strong>. We think we are cleverer than thetrading system and we are. To stop meddling with our trading systems werequire what economists call a <strong>commitmentmechanism</strong>.</p><p><strong>Creating a purely objective system</strong> is a powerfulcommitment mechanism.</p><p>A highly subjective rule would be something like ‘Sell for smalllosses, and hold on to large profit making positions’.</p><p>Another advantage of objective systems is that they can be automated,and automation is a good commitment mechanism</p><p>But automation doesn’t stop meddling, having a system which requiresa human to do the actual execution of automatically generated trades isstill prone to meddling, so it must be done with a <strong>well designedsystem</strong> in which you have full confidence.</p><p>One simple principle is systems whose performance and behaviour canbe explained will be more preferred, while there are <strong>somepitfalls to avoid when designing trading systems: over-fitting,overtrading and over-betting</strong></p><ul><li>over-fitting</li></ul><p>If we’re not careful the rules selected will fit the data too well.They will be highly tuned to one set of market conditions and performworse in actual trading than a simpler rule would.</p><ul><li>overtrading</li></ul><p>Both amateur investors and professional managers have a tendency totrade too frequently.There are extra costs involved in trading moreoften.</p><p>Overtrading suggests overconfidence in your own relative ability toovercome the higher hurdle of bigger costs.</p><ul><li>over-betting</li></ul><p>If your confidence is unbounded you can bet the maximum that yourbroker allows you to. Potentially this could be a ten-fold leverage onan individual equity bet, equating to an annual standard deviation ofreturns of around 200%.</p><h1 id="systematic-trading-rules">Systematic Trading Rules</h1><p>This section mostly relates to how trading rules are fitted. This isless applicable to asset allocating investors and semi-automatictraders</p><h2 id="ideas-first-or-data-first">Ideas first or data first</h2><p><img data-src="https://wulc.me/imgs/data_first_vs_idea_first.png" height="50%" width="50%"></p><p>The author favors the ideas first method. This usually results inintuitive, simpler and more transparent rules. In the author'sexperience, consistently profitable trading comes out of carefulresearch, done by thoughtful and knowledgeable people, who seek tounderstand where their profits come from.</p><p>But some situations the data first process could be better; forexample in high frequency trading where there is plenty of data, rulescan be refitted regularly and novel ideas are more likely to be found asmarket structure evolves.</p><h2 id="what-makes-a-good-trading-rule">What makes a good tradingrule</h2><p>This book identifies the following four aspects as the mostcrucial:</p><ol type="1"><li><strong>explainable profits</strong></li></ol><p>With an ideas first approach you can easily explain why a strategywas profitable, since the explanation is inherent in the original idea.For example you might have tested a trend following rule, which youthink makes money because of cognitive biases explained by prospecttheory.</p><p>With data first any explanation has to follow the fitting process.You first examine how a rule behaves and then infer what might becausing the effect. The more complex a data driven trading rule is theharder it will be to explain.</p><p>Remember the narrative fallacy, another cognitive bias: humans likestories. To trust a trading rule the author both a good story and arigorous back-test.</p><ol start="2" type="1"><li><strong>intuitively understandable behaviour</strong></li></ol><p>A complicated system might buy or sell when prices moved higher,depending on the exact pattern. This would make its behaviour lessobvious and more unpredictable.</p><ol start="3" type="1"><li><strong>as simple as possible</strong></li></ol><p>It is much easier to explain the profitability and behaviour ofsimple trading rules, those with few moving parts and no weirdinteractions.</p><p>Ideas first rules should be simple unless you begin with a veryconvoluted idea, or over complicate it to get a more profitableback-test, neither of which is recommended. Data first rules can be verysimple or extremely complicated, depending on how many parameters arefitted. A data first rule with more parameters will be less explainable,and more vulnerable to over-fitting.</p><ol start="4" type="1"><li><strong>can be systematised</strong></li></ol><p>Ideas need to translated into systematised rules. Not all styles oftrading are entirely suitable for this, because they are inherently<strong>subjective</strong> or because of <strong>datalimitations</strong>.</p><ul><li>subjective</li></ul><p>Many methods of trading cannot be systematised because it’simpossible to write down a set of relatively simple, objective andgeneric rules. One example would be merger arbitrage, where you have toassess the likelihood of a deal going through based on analysis of anumber of hard to quantify factors.</p><ul><li>data limitations</li></ul><p>Even if a strategy is objective the necessary data might beunavailable. Even if you could write trading rules for merger arbitragethe necessary information about legal and regulatory issues cannoteasily be converted into an algorithm friendly format.</p><p>There might also be a shortage of data, cause many years of data areneeded to properly test a strategy.</p><h2 id="why-certain-rules-make-profit">Why certain rules makeprofit</h2><p>This book lists multiple cases to explain why certain rules areprofitable</p><ul><li><p>risk premia<br></p></li><li><p>liquidity and size<br></p></li><li><p>when others have to trade<br></p></li><li><p>barriers to entry, returns to effort and cost<br></p></li><li><p>behavioural effects<br></p></li><li><p>pure alpha and skill<br></p></li><li><p>...</p></li><li><p><strong>risk premia</strong></p></li></ul><p>There are three types risk premia mentioned in this book</p><ol type="1"><li>persistent risk premium</li></ol><p>Some risk premia persist for long periods, like the extra returnyou’d expect from investing in equities versus safer assets likebonds.</p><ol start="2" type="1"><li>timing varying risk premium</li></ol><p>You can make profits buying cheap premia and selling expensive ones.This is a form of mean reversion trading, where you assume premia, andhence prices, will revert to some long- term equilibrium.</p><ol start="3" type="1"><li>skew and unlikely events premium</li></ol><p>The rational investor of classical financial theory only cares aboutan asset’s Sharpe ratio (SR) – it’s average returns adjusted for theirstandard deviation.(Formally it is the mean return for a particular timeperiod divided by the standard deviation of returns for the same timeperiod; daily v.s annual)</p><p>This only makes sense if all assets have symmetrically distributedreturns.in practice assets with the same SR could make steady losseswith occasional large returns or steady gains with occasional largelosses</p><ul><li>positive skew VS negative skew</li></ul><p>When an asset has a higher chance of a large down move than anequivalent up move, it is said to have a negative skew. If large upmoves are more likely then it has positive skew.</p><p><img data-src="https://wulc.me/imgs/positive_skew_vs_negative_skew.png" height="50%" width="50%"></p><p>With the same Sharpe ratio, the returns from a positively skewedasset will contain more losing days than for those of a negativelyskewed asset. But the losing days will be relatively small inmagnitude.</p><p>Equities normally have mildly negative skew. ‘Safe haven’ assets likegold and Swiss francs tend to have positive skew.</p><ul><li><strong>liquidity and size</strong></li></ul><p>The degree of liquidity in an asset is how easily we can buy or sellwithout unduly affecting the price.</p><p>The premia for liquidity, size and leverage can vary over time,presenting opportunities for well timed buying and selling.</p><ul><li><strong>when others have to trade</strong></li></ul><p>Not everyone trades because they are trying to make money. Some areforced to.</p><p>A foreign exchange carry trading rule that borrows in low interestrate currencies like Switzerland and invests in high interest ratecurrencies will be consistently profitable as a result, at least untilthe currency policy is abandoned</p><ul><li><strong>barriers to entry, returns to effort and cost</strong></li></ul><p>Some trading rules have barriers to entry in the form of costs orinvestments that need to be made to realise profits from them. Highfrequency strategies require renting expensive servers locatedphysically within exchange buildings, as well as developing specialisedsoftware.</p><p>If an opportunity requires a lot of work to exploit, then it may bepassed up by most investors and additional returns would not beavailable.</p><ul><li><strong>behavioural effects</strong></li></ul><p>You can create rules which extract returns from other people’sbehavioural weaknesses.</p><ul><li><strong>pure alpha and skill</strong></li></ul><p>Those who exhibit pure skill can adapt to changing marketopportunities in a way that a systematic rule never could. If you thinkyou are part of this elite group then the semi- automatic trader exampleis for you.</p><h2 id="trading-styles">Trading styles</h2><h3 id="static-vs-dynamic">static vs dynamic</h3><p>Static means you invest your portfolio and then do nothing, whiledynamic is to rebalance your protfolio the from time to time</p><p>The most intuitive dynamic rule is to re-balance your portfolio soyou keep the same cash value in each company.</p><p>Yet another rebalance rule is to equal risk instead of equal cashvalue, which is <span class="exturl" data-url="aHR0cHM6Ly93d3cuaW52ZXN0b3BlZGlhLmNvbS90ZXJtcy9yL3Jpc2stcGFyaXR5LmFzcA==">risk parityinvesting<i class="fa fa-external-link-alt"></i></span>. This method assumes risk is equal to the recent standarddeviation of the daily percentage changes in price for each firm.</p><blockquote><p>Risk parity is an advanced portfolio technique often used by hedgefunds and sophisticated investors. It requires a complex quantitativemethodology, which makes its allocations more advanced than simplifiedallocation strategies. <strong>The goal of risk parity investing is toearn the optimal level of return at the targeted risklevel</strong>.</p><p>Simplified allocation strategies such as the 60%/40% stocks-bondsportfolio make use of MPT. MPT provides a standard for diversificationwithin one's investment portfolio that maximizes expected return for agiven level of risk. In simplified MPT strategies using just stocks andbonds, allocations are usually more heavily weighted toward equities forinvestors who wish to take on more risk. Risk-averse investors willinstead have a higher weight in bonds for capital preservation.</p></blockquote><ul><li>predictable risk vs unpredictable risk</li></ul><p>It’s very hard to forecast what the return will be each day over thenext few weeks for an asset or portfolio. But you can model and estimatewhat the variation in returns is likely to be. Estimates based entirelyon assuming that recent levels of variation will persist tend to berelatively good</p><h3 id="skew-positive-vs-negative">skew: positive vs negative</h3><p>The term "skew" mentioned here, just like the "skew" referred to inthe context of risk premium earlier, which usually can be classifiedinto positive skew and negative skew</p><p>If you are using a systematic trading rule and have access toback-testing technology you can measure your skew. Otherwise you willneed to make a judgment on what it is likely to be based on your tradingstyle.</p><p>The characteristic of positive skew and nagative can be listed asfollows</p><p><img data-src="https://wulc.me/imgs/positiveSkew_vs_nagativeSkew.jpg" height="50%" width="50%"></p><p>Some examples of positive skew and negative skew</p><p><img data-src="https://wulc.me/imgs/positiveSkew_vs_nagativeSkew_example.jpg" height="50%" width="50%"></p><p>Be aware that if you are making steady profits nearly every day, andmost of your trades are winners, then there is a good chance you areengaged in negative skew trading. It’s just that you haven’t yet seenany rare large losses.</p><h3 id="trading-speed-fast-vs-slow">trading speed: fast vs slow</h3><p>Trading speed can be roughly classified into three types: very slow,medium and fast, depends on the average holding period</p><p>Very slow systems usually hold assets for <strong>several months tomany years</strong>. While the average holding period of medium isusually <strong>a few hours or days, to several months</strong>. But forfast system, the holding period is usually <strong>microseconds to oneday</strong></p><p>Very slow systems look almost like static portfolios, with additionalgradual changes in position coming from their trading rules. Rules ofteninvolve mean reversion to very long run equilibrium such as relativevalue equity portfolios that buy past losers, and sell recentwinners.</p><p>In medium systems, trading costs need to be accurately measured todecide whether an instrument should be traded at a faster or slowerspeed within this region. Large institutional traders also need todetermine if a market has the capacity to absorb their trading. Thesesubjects will be covered in chapter twelve, ‘Speed and Size’.</p><p>For fast system, typical raw Sharpe ratios could be very high due tothe number of trades made, but costs will chew up a big chunk ofprofits. Special execution algorithms are needed to reduce costs belownormal levels. There are higher barriers to entry than at slower speeds;co-located servers and fully automated software is needed. Also fasterstrategies are likely to have limited capacity. The domain of highfrequency trading mostly falls outside the scope of this book.</p><ul><li>LAW OF ACTIVE MANAGEMENT</li></ul><p>There is a law called <span class="exturl" data-url="aHR0cHM6Ly9jb3Jwb3JhdGVmaW5hbmNlaW5zdGl0dXRlLmNvbS9yZXNvdXJjZXMvY2FyZWVyLW1hcC9zZWxsLXNpZGUvY2FwaXRhbC1tYXJrZXRzL2Z1bmRhbWVudGFsLWxhdy1vZi1hY3RpdmUtbWFuYWdlbWVudC8=">LAWOF ACTIVE MANAGEMENT<i class="fa fa-external-link-alt"></i></span>, which states that the <strong>Sharpe ratio ofa trading strategy will be proportional to the square root of the numberof independent bets made per year</strong>.</p><p>This law gives us some idea of how profits should vary with tradingspeed. Suppose you’re holding one asset at a time, and making one ‘bet’per year (buying, holding for 12 months before selling, then repeating),and that you expect an SR of 0.15 from this activity.</p><p>If you decide to make four ‘bets’ a year, holding the asset for threemonths, then because 2 is the square root of 4 you should expect an SRof 2 × 0.15 = 0.30.</p><p>If you begin betting every single business day, then with around 256business days in a year the SR will be 16 times larger than 0.15 or2.4</p><p>The other important implication of the law is that diversificationacross assets can substantially improve returns. If you can find fourassets which have zero correlation then you can double your Sharperatio.</p><p>But the flaws of this law is also obvious, it assumes that the‘skill’ of the trader is constant across holding periods (but the skillsrequired to day trade are very different from those a long-term investorneeds). It also ignores transaction costs；these can seriously damagethe returns of fast traders<br>### technical vs fundamental</p><p>Strategies vary in the source of data they use, either usingtechnical or fundamental information, or both.</p><p>Purely technical rules only use <strong>price data</strong>. Whilefundamental data, comes in two main flavours: <strong>micro andmacro</strong>. Micro data is about a specific asset, for example theyield of a particular bond or the PE ratio of a company. Macro data suchas inflation and GDP growth covers entire economies.</p><p>Technical systems are easier to build and run, but in another exampleof barriers to entry the additional effort required for includingfundamental rules is usually rewarded with higher returns. The examplesin this book are all technical</p><h3 id="portfolio-sizep">portfolio sizep</h3><p>As the law of active management shows that diversification is thebest source of additional risk adjusted returns. Both traders andinvestors should hold more positions when they can; ideally acrossseveral asset classes to get the greatest possible benefit. With largerportfolios you’re also less exposed to instrument specific problems suchas bad data or temporary liquidity issues.</p><p>However smaller portfolios make sense for semi-automatic traders orfor those running entirely manual systems. In chapter twelve, ‘Speed andSize’, those with relatively small accounts also have to limit thenumber of positions they take.</p><h3 id="leverage-more-risk-and-yet-more-skew">leverage: more risk andyet more skew</h3><p>Leverage is borrowing to invest or trade. The borrowing can beexplicit as when trading equities on margin, or implicit as withderivatives like futures. Usually one needs leverage when the naturalreturn and risk of an asset is less than desired.</p><p>For example, if you want a 10% return on average, and your asset is abond with an expected Sharpe ratio of 0.5, but only a 5% annualisedstandard deviation, then you need to lever up four times</p><p>Leverage can be dangerous, especially for negative skew, where wegain small consistent gains until the trade goes terribly wrong. Thesesteady gains tricked you into thinking that the position was low risk,and lured you into using leverage to improve your returns. So be awareof gearing up on apparently low risk with an asset or with a style oftrading which is likely to have negative skew, even if you haven’t yetseen any evidence of the large downside</p><h3 id="contrarians-market-followers-and-crowded-trades">contrarians,market followers and crowded trades</h3><p>Three types of trades: contrarians, market followers and crowdedtrades</p><p>Mean reversion and relative value traders act as contrarians, theyseek to take advantage of mis-pricing which means buying low after fallsand selling when the price has risen. Contrarian traders like to catchfalling knives.</p><p>Market followers usually prefer various forms of trend following.Trend followers will close positions that have started to lose money,like the early loss taker trading rule.</p><p>When the majority of market participants have the same bet on, whichcould be from behaving as contrarians or market followers.As the storygoes when the shoeshine boy or the taxi driver is in the market, it’stime to get out, cause the market if full of<br>crowded trades.</p><h2 id="achievable-sharpe-ratios">Achievable Sharpe ratios</h2><p>It’s important to have a realistic sense of what level of Sharperatios (SR) are achievable. Inflated expectations can lead to overbetting, which will be discussed more in chapter nine, ‘VolatilityTargeting’ and overtrading</p><p>The simplest possible risky investments, is a long only equityposition in one company, excess equity returns on single equities willprobably average around 3% a year in the future; with annualisedstandard deviation of around 20%, this implies an SR of 3% ÷ 20% =<strong>0.15</strong> is realistic</p><p>With the law of active management, investing in a portfolio ofequities will do slightly better. If you invest globally across multiplecountries you can probably get to a Sharpe ratio of around<strong>0.25</strong></p><p>To do much better you’d need to allocate across multiple assetclasses: equities, bonds, commodities and so on. Since correlationsbetween asset classes are usually low, a portfolio covering several ofthese types of assets can probably expect to reach a Sharpe ratio ofaround <strong>0.40</strong></p><p>Many traders have highly unrealistic expectations of back-testedSharpe ratios of 2.0, 3.0 or even higher; just on single instruments!These values are far too optimistic and are caused by over-fitting.<strong>In reality SR consistently greater than 1.0 are rarelyachieved</strong>, even by sophisticated institutional investors.</p><p><strong>Usually there are two ways to increase SR, (1) trade negativeskew strategies (2) trade more quickly</strong></p><p>Howerever, taking into account the cost of each trading, trading morequickly may not lead to high SR, as show in the image below</p><p><img data-src="https://wulc.me/imgs/trading_fast.png" height="50%" width="50%"></p><h1 id="conslusion">Conslusion</h1><p>This passage roughly talks about how to avoid flawd human brain withsystematic trading rules, which empahsizes why we need trading rules,and how to measure whether rules are good or not. Different types oftraders and trading styles are also introduced in this passage, showingthose various factors that will affect your profits</p><p>It’s important that you understand and can cope with the risks ofyour trading system. Finding the best trading rules is less importantthan designing your trading system in the correct way. A balancedcombination of trading rules, with different styles that work indifferent environments, is better than any single alternative.</p>]]></content>
    
    
    <summary type="html">&lt;p&gt;《&lt;span class=&quot;exturl&quot; data-url=&quot;aHR0cHM6Ly93d3cuc3lzdGVtYXRpY21vbmV5Lm9yZy9zeXN0ZW1hdGljLXRyYWRpbmc=&quot;&gt;Systematic
Trading: A unique new method for designing trading and investing
systems&lt;i class=&quot;fa fa-external-link-alt&quot;&gt;&lt;/i&gt;&lt;/span&gt;》 is a comprehensive guide for traders and investors seeking
a structured approach to the markets.&lt;/p&gt;
&lt;p&gt;Aimed at both novices and experienced traders, the book offers
practical insights and applications, making it a pretty good resource
for anyone looking to enhance their trading methodology with a
systematic approach.&lt;/p&gt;
&lt;p&gt;This is not a book totally about automating trading strategies. It’s
possible to trade systematically using an entirely manual process with
just a spreadsheet to speed up calculations, so automation is not
necessary, the key word if &quot;systematic&quot;. This passage mainly covers the
first two chapters, providing a rough overview of this book. Hope you
can enjoy it&lt;/p&gt;</summary>
    
    
    
    <category term="读书" scheme="https://wulc.me/categories/%E8%AF%BB%E4%B9%A6/"/>
    
    
    <category term="读书" scheme="https://wulc.me/tags/%E8%AF%BB%E4%B9%A6/"/>
    
    <category term="量化交易" scheme="https://wulc.me/tags/%E9%87%8F%E5%8C%96%E4%BA%A4%E6%98%93/"/>
    
  </entry>
  
  <entry>
    <title>业务、组织与心态</title>
    <link href="https://wulc.me/2023/12/03/%E4%B8%9A%E5%8A%A1%E3%80%81%E7%BB%84%E7%BB%87%E4%B8%8E%E5%BF%83%E6%80%81/"/>
    <id>https://wulc.me/2023/12/03/%E4%B8%9A%E5%8A%A1%E3%80%81%E7%BB%84%E7%BB%87%E4%B8%8E%E5%BF%83%E6%80%81/</id>
    <published>2023-12-03T03:08:18.000Z</published>
    <updated>2026-02-28T05:01:22.914Z</updated>
    
    <content type="html"><![CDATA[<p>最近半年经历了一些业务与组织上的变化，对于这部分也有了一些新的理解和体会，值得写一篇文章来梳理与总结。本文主要讲了对业务和组织的一些看法，包括如何看待 “矛盾” 的业务定位和观点、组织的进化过程、团队组建里的识人与用人等；以及在这个过程中，该如何调整自己的心态。文章比较发散，纯属个人碎碎念，祝开卷有益</p><span id="more"></span><h2 id="业务">业务</h2><h3 id="从接手的业务说起">从接手的业务说起</h3><ul><li><strong>业务就是你职业生涯的作品</strong></li></ul><p>近几个月接手了一个业务，一个有点特殊的业务，特殊的地方在于这是一个被搁置了几个月没人迭代的业务；同时也是一个充满了负面与悲观情绪的业务</p><p>这种悲观和负面情绪令我始料未及，无论是交接过程的粗糙、交接人员的态度或是之前合作团队之间的矛盾，都是我所未曾设想的：缺少有效信息的交接文档，一问三不知的回答、交互过程中展示出来的各种负面情绪，以及产研团队的历史矛盾，似乎都在暗示着这个业务过往推进时的不顺，以及未来推进的艰难；同时也能解释为何业务的迭代停滞了几个月</p><p>说点题外话，人走茶凉的道理虽然也懂，也经历过不少次交接，但像这种对自己所做过的项目的态度消极到有点厌恶以至于不愿提起，的确是我第一次看到；笔者一直觉得，一个人做过的项目就是他的作品，跟他写的文字、录的播客都是一样；项目是一个人职业生涯里的一部分，每一部分都是一段弥足珍贵的经历，都能在一定程度上反映你当时的能力、状态与心境，套用之前看到的一段话是这么描述的</p><blockquote><p>作品即人。它不是人的一部分，而是人的一个阶段，是这个阶段的全部的那个人。你虚作品就虚，你燥作品就糙，你脆弱作品就生硬，你高傲作品就小气，你浅薄作品就邪恶。你懒，你就没作品。</p></blockquote><p>笔者往往被周围的同事认为对工作过于负责，究其原因，可能是面临着交付到笔者身上的每一个业务时，笔者都是当做是自己职业生涯里的一个作品去构思和实践的，这个业务的定位与价值，服务于什么目标，如何能够最大发挥这个业务的价值等等，都是笔者所乐于去思考和实践的。</p><ul><li><strong>业务的价值在哪里</strong></li></ul><p>回到这个业务，在后续了解相关业务的历史背景后，发现其实这个业务也并没有想象中的那么差劲，本身业务的价值还是存在的，且定位也是不可或缺的一部分（保密相关，这里就不详细展开业务的具体形态和详细信息）；只是因为做功的方向不是非常对，或者说是产品的定位不是非常明确和科学，导致了最终的业务产出和现状不是非常理想</p><p>这里也想强调一点，业务能否成功以及业务价值需要分开来看；因为所谓的业务能成功往往需要依靠 “天时地利人和”，“天时地利” 听起来是比较虚的概念，简而言之，就是在当时的那个时机下，推动这个业务是否能刚好满足市场的诉求，适配公司的发展阶段，但 “天时地利” 往往是事后归因才能给出一个所谓正确的判断，更多的时候，我们都是一个<a href="https://wulc.me/2023/02/05/%E5%81%9A%E4%B8%80%E4%B8%AA%E6%B8%85%E9%86%92%E7%9A%84%E5%82%BB%E7%93%9C/">随机漫步的傻瓜</a>；相较于 “天时地利”，“人和” 是更具备主观能动性的部分，或者说是我们能影响的最大部分：你是否充分认识到业务的价值？是否对业务有足够的信心？是否能够清楚认识到自己的定位，以及如何与其他团队配合能否更好得完成业务目标等等</p><p>那该如何判断业务是否有价值呢？这是一个非常大的问题，且往往不同行业，不同的业务形态，判断的标准也不一样；一般判断的业务的价值，都是根据业务已有的规模和市场的认可度来判断，但是这适用于业务已经进行了充分的探索的场景；但更多的情况下，业务往往没有被充分探索。这个时候，笔者倾向于从所谓的<span class="exturl" data-url="aHR0cHM6Ly9iYWlrZS5iYWlkdS5jb20vaXRlbS8lRTclQUMlQUMlRTQlQjglODAlRTYlODAlQTclRTUlOEUlOUYlRTclOTAlODYvOTQ4ODgwNw==">第一性原理<i class="fa fa-external-link-alt"></i></span>出发，可以尝试问自己几个问题：</p><ul><li>业务的模式是什么？为谁提供了什么样的服务赚到了钱？需要完成什么样的目标才能赚到这笔钱？等等<br></li><li>业务在当前组织里的定位是什么？包括对外的宣传口径是什么？对应的上下游是哪些？是否有类似的业务，两者的关系如何？公司是否能够把这个业务去掉而不影响其发展？等等<br></li><li>当前的做法是否已经能够最大化这个业务应有的价值？包括业务目标是否合理？业务的动作是否已经到位？等等<br></li><li>....</li></ul><h3 id="矛盾的观点与定位">“矛盾” 的观点与定位</h3><p>当我们去去思考以上提出的种种问题，去向身边的人做出提问时，会收到很多 “矛盾” 的观点，也会从不同的说法之中产觉到看似矛盾的产品定位，这种现象，刨除掉少数一些胡说八道的 case，更多的情况下是大家观测的视角不一样，或者说利益不一致</p><p>举个例子，在商业化场景下，类似<span class="exturl" data-url="aHR0cHM6Ly93d3cueGluZ3R1LmNuLw==">星图<i class="fa fa-external-link-alt"></i></span>这种在内容社区中的 “商家 - 达人” 撮合平台，横跨在内容和商业化中间，一方面即承载着引导达人生产更好的素材、协助中小达人成长的角色，另一方面则是肩负着变现的角色（包括撮合的手续费以及撮合后的二次投广的费用）；这个时候，如果从内容社区的角色出发，会倾向于让这个产品的的定位更多是站在用户和达人角度，让达人生产的内容的用户价值最大化，而如果从商业化视角出发，会倾向于让产品定位更站在商家的角度，让生产的内容更好满足平台的商业价值</p><p>这两种定位，就是两种看似 “矛盾” 的观点，如果用更加技术的视角，可以理解为一个业务往往有多个目标，如果按最优化来建模时，max的目标是其中一个，而其他目标只能是约束了；比如说上面的情况，第一种 max的用户价值，商业价值是约束，而第二种则刚好相反。实际中无法说明孰对孰错，更核心的点是<strong>哪一种更适合当前的公司总体发展阶段</strong></p><p>究其本质，还是我们面临的业务或世界过于复杂了，没法用一个简单的概括来描述所有的情况：人类很容易陷入一种01对立的二元思维，把世界分成相对的两端，这种二元的判断和分类似乎简化了世界的复杂性，给我们了一种表面的安全感和确定感，但不可避免的，它也一定程度上忽略了世界的复杂性和多面性，也导致了工作或生活中的不少矛盾</p><p>除了聊到的业务，社交平台上的人生智慧或者建议，有很多都是自相矛盾的，从传播学上讲，简短是为了表意更加精确，同时传播上更方便，但是在一个人了解到的知识面有限的时候，很容易导致人走向一个极端</p><p>那面对这些 “矛盾” 的观点，我们该怎么做？在今年上半年，自己对这一点有隐约的体会，也写下了下面的文字</p><p><img data-src="https://wulc.me/imgs/life_neutrality.jpg" height="50%" width="50%"></p><p>后面听了孟岩的无人知晓的 《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY1NTMxN2RhOWY0NDBmNTQ0MzM5ODQ2OQ==">中<i class="fa fa-external-link-alt"></i></span>》的这一期，则是有了更深的理解和感悟</p><p>孟岩的播客中提到的一个很关键点是：<strong>不要把这些建议当作圣经去朝圣，而是要意识到每条建议的适用性与局限性</strong></p><p>Keven Kelly也有类似的观点：很多类似的建议都很简短，一方面这会让表意更精确，另外一方面也更容易传播。但这些建议并不是词典，不是参考书，不是当你遇到事情时候来查阅的。相反，你可以换个方式去听一听，你可以去看一看，你可以去理解，你可以去感受这些建议，然后他们会自然而然地进入到你的潜意识里。当你在日常生活中遇到需要决策的场景时，你的潜意识就会给出答案</p><p>因此，无论是看书、人物传记、充满金句的小册子，还是听播客，我们都不应该把这些东西当作方法论，当作工具书，更不应该把它们当作验证自己行为正当性的依据。相反，我们能做的是通过这些文字和声音更多的了解这个世界，了解我们自己。我们能做的是<strong>允许自己超越二元对立的维度，让我们能从更宽广、更高层次的维度来理解万事万物</strong></p><p>很多时候，当我们有强烈的倾向用一个金句或者建议来解释自己的行为时，也许我们就偏了；相反，<strong>我们要同时追求两件互相矛盾的事</strong>，因为当我们能够同时站在两个矛盾的观点上去看问题时，能够站到更高的维度去看待这个事情，理解这两句看似对立的话讲述的是世界的哪两个面相，理解他们有哪些各自的约束条件和应用场景，理解他们究竟在告诉我些什么。当我们真的理解了这些，我们的潜意识就可以帮助我在需要的时候去做出接近真实的决定</p><p>查理芒格说过，<strong>如果我不能比持有相反观点的人更好地理解他们的观点，我就不配拥有自己对该问题的看法</strong>；菲斯杰拉德也说过，具有一流智慧的人能够在心里同时容纳两个截然相反的观点，而且仍然能够正常思考和行动</p><p>回到业务里也一样，当我们听到跟自己相反的观点的时候，第一时间不是回击（虽然很多时候屁股决定脑袋），而是要想一下其他人说的这个观点的立场，只有我们能充分理解提出这个观点的人的立场和出发点时，才能做出更科学的业务判断，往往也能有更加愉快的合作体验</p><p>ego还是尽量要小点，多了解一些其他的观点和现象，因为绝大多数情况下，我们只经历了这个世界的0.00000001%，却希望用它去解释这个世界的 80%</p><h3 id="那些-ab-无法度量的事情">那些 AB 无法度量的事情</h3><p>过去的我比较信任 AB 实验，而 AB实验也在很多互联网公司里的快速发展中也证明了其价值：消除了很多仅靠主观臆想导致的观点的局限性，在观点不一致情况下提供了决策的重要依据，也为技术迭代指明了道路和方向；最为典型的就是字节跳动这家公司</p><p>虽然 AB 实验也存在一些局限，如分组的 variance问题、实验设置导致结果不可看（如组内抢量问题）、小流量与大流量效果不一致、AB无法反映 AA等问题，但相应的也有相关的技术手段来规避或缓解这些问题，如分组后实验前组内的指标是平的、通过预算分桶等手段保证实验结果的可观测性、大流量反转来观测效果、长期观测AA 变化等</p><p>但是最近一段时间越发觉得，有很多事情是无法靠 AB直接度量的，以产品满意度为例，虽然能拆解很多 AB 中间指标（如点击率、APP内的停留时间、负反馈率等），然后通过技术的迭代提升这些中间指标，期待最终长时间AA观测到总体产品满意度的提升。如果类比为机器学习中的优化，也可以理解为是做了很多的局部优化，期待最终能在全局中往更优的地方前进了一步，但是我们知道，并不是所有的这种局部优化都能带来全局更优的；这么拆解需要保证中间指标与最终指标的是有较强的正相关性的</p><p>AB更难以度量的地方，在于一些更抽象和上层的决策，比如说产品的定位与发展方向，面对产品可能的多种定位，只能选择其中的一个选项，这个时候当然可以用很多数据来辅助这个判断和决策，但最终决策的正确性更多考的是对业务的理解、历史经验积累下来的直觉；并且在选择后也没法证实这个选择的对错，就有点类似uplift 中的 “what if” 问题</p><p>说到底，AB实验只是一个工具，一个在很多情况下都是在方向明确后，迭代优化空间中的不断做出局部调优的一个工具，这个方法的确增强了产品和业务的迭代效率，但同时也要意识到这个方法的局限性，尽信书不如无书</p><h2 id="组织">组织</h2><h3 id="组织服务于业务">组织服务于业务</h3><p>组织与业务是什么关系？笔者认为组织是为业务目标负责的，需要随着业务目标变化而变化</p><p>这也是我们能看到很多公司的组织架构日常频繁调整的原因，原因就是业务目标变了，需要相应的支撑的组织有相应变化</p><p><span class="exturl" data-url="aHR0cHM6Ly93d3cuemhpaHUuY29tL3F1ZXN0aW9uLzI2MTExMzk1L2Fuc3dlci8xOTcyMDI3MDI1">大公司效率低最根本的原因是什么？应该如何应对？<i class="fa fa-external-link-alt"></i></span>，展示了业务从小变大过程中，组织相应的一个变化和改变，从中我们也能理解为什么何谓大公司病，从何而来</p><ul><li><strong>阶段 1：以老板为中心一个簇</strong></li></ul><p>当公司比较小时，业务刚起步时，往往所有事情都是老板一个人做。随着业务的扩张，老板会招一些 (工具) 人进来，此时的公司是一个以老板为中心的扁平化组织，每个人都可以直接和老板沟通，老板对大大小小事物亲自拍板，指哪打哪，彼此之间只存在分工，不存在合作，也就不存在沟通问题。</p><ul><li><strong>阶段 2：独立的部门</strong></li></ul><p>随着公司业务进一步发展，老板必然无法处理所有业务的琐事；此时老板的想法是招几个中层管理人员，小事让中层过滤一下，以后只要大事才找我；于是销售主管、人事行政主管、产品开发主管、财务主管统统招起来，就形成了各种部门</p><p>小事是不能惊动老板的，部门要自己解决，有些事情虽小但也要牵涉其他部门的，这样就形成了部门之间的合作，也昌产生了沟通的问题</p><ul><li><strong>阶段 3：中台的成立与拆分</strong></li></ul><p>公司业务进一步发展，每个部门都有了自己的相关基建和制度，这个时候就会面临一个问题：<strong>相似功能集中管理还是拆分到各个业务部门，或者说，是否要成立中台</strong></p><p>如果平均分到每个独立的部门，也就像是成立单独的小王国一样，麻雀虽小五脏俱全，好处是一个部门独享资源，<strong>沟通成本低</strong>，干什么事情都方便，可以按照自己的需要随时调整资源的配置；<strong>但是带来的问题一是造成资源的重复建设产生浪费，二是导致各个部门标准越来越不统一</strong></p><p>如果把这些共享职能拆分出来，统一管理也成立的单独的中台部门，好处虽然是节省了资源，集中管理也便于整个公司统一规范，但坏处是<strong>极大的增加了沟通成本</strong>。因为这是一个不隶属于所有部门的共享工具人，第一，它没办法分清楚所有部门业务的轻重缓急，因为往往中台部门对业务的理解有限，基本只能按照队列的方式处理到来的request（虽然所有业务方都会说自己的需求优先级很高）。第二，工具人也有自己的立场和私心，也想要摸鱼，对于麻烦的事情能推就推，你不知道它到底是真做不到还是假做不到，往往它随便找一个冠冕堂皇的理由就可以拒绝你。</p><p>对于中台部门上面这种弊端，也不是真的没有办法，遇到真正遇到紧急或者重要的事情，可以调动上层资源给它施压，但一旦优先了你的项目，势必要把别人的项目延后，工具人也拿不定主意，这时候就要把相关部门都召集起来开会，各部门又有自己的立场和私心，看谁吵得过谁了。</p><p>业务进一步发展，业务部门持续增加，中台需要对接的业务部门也会逐步增加，容易出现业务部门被响应的需求不均匀情况，比如说某些业务压根插不上队的，这个时<strong>中台部门会扩招，然后分为若干个小组，每个小组专门对口特定的业务部门</strong>，这样每个业务部门的事务都是平行处理，就不用排队了。</p><p>但还是无法从根本上解决问题，因为部门的 boss 只有一个，所有的事情最后都要经过他批准，这些批准汇总到一起还是要排队，服务的部门越多，他一个人也签不过来，又只能拖长周期了。很多部门抱怨的是，HR 招个人怎么要这么久？而且完全不了解我的需求。那这个时候该怎么办？</p><ul><li><strong>阶段 4：双重领导架构</strong></li></ul><p>我国从中央到地方的各级政府就是双重架构。如市公安局同时归当地市政府和省公安厅管，市公安局的人事、财政由市政府管理，但业务上是服从省公安厅的管理。市公安局一把手的任命需要征得省公安厅的同意。<strong>这种架构的好处是，即保证地方机构运转的灵活性，又利于中央对地方统一指挥和协调</strong>，遇到全国性的紧急事务可以快速实现全国总动员。而西方联邦制国家，每个城市和每个州政府都是完全独立于中央，各自为政，只是把外交和军事委托给联邦政府，联邦政府无权对地方事务进行干涉，从疫情中也能看到这种架构的局限性，连戴口罩和打疫苗都无法顺利推行。</p><p>现在的很多公司也效仿了这种双重架构；如传统的 HR 是按照招聘、培训、绩效管理、薪酬福利、员工关系、组织发展、企业文化等七大模块分组，每个小组负责专门的职能。而新兴的模式则是在总部 HR 部门之外，每个业务部门也有自己的 HR，这种 HR 叫<strong>HRBP，人事关系隶属于业务部门，一切听从业务部门 boss 的安排，同时虚线向总部 HR 部门汇报</strong>。业务部门自己的 HRBP 是全能型的，从招聘到员工关系都能做，所以招人也不需要通过总部 HR，效率就大大提升。那总部 HR 还有什么存在的意义呢？总部 HR 保留了战略规划、政策制定和共享服务提供（如招聘软件、薪酬管理系统、社保录入等等）的职能。</p><p>因此，只垂直管理就会影响地方的效率，只分级管理影响中央到地方的沟通效率，横竖都是影响效率。双重领导是一个折中的做法。</p><ul><li><strong>阶段 5：项目部 / 组架构</strong></li></ul><p>这种架构一般服务于公司的高优项目，公司需要指派一名项目经理负责这个项目；然后项目经理按需从各个职能部门点将，抽调人才组成一个多功能的项目组</p><p>而其中的关键点在于项目经理是否要承担对团队的管理职责；在项目部架构下，所有人的人事关系暂时隶属于项目部，<strong>项目经理是真正的老大，掌握着团队成员的绩效评分</strong>。但在项目组架构下，每个人都还是原部门的人，归原部门老板管，这中模式下可能会带来问题；这里面都有一个关键点，即需要给项目经理放权，如果项目经理没有权利，最终可能只是充当背锅侠的角色，因为没法很好驱动下面的人去干活。</p><p>项目部因为是直接打绩效，所以有直接管辖权，这个问题还好；但对于项目组，需要有一些额外的处理，在许多成熟大公司里，特别是汽车行业和 IT 行业，项目经理是每周和大老板开会的，这一点很重要，因为经常碰面就意味着项目经理就有告状的权利了，大老板知道情况后就会拿职能部门的头是问，这样谁都怕得罪项目经理了。项目经理几乎就拥有一人之下万人之上的权力，就会很有效率了。</p><p>从政府的运作里也可以找到一些类似的机制，中央部委里，除了常设的机构外，还许多 “领导小组”，这种领导小组不是常设机构，只是针对某一项议题成立的项目团队，有跨部门协调的权力，比如中央农村工作领导小组、中央教育工作领导小组等；以之前的新冠疫情的工作为例，应对如此重大的危机，揪着卫健委一个部门去处理肯定是不行的，因为卫健委最多只能管得到医院、疾控中心等单位，像封锁、隔离、停市停课、核酸检测、打疫苗、统计确诊病例、分析传播链条等工作，涉及到公安、城管、工商、教育、基层社区、财政等部门，卫健委对他们没有管辖权，是指挥不动的，只有位高权重的人亲自挂帅才能统筹安排。如国务院有设置 “中央应对新型冠状病毒感染肺炎疫情工作领导小组”</p><p><strong>上面提到的各个阶段，不是简单的替换关系，更多是相互叠加的关系</strong>；这种叠加，是为了解决前一个阶段里暴露出来的一个问题，但同时也会创造一个新的问题，所有的方法只能是暂时的解决每一阶段面临的主要矛盾。下一阶段又会遇到新的问题，大的组织和公司始终是船大难掉头，百年企业往往也意味着历史包袱太大，改革面临重重阻力，因此大公司也不可能无限制大下去，发展到一定程度又会被新的创业公司颠覆，新的创业公司变大之后也会重复以前大公司遇到的问题，又会被下一批新的创业公司干掉，这其实也是一件好事，对整个社会来说是激励兼容的，保证了社会的活力</p><h3 id="团队的组建">团队的组建</h3><p>团队组建的基本理念，跟之前写的 《<a href="https://wulc.me/2022/09/25/%E8%81%8A%E8%81%8A%E7%AE%A1%E7%90%86/">聊聊管理</a>》里提到的观点差不多：像打造一个产品去打造一个团队</p><p>而在今年基本算从零开始搭建团队时，有了更加切身的体会，也在实际中遇到了很多问题：从明确业务定位与方向到拍定hc，招聘的考核方式，如何在短暂的面试时间充分获取信息，以及新人来之后的landing 过程等等</p><p>在这个过程中，判断当前业务在哪个阶段、业务方向怎么划分、需要什么样的组织架构去支撑这部分业务、每个业务需要放多少人、放什么样的人，等问题都是需要考虑的，前半部分跟具体的业务强相关，而后半部分涉及到 “<strong>识人与用人</strong>” 这个话题，也是今年有特别深体验的部分</p><p>识人与用人意味着你要通过短暂的面试或后续的合作阶段来判断候选人的性格、热情、技术栈等，把人放到合适的位置上，达到人力和业务的效率最大化；当然，这是正确的废话，实际中往往需要一些具体的方法；关于这个问题，知乎上有个不错的<span class="exturl" data-url="aHR0cHM6Ly93d3cuemhpaHUuY29tL3F1ZXN0aW9uLzI3Nzk5MzkxNi9hbnN3ZXIvMjU1MDA5NjExMg==">回答<i class="fa fa-external-link-alt"></i></span></p><blockquote><p>对聪明人：<strong>收心放权，用利益吸引，用人品留住，用智慧防守</strong>。和聪明人，不要画饼，利弊关系一开始说清楚，各取所需互相支持。职场，无非是资深人士提供资源观点思路策略，新人提供时间精力情绪价值和事情落地。聪明，意味着利己，利己没错，不伤害他人利益能帮团队就好。要聪明人踏实下来，比让笨的人聪明起来还难</p><p>对笨点的：要事事<strong>耐心</strong>教导，他们很多观点和做事方法论是混沌的，要替他们解构梳理重建，需要时日。你不能急，你一急，他们一害怕就更慌乱，这样原本的水平都保不住。笨点的，大多忠心，但就像切菜用刀背，指望它锋利是不可能了，但用刀的重量也能拍蒜。很多事，聪明人看一眼五分钟就会了，但是教别人时，对方吭哧瘪肚地做了一天还做错了，如果不修炼心性，很多聪明人就会因此急躁，但是要学会为别人创造学会的环境，才是聪明人能获得领导力的转变。</p><p>对自作聪明的笨蛋：是杀敌八百自伤一千六的，如果不想和他们工作一辈子，那就一天都不要留。因为自作聪明意味着他们不甘平庸，但是智商上限低又让他们注定大多数小动作都很迷惑，既花哨多余又损人不利己。其实领导都是过来人，属下心里的小九九不会看不出来。很多时候看破不说破罢了。凡事得有个度，职场虽然不是江湖，但是懂点江湖道义，也不是坏事。</p><p>对于大智若愚的下属：我想说，找到聪明又仗义还有分寸感的下属，那种幸福感真是太棒了，分分钟想唱热血燃烧，然后变成复联一起扛刀去打天下。一定要珍惜，要<strong>以诚相待，要兼顾利益和情怀</strong>。</p></blockquote><h2 id="心态">心态</h2><p>今年印象比较深的一个作品是《<span class="exturl" data-url="aHR0cHM6Ly9tb3ZpZS5kb3ViYW4uY29tL3N1YmplY3QvMzYxNzE4MTQv">男孩、鼹鼠、狐狸和马<i class="fa fa-external-link-alt"></i></span>》，尤其是里面提到了几个观点，无论是 “<strong>我们只能看到外在，但一切都发生在内在</strong>”，还是 “<strong>一个人最大的自由，是选择怎样回应事情</strong>”,又或者是 “<strong>有时候，只是头脑骗你，告诉你，你不好，一切都没有希望</strong>” 都是在告诉我们，很多时候，外部发生的事情是无法避免的，但是怎么看待以及回应这些事情，都是由我们来决定的，或者说在很多事情上，心态决定了你的动作</p><h3 id="理性乐观派">理性乐观派</h3><p>从工业革命开始，人们害怕机器会替代劳动力，人们会失去大批工作；到人口大爆炸，人们担忧粮食不足，导致全球性饥荒；再到石油资源的预测，人们害怕不可再生能源的有限，导致环境破坏和经济崩塌；再到如今 AI 技术的出现，人们害怕自己从事的工种被替代... 我们的焦虑永远不会停止，仿佛这个世界下一秒就要马上毁灭掉</p><p>但事实是工业革命之后，更多操作机器的工种出现，弥补了劳工工作的空缺；人口大爆炸推动了农业自动化和贸易全球化，农业产量增高，大批进出口的农作物不仅填饱了新生人口的肚子，还促进了不同国家间的交流与经济；每当我们认为石油将要用完时，都会有新的油田被发现，各项技术的发展使得石油的利用率大大增加，研发新的清洁能源，混合动力的发展，共同支撑起了新能源消耗型产业</p><p>格雷格・伊斯特布鲁克称这种集体焦虑叫 “<strong>集体性地拒不相信生活会越变越好</strong>”。然而，每次我们担心的问题，都在不知不觉中被解决了。</p><p>原因是对于媒体而言，往往坏消息才是好新闻；对专家而言，唱衰仿佛更彰显理性；对大众而言，坏消息更容易让我们感同身受。人类更倾向于虚幻的想象，却往往忽略了实际的数据，</p><p>《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC82OTEzMzQzLw==">理性乐观派<i class="fa fa-external-link-alt"></i></span>》一书就是在通过具体的数据来打破这些虚幻的想象</p><blockquote><p>1980~2000 年，的贫困人口消费量增加比世界整体快两倍。中国人比 50 年前富裕 10 倍，预期寿命长了 28 年。... 据联合国估计，过去 50 年里贫困人口减少得比此前 500 年里还要多。</p></blockquote><p>但即便如此，处在当下的我们，还是会觉得当下的时代是如此的糟糕；财富的增长，生活的便利，乃至节省的时间，这都是发展在不知不觉中带给我们的好处，然而我们往往忽略了这些好处，用压力、快节奏、竞争等词替换掉便利的现代生活特征。</p><p>人类的大脑中有一个名为 “杏仁核” 的器官，主要帮助我们应对生活中的危机事件，所以对 “坏消息” 极其敏感，因此坏消息更容易让我们感同身受。在必要时，杏仁核可以救命。但是在日常生活中，我们也很容易被 “杏仁核” 挟持，让我们倾向于看负面消息，觉得生活中充满危机。</p><p>回到生活或工作中，理性乐观意味着要看数据、看事实，从数据和第一性原理出发，去判断一件事情的好坏，而不是原始的恐惧情绪</p><p>那当外部有很多负面的声音的时候，我们又应该如何应对呢？《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8yMTE5ODQzLw==">钝感力<i class="fa fa-external-link-alt"></i></span>》这本书有一句笔者比较喜欢的话</p><blockquote><p>在人缺乏自信或犹豫不决的时候，无论怎样的左思右想都于事无补。因此在这种时候，就要摒弃杂念，更为大胆、充满自信地向前迈进才行。</p><p>犹豫不决，不仅根本无法前行一步，还有可能往后倒退。对于你的犹豫不决，很多人当然会有他们各自的看法。而这时，<strong>我们要做的就是从中选出自己听起来最为顺耳，最能够使自己振作并快乐地努力下去的话语，从而坚定不移地向前迈进</strong></p></blockquote><p>当我们去接手一个业务或开拓一个新业务，往往会面临着非常多的外部负面信息；这些信息，有很多纯粹是情绪驱动的信息，也有很多道听途说忽略数据事实的信息，有些也许说得没错，但是也只是一个切面，没有抓住业务最核心的点；这个时候，最为重要也许就是坚定自己的决心，当然前提是要自己判断和认可业务是有价值的</p><h3 id="此刻的咒语">此刻的咒语</h3><p>《<span class="exturl" data-url="aHR0cHM6Ly93d3cueGlhb3l1emhvdWZtLmNvbS9lcGlzb2RlLzY0MmI3ZmQ2NjZlNGMwMGM2YTIzMjZmYQ==">此时此刻<i class="fa fa-external-link-alt"></i></span>》这一期播客里提到了一个有趣的现象：“咒语”，笔者认为是帮助我们达到理性乐观的很重要的途径和工具</p><p>咒语是什么？<strong>咒语是帮助我们看见情绪的” 中断器 “</strong>，因为人类的脑子里存在着无休止的、甚至是不靠谱的想法和情绪，而咒语就是中断这些无休止的想法的中断器</p><p>这种中断在感受和行为之间留出了足够的空间，这其实就对应着下面播客里的这一句咒语</p><ul><li><strong>刺激和回应之间存在一段距离，成长和幸福的关键就在那里</strong></li></ul><p>这句话的英文原版是下面这个</p><blockquote><p>Between stimulus and response there is a space. In that space is ourpower to choose our response. In our response lies our growth and ourfreedom.</p></blockquote><p>在人类漫长的进化过程中，我们会对外界的刺激做很多应激反应（Reactive）：战或逃（FightorFlight），这些应激反应可以帮助人类躲避外在危险，更好的保护自己。从进化的角度看，这些应激反应是为了完成生存和繁衍的任务，但并不能让我们更幸福、更自由。</p><p>这句咒语的意思是：如果我们能够感知到外界的刺激（Stimulus），能够在本能的应激反应（Reactive）之前，给自己一段距离，选择合适的回应方式（Responsive），我们就能寻找到更多的幸福和自由。孟岩为这句话写的<span class="exturl" data-url="aHR0cHM6Ly9zc3BhaS5jb20vcG9zdC81ODk0Ng==">文章<i class="fa fa-external-link-alt"></i></span>里，举了如下例子，笔者认为这里涵盖了很多的场景:无论是延迟满足感，还是降低自己的ego、实事求是，或是冥想，其实都是在实践这句话</p><blockquote><p>当你在看书的时候，突然想拿起手机刷一下朋友圈，这是来自大脑的刺激。这时，你可以应激反应（Reactive），马上拿起手机刷一会儿。你也可以在觉知后给自己一段距离（Space），你知道短暂的愉悦后会很空虚，知道继续看书会有更大的愉悦感，于是你选择用继续看书来回应（Responseive）；</p><p>当别人在讨论中指出你的问题或是批评你做的不对，你感受到自己被冒犯、高大形象岌岌可危。这时，你可以应激反应（Reactive），明知自己错了但依然防卫性的讨论。你也可以在觉知后给自己一段距离（Space），你知道 "找到什么是正确的 “比捍卫" 自己是正确的 "，要重要的多，于是你选择接受对方的批评来回应（Responseive）；</p><p>当你脑海中不停萦绕最近发生的一件令人懊恼的事情，让你无法专心工作或生活。这时，你可以应激反应（Reactive），继续沉浸其中不可自拔。你也可以在觉知后给自己一段距离（Space），你知道过去的事情已经无法改变，但你能做到的是过好现在这个时刻，继而去影响旁边的人或事，从而引发更多积极的变化，于是你选择积极主动、专注当下来回应（Responseive）；</p><p>当你看到朋友圈里一片哀嚎，当你被告知中国要崩溃了，股市要跌到 2000 点。这时，你可以应激反应（Reactive），点一下清仓卖出的按钮。你也可以在觉知后给自己一段距离（Space），你知道金融市场总会有春夏秋冬，你知道自己投资的初心是中国经济的增长，而这并没有改变，于是你选择继续持有、甚至加大买入来回应（Responseive）；</p></blockquote><ul><li><strong>所有东西在眼前的时候都感觉更大</strong></li></ul><p>这是另一句笔者深有体会的咒语，类比机器学习，流式更新的 online model会更加容易受到最近的样本的影响，而人同样是一个 onlinemodel，会更容易被眼前的事情影响，因为人是环境的产物</p><p>当我们大拇指在眼前 1cm的位置，会显得非常大，但如果我们把大拇指从眼前放回一臂的距离，总体感觉就会不一样。我们遇到的很多困难或问题，就是这个大拇指，无论是随着时间的流逝还是问题的逐步解决，我们的大拇指会慢慢从眼前放回到到一臂的距离</p><p>因此，未来会释然是真实的，但当下的那种痛苦也是真实的，通过这个咒语，会让我们在当下能够更加从容面对这些问题</p><p>回到生活或工作上，面对每天的 “大拇指”，不妨想象把这些大拇指拿到一臂之外，也许就不会让我们当下如此焦虑或恐惧了</p><ul><li><strong>没有什么能把我们的人生分成两段</strong></li></ul><p><a href="https://wulc.me/2015/11/20/%E6%88%91%E4%BB%AC%E8%BF%99%E4%B8%80%E4%BB%A3%E4%BA%BA%E7%9A%84%E5%9B%B0%E6%83%91/">《我们这一代人的困惑》</a>里是这么说的</p><blockquote><p>我们的一生好像都是在实现目标中挣扎着度过的。上初中的时候，老师告诉你，中考的淘汰率是最高的，只要闯过去，上了高中一切就好了。但上了高中的时候发现不是那么回事嘛，高中老师又说了啊，考上大学就进了天堂。于是你考上了大学，依然空虚迷茫各种草样年华，父母老师又告诉你，找到工作就好了。工作之后发现烦恼和忧虑依然都在，女朋友给你看马云的故事，告诉你等你事业有成就好了……</p><p>你发现了吗，其实人这一辈子的每一个阶段都有新的痛苦和顾虑，周而复始，生生不息。绝对不会因为你考上大学，事业有成，迎娶了女神就从此happily everafter。但每一个阶段也有每一个阶段的快乐，无法替代。生活不是安徒生童话也不是好莱坞电影，从出生的那一刻起直到生命的尽头，都不存在什么节点，过去了之后一切幸福美满无忧无虑。</p><p>每一段岁月都有它存在的价值，没有高低贵贱之分，都不应该被辜负。而我能想到的人这一生能做的最愚蠢的事情，就是把全部人生的希望都孤注一掷到未来的某个节点上，而忽略了生活本身应有的乐趣。哪怕你以后真正实现了那个执念中的目标，才会发现它远远没你想的那么美好。</p><p>年轻的时候和哥们在操场上打篮球喝可乐的快乐，是以后高尔夫球会所里品红酒替代不了的。尤其男生，千万不要总想着等将来有钱了如何如何，且不说你以后很可能不会太有钱，而且相信我，就是有钱了也真的不能怎么样。生命就在每天的生活里，一切执念都是虚妄。和身边的人愉快相处，认真安排好每一天的活动，用心去感受每一天的心境，就是生活的意义本身。这其实是我今天最想分享给你们的事情。</p></blockquote><p>因此，<strong>不存在 “有了... 就会...”，我们也不要 “等到... 就...”，而是要学会 “一边... 一边...”</strong>；幸福不是发生在过去的某个瞬间，也不是未来的某个阶段，而是此时此刻的感受和体验</p><p>工作上也是如此，不存在做了某个业务，从此就顺风顺水了；不存在解决了某个问题，业务就能好起来了。难做从来就是常态，问题会无休止地涌向；我们要做的不是想着等我解决这个问题，业务就好起来了，就能一劳永逸了，而是想着我要一边处理问题过程中，一边完成自我的成长与业务的增长（当然，前提是业务真的有价值，你真的能从中成长）</p><ul><li><strong>平静是意识到世界并非我们想象的那样</strong></li></ul><p>世界其实跟我们想象的很不一样，无论是前面的《理性乐观派》还是《<span class="exturl" data-url="aHR0cHM6Ly9ib29rLmRvdWJhbi5jb20vc3ViamVjdC8zMzM4NTQwMi8=">事实<i class="fa fa-external-link-alt"></i></span>》，这两本书都在用真实的数字告诉我们，个人的想象与事实之间的gap 有多大</p><p>我们都是在一个很小的局部，在盲人观象；通过自己的经验和感受，对一个非常复杂的世界作出预测；还是前面那句话：我们只经历了这个世界的0.00000001%，却希望用它去解释这个世界的 80%；降低自己的ego，不忘初心</p><ul><li><strong>欢迎来到荷兰</strong></li></ul><p>面对当前的困难，人很容易有这样的错觉：如果我不是现在这样...，就能... 了；这种简答的因果线性思维，跟前面谈到的 “没有什么能把我们的人生分成两段” 一样，是极其浮于表面与不合理的。</p><p>生活充满了随机性，我们很多时候的困难与痛苦来自这些随机性，但生活的美妙也是来自这些随机性</p><p>面对随机性，无论是 <a href="https://wulc.me/2023/02/05/%E5%81%9A%E4%B8%80%E4%B8%AA%E6%B8%85%E9%86%92%E7%9A%84%E5%82%BB%E7%93%9C/#%E6%88%91%E4%BB%AC%E9%83%BD%E6%98%AF%E9%9A%8F%E6%9C%BA%E6%BC%AB%E6%AD%A5%E7%9A%84%E5%82%BB%E7%93%9C">做一个清醒的傻瓜</a> ,还是<a href="https://wulc.me/2022/07/31/%E4%BB%8E%E7%84%A6%E8%99%91%E8%B0%88%E8%B5%B7%EF%BC%8C%E8%81%8A%E8%81%8A%E7%94%9F%E6%B4%BB%E7%9A%84%E5%8F%AF%E8%83%BD%E6%80%A7%E4%B8%8E%E9%9A%8F%E6%9C%BA%E6%80%A7/#%E6%8E%A5%E5%8F%97%E7%84%A6%E8%99%91%E4%BA%AB%E5%8F%97%E9%9A%8F%E6%9C%BA%E6%80%A7">从焦虑谈起，聊聊生活的可能性与随机性</a>，都在尝试告诉我们随机性是无法避免的，与其焦虑或恐惧，还不如直面这些不确定性，过好当下的日子，对自己说一句：<span class="exturl" data-url="aHR0cHM6Ly96aHVhbmxhbi56aGlodS5jb20vcC80MzUxNjAwODg=">欢迎来到荷兰<i class="fa fa-external-link-alt"></i></span></p><h2 id="小结">小结</h2><p>不知不觉就过去了几个月，这几个月里也经历了不少变动，接手了一个有争议的业务，在充满争议和 “矛盾” 的定位反复讨论与拉扯，虽然有点耗心力，但对业务也有了进一步的认知，也能逐步理解那些看似矛盾的定位，实际上更多是对业务发展阶段的判断不同；在负责了团队组建的工作后，也更能理解了组织为业务发展这一理念，一个组织从小到大的发展过程中遇到的种种问题，以及为了缓解当前问题提出的解决方案，如何催生出了下一个问题</p><p>问题是无休止了，我们能调控的更多是自己的心态与做事情的态度，因为 “我们都能看到外部，但是一切发生在内部”，而 “一个人最大的自由，是选择怎样回应事情”；心态会极大地影响我们的动作，难从来都是常态，做个理性乐观派，尝试把那些在眼前看着非常大的 “大拇指” 从眼前移开一臂的距离，我们会发现这些难点只是在眼前被放大了，世界并非我们想象的那样，即使我们原定在意大利的航班落在了荷兰，也一样能够感受荷兰此刻的迷人之处～</p>]]></content>
    
    
    <summary type="html">&lt;p&gt;最近半年经历了一些业务与组织上的变化，对于这部分也有了一些新的理解和体会，值得写一篇文章来梳理与总结。本文主要讲了对业务和组织的一些看法，包括如何看待 “矛盾” 的业务定位和观点、组织的进化过程、团队组建里的识人与用人等；以及在这个过程中，该如何调整自己的心态。文章比较发散，纯属个人碎碎念，祝开卷有益&lt;/p&gt;</summary>
    
    
    
    <category term="闲话几句" scheme="https://wulc.me/categories/%E9%97%B2%E8%AF%9D%E5%87%A0%E5%8F%A5/"/>
    
    
    <category term="闲话几句" scheme="https://wulc.me/tags/%E9%97%B2%E8%AF%9D%E5%87%A0%E5%8F%A5/"/>
    
    <category term="管理" scheme="https://wulc.me/tags/%E7%AE%A1%E7%90%86/"/>
    
  </entry>
  
  <entry>
    <title>Quantitative Trading:How to Build Your Own Algorithmic Trading Business(2)</title>
    <link href="https://wulc.me/2023/10/02/Quantitative%20Trading:%20How%20to%20Build%20Your%20Own%20Algorithmic%20Trading%20Business(2)/"/>
    <id>https://wulc.me/2023/10/02/Quantitative%20Trading:%20How%20to%20Build%20Your%20Own%20Algorithmic%20Trading%20Business(2)/</id>
    <published>2023-10-02T13:53:19.000Z</published>
    <updated>2026-02-28T05:01:22.794Z</updated>
    
    <content type="html"><![CDATA[<p>"<span class="exturl" data-url="aHR0cHM6Ly93d3cubXlxdWFudC5jbi91cGxvYWRzL2RlZmF1bHQvb3JpZ2luYWwvMVgvNGM3MDM3MzY1YTRiZjE2MjM3MzRjMWM4OTliYWVkNzg1NTA2MWFjZS5wZGY=">QuantitativeTrading: How to Build Your Own Algorithmic Trading Business<i class="fa fa-external-link-alt"></i></span>" byErnie Chan is a comprehensive guide that explores the world ofquantitative trading and provides practical advice for building aalgorithmic trading business, especially for individuals interested inquantitative trading.</p><p>It covers essential concepts, methodologies, and practical tips tohelp readers develop and implement their own algorithmic tradingstrategies while effectively managing risk and building a sustainabletrading business.</p><p>Due to the significant benefits I received from reading this book, Iwant to write down some of the most important takeways I get from thisbook, with the hope that it can also be useful to you.</p><p>This passage is about the last four chapters, which introducesexecution system in actual trading(automated and semi-automated), how tominimize transaction cost and determine the optimal leverage using theKelly Criterion. It also talks about some special topics or common sensein trading. Finally, it lists some advantages of individuals investorsover institutional investors.</p><span id="more"></span><h1 id="execution-systems">Execution Systems</h1><p>This chapter is about building an automated trading system and waysto minimize trading costs and divergence with your expected performancebased on your backtests.</p><h2 id="automated-trading-system">Automated Trading System</h2><p>An automated trading system is a piece of software that automaticallygenerates and transmits orders to your brokerage account based on yourtrading strategy.</p><ul><li>It eliminates manual operation so that you can simultaneously runmultiple strategies.<br></li><li>Most importantly, it allows speedy transmissions of orders,which isessential to high-frequency trading strategies.</li></ul><p>There are two kinds of trading systems: fully automated andsemiautomated, and the choice depends on the frequency of yourtrading.</p><h3 id="fully-automated-trading-system">Fully Automated TradingSystem</h3><p>A fully automated trading system can run the trading algorithm in aloop again and again, constantly scanning the latest prices andgenerating new waves of orders throughout the trading day. Thesubmission of orders through an API to your brokerage account isautomatic, so you would not need to load the trades to a basket traderor spread trader</p><p>A fully automated system has the advantage that it minimizes humanerrors and delays. For certain high-frequency systems, a fully automatedsystem is indispensable, because any human intervention will causeenough delay to seriously derail the performance.</p><p>However, a fully automated system is also complicated and costly tobuild, often requiring professional programmers with knowledge ofhigh-performance programming languages such as Java, C, or C++ in orderto connect to your brokerage’s application program- ming interface(API).</p><h3 id="semiautomated-trading-system">Semiautomated Trading System</h3><p>In a semiautomated trading system, the trader still needs to manuallyupload a text file containing order details to a basket trader or spreadtrader, and manually press a button to transmit the orders at theappropriate time. However, the order text file can be automaticallygenerated by a program such as Python.</p><p>Whether you have built a semiautomated or a fully automated tradingsystem, there is often a need for input data beyond the prices that yourbrokerage or data vendor can readily provide you. For example,<strong>earnings estimates or dividends data</strong> are often notprovided as part of the real-time data stream.</p><p>These non-price data are typically available free of charge from manyweb sites, but are usually embedded in an HTML format and not readilyusable. Hence, an automated system also must be able to retrieve suchweb pages, parse them, and reformat them into a tabular format that yourtrading strategy can utilize</p><h2 id="minimizing-transaction-costs">Minimizing Transaction Costs</h2><p>In the previous chapter, we had talked about how to reducetransaction costs. Besides changing your brokerage or proprietarytrading firm to one that charges a lower commission, there are a fewthings you can do in your execution method to minimize the transactioncosts.</p><p>And the book regards this mainly as a matter of <strong>not allowingyour order size to be too big relative to its average trading volume andrelative to its market capitalization</strong></p><h3 id="cut-down-on-commissions">Cut Down on Commissions</h3><p>You should <strong>refrain from trading lowprice stocks</strong>.Typically, institutional traders do not trade any stocks with priceslower than $5</p><p>Because low-price stocks increase your total commissions costs (sinceyou need to buy or sell more shares for a fixed amount ofcapital)（Why？？）</p><p>Also it has a wider <strong>bid-ask spread</strong> and thereforeincrease your total liquidity costs</p><p>The definition of bid-ask spread from ChatGPT is as follow</p><blockquote><p>The bid-ask spread is a concept used in financial markets,particularly in securities trading such as stocks, bonds, commodities,and foreign exchange. It refers to the difference between the highestprice a buyer is willing to pay (the bid price) and the lowest price aseller is willing to accept (the ask price) for a particular asset orsecurity.</p><p><strong>A wider spread can indicate lower liquidity or highertransaction costs</strong>. Market conditions, supply and demanddynamics, trading volume, and the nature of the asset being traded canall influence the bid-ask spread.</p></blockquote><h3 id="minimize-market-impact-cost">Minimize Market Impact Cost</h3><p>We should limit the size (number of shares) of your orders based onthe liquidity of the stock, on which we can do two things:</p><ul><li>limit the size of order according to the certain measurement(likeaverage daily volume)<br></li><li>allocate assets effectively between large-cap and small-capstocks</li></ul><p>One common measure of liquidity is the average daily volume (it isyour choice what lookback period you want to average over). <strong>As arule of thumb, each order should not exceed 1 percent of the averagedaily volume</strong>. As an independent trader, you may think that itis not easy to reach this 1 percent threshold, and you would be rightwhen the stock in question is a large-cap stock belonging to the S&amp;P500. However, you may be <strong>surprised by the low liquidity of somesmall-cap stocks out there</strong></p><p>Another way to reduce market impact is to scale the size of yourorders based on the market capitalization of a stock.</p><p>A linear scale (i.e., scaling the capital of a stock to be linearlyproportional to its market capitalization) would <strong>result inpractically zero weights for most small- and micro- cap stocks in yourportfolio, and this will take away any benefits ofdiversification</strong></p><p>If we were to use linear scale, the capital weight of the largestlarge-cap stock will be about 10,000 of the smallest small-cap stock. Toreap the benefits of diversification, <strong>we should not allow thatratio to be more than 10 or so</strong>, provided that the liquidity(volume) constraint described above is also satisfied.</p><h3 id="slippage">Slippage</h3><p>Many institutional traders who desire to execute a large order willbreak it down into many smaller orders and execute them over time. Thismethod of trading will certainly reduce market impact; however, itengenders another kind of transactions costs, namely, slippage，</p><p>Reducing market impact in this way may increase slippage, <strong>itis not really suitable for retail traders whose order size is usuallynot big enough to require this remedy</strong></p><p>Slippage is usually outside of your control, perhaps your brokerage’sexecution speed is simply too slow, due to either software issues (theirsoftware processes your orders too slowly), risk control issues (yourorder has to be checked against your account’s buying power and passvarious risk control criteria before it can be routed to the exchange),or pipeline issues (the brokerage’s speed of access to the exchanges).Or perhaps your brokerage does not have access to deep enough“dark-pool” liquidity. These execution costs and issues should affectyour choice of brokerages</p><h2 id="paper-trading">Paper Trading</h2><p>Paper trading refers to the practice of simulating trades in arisk-free environment using virtual money instead of real capital.</p><p>When performing paper trading, there are several key aspects to payattention to in order to make the experience as valuable and realisticas possible</p><p>You should be able run your ATS, execute paper trades, and then<strong>compare the paper trades and profit and loss (P&amp;L) with thetheoretical ones generated by your backtest program</strong> using thelatest data. If the difference is not due to transaction costs(including an expected delay in execution for the paper trades), thenyour software likely has bugs.</p><p>It gives you better <strong>intuitive understanding of yourstrategy</strong>, including the volatility of its P&amp;L, the typicalamount of capital utilized, the number of trades per day, and thevarious operational difficulties including data issues.</p><p>There are some common problems in paper trading, some of them arelisted in the following</p><p>The moment you start paper trading you will realize that there is aglaring look-ahead bias in your strategy—there may just be no way youcould have obtained some crucial piece of data before you enter anorder</p><p>If you are able to run a paper trading system for a month or longer,you may even be able to discover data-snooping bias, since paper tradingis a true out-of-sample test.</p><p>Backtesting also won’t reveal the operational difficulties, such ashow fast you can download all the needed data before the market openseach day and how you can optimize your operational procedures in actualexecution, but paper trading will make you feel all these.</p><p>In summary, paper trading allows you to:</p><ul><li>Discover software bugs in your trading strategy and executionprograms.<br></li><li>Discover look-ahead or even data-snooping bias.<br></li><li>Discover operating difficulties and plan for operatingschedules.<br></li><li>Estimate transaction costs more realistically.<br></li><li>Gain important intuition about P&amp;L volatility, capital usage,portfolio size, and trade frequency.</li></ul><h2 id="actual-performance-v.s-expectations">Actual Performance V.SExpectations</h2><p>What do you do in the situation when your live trading underperformsyour backtest?</p><p>The list of what possibly may have caused this divergence fromexpectation is as follows</p><ul><li>Do you have bugs in your ATS software?<br></li><li>Do the trades generated by your ATS match the ones generatedby yourbacktest program?<br></li><li>Are the execution costs much higher than what you expected?<br></li><li>Are you trading illiquid stocks that caused a lot of marketimpact?</li></ul><p>You can start by addressing the usual problems: Eliminate bugs in thestrategy or execution software; reduce transaction costs; and simplifythe strategy by eliminating parameters. But, fundamentally, yourstrategy still may have suffered<br>from <strong>data-snooping bias or regime shift</strong>.</p><ul><li>data-snooping bias</li></ul><p>You can verify this cause by trying to eliminate as many rules and asmany parameters in your strategy as possible. If the backtestperformance completely fell apart after this exercise, chances are youdo have this bias and it is time to look for a new strategy.</p><ul><li>regime shifts</li></ul><p>When the financial market structure or the macroeconomic environmentundergoes a drastic change so much so that trading strategies that wereprofitable before may not be profitable</p><p>One regime shift is relevant if your strategy <strong>shortsstocks</strong>.</p><p>Many stocks, especially the small-cap ones or the ones with lowliquidity, are “hard to borrow.” For you to be able to short a stock,your broker has to be able to borrow it from someone else (usually alarge mutual fund or other brokerage clients) and lend it to you forselling.</p><p>If no one is able or willing to lend you their stock, it is deemedhard to borrow and you would not be able to short it. Hence, again, avery profitable historical short position may not actually have beenpossible due to the difficulty of borrowing the stock.</p><h1 id="money-and-risk-management">Money and Risk Management</h1><h2 id="kelly-criterion">Kelly Criterion</h2><p>This chapter provides an important tool for risk management: thedetermination of <strong>the optimal leverage using the KellyCriterion</strong>.</p><p>It also determines the optimal allocation of capital among differentstrategies, based on the covariance of their returns.</p><p>The general form of the <span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvS2VsbHlfY3JpdGVyaW9uI0ludmVzdG1lbnRfZm9ybXVsYQ==">KellyCriterion<i class="fa fa-external-link-alt"></i></span> is as follows:</p><p><span class="math display">\[\begin{align} f^{*} = \frac{p}{a} -\frac{q}{b} \end{align}\]</span></p><p>where</p><ul><li><span class="math inline">\(f^{*}\)</span> is the fraction of theassets to apply to the security.<br></li><li><span class="math inline">\(p\)</span> is the probability that theinvestment <strong>increases</strong> in value.<br></li><li><span class="math inline">\(q\)</span> is the probability that theinvestment <strong>decreases</strong> in value(<span class="math inline">\(q=1-p\)</span>)<br></li><li><span class="math inline">\(a\)</span> is the fraction that is<strong>lost</strong> in a negative outcome. If the security price falls10%, then <span class="math inline">\(a=0.1\)</span><br></li><li><span class="math inline">\(b\)</span> is is the fraction that is<strong>gained</strong> in a positive outcome. If the security pricerises 10%, then <span class="math inline">\(b=0.1\)</span></li></ul><p>In an intuitive understanding of the Kelly Criterion, it involvestaking the probability of winning divided by the multiple of the wageredcapital when you lose (typically 1 in the case of gambling), and thensubtracting the probability of losing divided by the multiple of thecapital gained when you win.</p><p>Since this formula can result in Kelly fractions <strong>higher than1</strong>. In this case, it is theoretically advantageous to use<strong>leverage</strong> to purchase additional securities onmargin.</p><p>The proof of Kelly Formula is also easy to understand, the details inwiki is as follows</p><p><img data-src="https://wulc.me/imgs/Kelly_criterion_proof.jpg" height="60%" width="60%" alt="Proof of Kelly Criterion"></p><p><strong>But it's important to note that the Kelly Criterion is notsuitable for all situations. It assumes that you know the odds orreturns and expected probabilities</strong>, while ignoring marketuncertainties and other factors. Therefore, in practical applications,the Kelly Criterion is often combined with real-world considerations andrisk tolerance to formulate more reasonable and feasible moneymanagement strategies.</p><p>Also, the Kelly criterion is valid only for known outcomeprobabilities, which is not the case with investments. <span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvUmlza19hdmVyc2lvbg==">Risk averse<i class="fa fa-external-link-alt"></i></span>investors should not invest the full Kelly fraction.</p><h2 id="mind-set">Mind-Set</h2><p>The ultimate risk management mind-set is very simple: Do not succumbto either despair or greed. To gain practice in this psychologicaldiscipline, one must <strong>proceed slowly with small positionsize</strong>, and thoroughly test various aspects of the tradingbusiness (model, software, operational procedure, money and riskmanagement) before scaling up according to the Kelly formula.</p><p>In order to proceed slowly and cautiously, it is helpful to haveother sources of income or other businesses to help sustain yourselfeither financially or emotionally (to avoid the boredom associated withslow progress). It is indeed possible that finding a diversion, whetherincome producing or not, may actually help improve the long-term growthof your wealth.</p><h1 id="special-topics">Special topics</h1><p>The special topics in this book includes</p><ul><li>mean reversion and momentum<br></li><li>regime switching<br></li><li>stationarity and cointegration<br></li><li>factor model<br></li><li>seasonal trading models<br></li><li>high-frequency trading.</li></ul><h2 id="mean-reversion-and-momentum">Mean Reversion and Momentum</h2><p>Trading strategies can be profitable only if securities prices areeither mean-reverting or trending. Otherwise, they are random-walking,and trading will be futile.</p><p>At any given time, stock prices can be both mean reverting andtrending depending on the time horizon you are interested in.<strong>Constructing a trading strategy is essentially a matter ofdetermining if the prices under certain conditions and for a certaintime horizon will be mean reverting or trending</strong>, and what theinitial reference price should be at any given time.(When the prices aretrending, they are also said to have “momentum,” and thus thecorresponding trading strategy is often called a momentum strategy.)</p><p>There are multiple reasons for momentum, slow diffusion ofinformation, private liquidity needs and herdlike behavior</p><ul><li>slow diffusion of information</li></ul><p>Momentum can be generated by the slow diffusion of information—asmore people become aware of certain news, more people decide to buy orsell a stock, thereby driving the price in the same direction.</p><p>Stock prices may exhibit momentum when the expected earnings havechanged. This can happen when a company announces its quarterlyearnings, and investors either gradually become aware of thisannouncement or they react to this change by incrementally executing alarge order .</p><ul><li>private liquidity needs</li></ul><p>Besides the slow diffusion of information, momentum can be caused bythe incremental execution of a large order due to the liquidity needs orprivate investment decisions of a large investor.</p><p>With the advent of increasingly sophisticated execution algorithmsadopted by the large brokerages, it is, however, increasingly difficultto ascertain whether a large order is behind the observed momentum.</p><ul><li>herdlike behavior</li></ul><p>Momentum can also be generated by the herdlike behavior of investors:investors interpret the (possibly random and meaningless) buying orselling decisions of others as the sole justifications of their owntrading decisions.</p><p>But momentum regimes generated by private liquidity needs andherdlike behavior have highly unpredictable time horizons.</p><p>The most important things we need to pay attention to may be theeffects of increasing competition from traders with the samestrategies</p><ul><li><p><strong>For mean-reverting strategies, the effect typically isthe gradual elimination of any arbitrage opportunity, and thus graduallydiminishing returns down to zero</strong>. When the number of arbitrageopportunities has been reduced to almost zero, the mean-revertingstrategy is subject to the risk that an increasing percentage of tradingsignals are actually due to fundamental changes in stocks’ valuation andthus is not going to mean revert.</p></li><li><p><strong>For momentum strategies, the effect of competition isoften the diminishing of the time horizon over which the trend willcontinue.</strong> As news disseminates at a faster rate and as moretraders take advantage of this trend earlier on, the equilibrium pricewill be reached sooner. Any trade entered after this equilibrium priceis reached will be unprofitable.</p></li></ul><h2 id="regime-switching">Regime Switching</h2><p>The desire to predict regime switches, which are also commonly knownas turning points, is also as old as financial markets themselves</p><p>Academic attempts to model regime switches in stock prices generallyproceed along these lines（Markov regime switching or hidden Markovmodels）</p><ol type="1"><li><p><strong>Propose that the two (or more) regimes are characterizedby different probability distributions of the prices.</strong> In thesimplest cases, the log of the prices of both regimes may be representedby normal distributions, except that they have different means and/orstandard deviations.</p></li><li><p>Assume that there is some kind of <strong>transitionprobability</strong> among the regimes.</p></li><li><p><strong>Determine the exact parameters that specify the regimeprobability distributions and the transition probabilities by fittingthe model to past prices</strong>, using standard statistical methodssuch as maximum likelihood estimation.</p></li><li><p>Based on the fitted model above, find out the expected regime ofthe next time step and, more importantly, the expected stockprice.</p></li></ol><p>The method above assumes constant transition probabilities amongregimes at all times. In practice, this means that at any time, there isalways a very small probability for the stock to transition from anormal, quiescent regime to a volatile regime. But <strong>this isuseless to traders who want to know when—and under what preciseconditions—the transition probability will suddenly peak</strong>. Thisquestion is tackled by the turning points models.</p><h2 id="stationarity-and-cointegration">Stationarity ANDCointegration</h2><p>A time series is “stationary” if it never drifts farther and fartheraway from its initial value. In technical terms, stationary time seriesare “integrated of order zero"</p><p>It is obvious that <strong>if the price series of a security isstationary, it would be a great candidate for a mean-reversion strategy.Unfortunately, most stock price series are not stationary—they exhibit ageometric random walk that gets them farther and farther away from theirstarting</strong></p><p>If you find** a pair of stocks such that if you long one and shortthe other, the market value of the pair is stationary.** If this is thecase, then the two individual time series are said to be cointegrated.because a linear combination of them is integrated of order zero.</p><p>Usually, two stocks that form a cointegrating pair are from the sameindustry group. Traders have long been familiar with this so-called<strong>pair-trading strategy.</strong> They buy the pair portfolio whenthe spread of the stock prices formed by these pairs is low, andsell/short the pair when the spread is high—in other words, a classicmean-reverting strategy</p><p>If a price series (of a stock, a pair of stocks, or, in general, aportfolio of stocks) is stationary, then a mean-reverting strategy isguaranteed to be profitable, as long as the stationarity persists intothe future (which is by no means guaranteed).</p><p>However, the converse is not true. You don’t necessarily need astationary price series in order to have a successful mean-revertingstrategy. Even <strong>a nonstationary price series can have manyshort-term reversal opportunities that one can exploit</strong>, as manytraders have discovered.</p><h2 id="factor-models">Factor Models</h2><p>Assume excess returns <span class="math inline">\(R\)</span> can beobtained in the formula</p><p><span class="math display">\[\begin{align} R = Xb+u\end{align}\]</span></p><p>There are multiple components in the formula</p><ul><li><p><strong>Factor returns</strong>, <span class="math inline">\(X\)</span> are the common drivers of stockreturns, and are therefore independent of a particular stock.</p></li><li><p><strong>Factor exposures</strong>, <span class="math inline">\(b\)</span> are the sensitivities to each of thesecommon drivers.</p></li><li><p><strong>Specific return</strong>, <span class="math inline">\(u\)</span>, any part of a stock’s return thatcannot be explained by these common factor returns is deemed a specificreturn (i.e., specific to a stock and essentially regarded as justrandom noise within the APT framework). Each stock’s specific return isassumed to be uncorrelated to another stock’s.</p></li></ul><p>A famous factor model is <strong>Three-Factor model</strong>, that isexcess return of a stock depends linearly on only three factorexposures: <strong>beta, market capitalization and book-to-priceratio</strong></p><p>These factor exposures are obviously different for each stock and foreach time period. (Factor exposures are often normalized such that theaverage of the factor exposures within a universe of stocks is zero, andthe standard deviation is 1.)</p><p>What about the factor returns and specific returns? We cannotdirectly compute the factor returns and specific returns—we have toinfer their values by running a multivariate linear regression of theexcess returns of stocks against the factor exposures.</p><p>Note that each stock represents one data point in this linearregression, and we have to either run a separate linear regression foreach time period or, if we want an average value over many time periods,aggregate the values from all these time periods into one training setand run one regression against them all.</p><p>But the limitation of factor models are also obvious, one can make ageneral observation that <strong>factor models that are dominated byfundamental and macroeconomic factors have one major drawback—theydepend on the fact that investors persist in using the same metric tovalue companies</strong></p><p>For example, even though the value (book-to-price ratio) factorreturns are usually positive, there are periods of time when investorsprefer growth stocks such as during the Internet bubble in the late1990s</p><p>Therefore, it is not uncommon for factor models to <strong>experiencesteep drawdown during the times when investors’ valuation methodshifts</strong>, even if only for a short duration. But then, thisproblem is common to practically any trading model that holds stocksovernight.</p><h2 id="exit-strategy">Exit Strategy</h2><p>There isn’t usually much variety in the way exit signals aregenerated. They are based on one of these</p><ul><li>A fixed holding period<br></li><li>A target price or profit cap<br></li><li>The latest entry signals<br></li><li>A stop price</li></ul><p><strong>Fixed Holding Period</strong></p><p>For momentum model, the optimal period typically decreases due to theincreasing speed of the diffusion of information and the increasingnumber of traders who catch on to this trading opportunity. Hence<strong>a momentum model that has worked well with a holding periodequal to a week in the backtest period may work only with a one-dayholding period now</strong></p><p>For mean-reverting model, there is a more statistically robust way todetermine the optimal holding period that does not depend on the limitednumber of actual trades, that is <span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvT3Juc3RlaW4lRTIlODAlOTNVaGxlbmJlY2tfcHJvY2Vzcw==">Ornstein-Uhlenbeckformula<i class="fa fa-external-link-alt"></i></span>, which describes the behavior of a continuous-timestochastic (random) process</p><p>The Ornstein-Uhlenbeck process is a stationary Gaussian process thatexhibits mean-reverting behavior. In simpler terms, it models a systemthat tends to return to a central equilibrium or mean value over time,similar to a particle undergoing Brownian motion but with a restoringforce pulling it back towards a mean position.</p><p>The definition of the Ornstein-Uhlenbeck</p><p><img data-src="https://wulc.me/imgs/Ornstein_Uhlenbeck_process.jpg" height="60%" width="60%" alt="Ornstein–Uhlenbeck process"></p><p>Mathematicians tell us that the average value of <span class="math inline">\(X(t)\)</span> follows an exponential decay to itsmean <span class="math inline">\(\mu\)</span>, and the half-life of thisexponential decay is equal to <span class="math inline">\(ln(2)/θ\)</span></p><p><strong>Target Price</strong></p><p>If you believe that your security is mean reverting, then you alsohave a ready-made target price—the mean value of the historical pricesof the security, or <span class="math inline">\(\mu\)</span> in theOrnstein-Uhlenbeck formula.</p><p>But target prices are not as easily justified in momentum models asin mean-reverting models.</p><p><strong>Latest entry signals</strong></p><p>Suppose you are running a trading model, and you entered into aposition based on its signal. Some time later, you run this model again.If you find that the sign of this latest signal is opposite to youroriginal position (e.g., the latest signal is “buy” when you have anexisting short position), then you have two choices. Either you simplyuse the latest signal to exit the existing position and become flat oryou can exit the existing position and then enter into an oppositeposition</p><h2 id="seasonal-trading">Seasonal Trading</h2><p>These strategies recommend that you buy or sell certain securities ata fixed date of every year</p><p>However, from my own experience, much of the seasonality in equitymarkets has weakened or even disappeared in recent years, perhaps due tothe wide spread knowledge of this trading opportunity, whereas someseasonal trades in commodity futures are still profitable</p><p>The most famous seasonal trade in equities is called the<strong>January effect</strong>.</p><p>One version states that small-cap stocks that had the worst returnsin the previous calendar year will have higher returns in January thansmall-cap stocks that had the best returns. The rationale for this isthat investors like to sell their losers in December to benefit from taxlosses, which creates additional downward pressure on their prices.</p><h2 id="high-frequency-trading">High-Frequency Trading</h2><p>In general, if a high Sharpe ratio is the goal of your tradingstrategy (as it should be), then you should be trading at highfrequencies, rather than holding stocks overnight.</p><p>The reason why these strategies have Sharpe ratio is simple: Based onthe “law of large numbers,” the more bets you can place, the smaller thepercent deviation from the mean return you will experience. Withhigh-frequency trading, one can potentially place hundreds if notthousands of bets all in one day.</p><p>Therefore, <strong>provided the strategy is sound and generatespositive mean return</strong>, you can expect the day-to-day deviationfrom this return to be minimal. With this high Sharpe ratio, one canincrease the leverage to a much higher level than longer-term strategiescan</p><p>But no strategy can actually guarantee positive mean return, besides,high-frequency trading also requires harder backtesting and morepowerful infrastructure</p><p>Though successful high-frequency strategies have such numerousmerits, it is not easy to backtest such strategies when the averageholding period decreases to minutes or even seconds. Just havinghigh-frequency data with last prices is not sufficient—data with bid,ask, and last quotes is needed to find out the profitability ofexecuting on the bid versus the ask</p><p>High-speed execution may account for a large part of the actualprofits or losses. Professional high-frequency trading firms have beenwriting their strategies in C instead of other, more user-friendlylanguages, and locating their servers next to the exchange or a ma- jorInternet backbone to reduce the microsecond delays.</p><p><strong>Even though the Sharpe ratio is appealing and the returnsastronomical, truly high-frequency trading is not by any means easy foran independent trader to achieve in the beginning. But there is noreason not to work toward this goal gradually as expertise and resourcesaccrue</strong></p><h1 id="can-independent-traders-succeed">Can Independent TradersSucceed?</h1><p>This section primarily outlines some advantages that individualinvestors have in quantitative trading compared to institutionalinvestors.</p><h2 id="capacity">capacity</h2><p>A significant difference between individual and institutional quanttrading lies in the size of capital (capacity).</p><p>The book states that it is far, far easier to generate a high Sharperatio trading a 100,000 account than a 100 million account</p><p>Different capital sizes lead to different strategies, and it'sgenerally easier to profit in small-scale quant trading compared tomanaging large amounts of capital. <strong>And there are many simple andprofitable strategies that can work at the low capacity end that wouldbe totally unsuitable to hedge funds</strong>.</p><p>More details about this can be obtained from this question on <span class="exturl" data-url="aHR0cHM6Ly93d3cuemhpaHUuY29tL3F1ZXN0aW9uLzQyNjQ2ODk4My9hbnN3ZXIvMTUzNTI3NDUyMw==">zhihu<i class="fa fa-external-link-alt"></i></span></p><p>The specific reason for such phenomenon, as explained in the book,starts with liquidity: <strong>small capital provides liquidity, whilelarge capital demands liquidity</strong>.</p><blockquote><p>Most profitable strategies that have low capacities are acting asmarket makers: <strong>providing short-term liquidity when it is neededand taking quick profits when the liquidity needdisappears</strong>.</p><p>However, you have billions of dollars to manage, you now<strong>become the party in need of liquidity, and you have to pay forit</strong>. To minimize the cost of this liquidity demand, younecessarily have to hold your positions over long periods of time. Whenyou hold for long periods, your portfolio will be subject tomacroeconomic changes (i.e., regime shifts) that can cause great damageto your portfolio.</p></blockquote><p>Another issue with large-scale funds is that they engage incompetition with different hedge funds, <strong>ultimately resulting insimilar holdings and similar returns</strong></p><p>The intense competition among hedge funds means the strategies becomeless profitable. The lowered returns in turn pressure the fund managerto overleverage.</p><p>The fundamental market inefficiency that they are trying to exploitmay remain the same, and thus their portfolios may still end up holdingvery similar positions. When market environment changes, a stampede outof similar losing positions can (and did) cause a complete meltdown ofthe market.</p><h2 id="constraints">constraints</h2><p>Another difference between individual and institutional quant tradingis the constraints during trading.</p><p>For example, as a trader in a quantitative fund, you may beprohibited from trading a long-only strategy, but long-only strategiesare often easier to find, simpler, more profitable, and if traded insmall sizes, no more risky than market-neutral strategies. Or you may beprohibited from trading futures. You may be required to be not onlymarket neutral but also sector neutral. You may be asked to find amomentum strategy when you know that a mean-reverting strategy wouldwork.And on and on. Many of these constraints are imposed for riskmanagement reasons, but many others may be just whims, quirks, andprejudices of the management.</p><p>When your strategy shows initial profits, these managers may imposeenormous pressure for you to scale up quickly, and when your strategystarts to lose, they may force you to liquidate the portfolios andabandon the strategy immediately.</p><p>As every student of mathematical optimization knows, any constraintimposed on an optimization problem decreases the optimal objectivevalue. Similarly, every institutional constraint imposed on a tradingstrategy tends to decrease its returns</p><h1 id="summary">Summary</h1><p>This passage firstly introduces two kinds of execution system,automated and semi-automated, and the choice depends on the frequency ofyour trading. But no matter which one to choose, minimizing transactioncost is very necessary, we should cut down on commissions, minimizemarket impact cost and try to avoid slippage as much as possible.</p><p>In actual trading, risk management is very necessary. One importantpoint is to determine the optimal leverage using the Kelly Criterion.Andthe mind-set is also very important, do not succumb to either despair orgreed, proceed slowly with small position size, and thoroughly testvarious aspects of the trading business.</p><p>It also talks about some special topics or common sense in trading,including mean reversion strategy and momentum startegy, regimeswitching, stationarity and cointegration, factor model, seasonaltrading models, high-frequency trading. These can be also regarded ascommon sense in quantative trading</p><p>Finally, it lists some advantages of individual investors overinstitutional investors, capacity and constraints. Individual investorscan use many more strategies than institutional investors with smallercapacity, and also face fewer constraints.</p><p>Once you have automated everything and your equity is growingexponentially, can you just sit back, relax, and enjoy your wealth?Unfortunately, <strong>experience tells us that strategies do lose theirpotency over time as more traders catch on to them. It takes ongoingresearch to supply you with new strategies.</strong> So keep studyingand thinking, this will be an endless game.</p>]]></content>
    
    
    <summary type="html">&lt;p&gt;&quot;&lt;span class=&quot;exturl&quot; data-url=&quot;aHR0cHM6Ly93d3cubXlxdWFudC5jbi91cGxvYWRzL2RlZmF1bHQvb3JpZ2luYWwvMVgvNGM3MDM3MzY1YTRiZjE2MjM3MzRjMWM4OTliYWVkNzg1NTA2MWFjZS5wZGY=&quot;&gt;Quantitative
Trading: How to Build Your Own Algorithmic Trading Business&lt;i class=&quot;fa fa-external-link-alt&quot;&gt;&lt;/i&gt;&lt;/span&gt;&quot; by
Ernie Chan is a comprehensive guide that explores the world of
quantitative trading and provides practical advice for building a
algorithmic trading business, especially for individuals interested in
quantitative trading.&lt;/p&gt;
&lt;p&gt;It covers essential concepts, methodologies, and practical tips to
help readers develop and implement their own algorithmic trading
strategies while effectively managing risk and building a sustainable
trading business.&lt;/p&gt;
&lt;p&gt;Due to the significant benefits I received from reading this book, I
want to write down some of the most important takeways I get from this
book, with the hope that it can also be useful to you.&lt;/p&gt;
&lt;p&gt;This passage is about the last four chapters, which introduces
execution system in actual trading(automated and semi-automated), how to
minimize transaction cost and determine the optimal leverage using the
Kelly Criterion. It also talks about some special topics or common sense
in trading. Finally, it lists some advantages of individuals investors
over institutional investors.&lt;/p&gt;</summary>
    
    
    
    <category term="读书" scheme="https://wulc.me/categories/%E8%AF%BB%E4%B9%A6/"/>
    
    
    <category term="读书" scheme="https://wulc.me/tags/%E8%AF%BB%E4%B9%A6/"/>
    
    <category term="量化交易" scheme="https://wulc.me/tags/%E9%87%8F%E5%8C%96%E4%BA%A4%E6%98%93/"/>
    
  </entry>
  
  <entry>
    <title>Quantitative Trading:How to Build Your Own Algorithmic Trading Business(1)</title>
    <link href="https://wulc.me/2023/07/30/Quantitative%20Trading:%20How%20to%20Build%20Your%20Own%20Algorithmic%20Trading%20Business(1)/"/>
    <id>https://wulc.me/2023/07/30/Quantitative%20Trading:%20How%20to%20Build%20Your%20Own%20Algorithmic%20Trading%20Business(1)/</id>
    <published>2023-07-30T13:53:19.000Z</published>
    <updated>2026-02-28T05:01:22.769Z</updated>
    
    <content type="html"><![CDATA[<p>"<span class="exturl" data-url="aHR0cHM6Ly93d3cubXlxdWFudC5jbi91cGxvYWRzL2RlZmF1bHQvb3JpZ2luYWwvMVgvNGM3MDM3MzY1YTRiZjE2MjM3MzRjMWM4OTliYWVkNzg1NTA2MWFjZS5wZGY=">QuantitativeTrading: How to Build Your Own Algorithmic Trading Business<i class="fa fa-external-link-alt"></i></span>" byErnie Chan is a comprehensive guide that explores the world ofquantitative trading and provides practical advice for building aalgorithmic trading business, especially for individuals interested inquantitative trading.</p><p>It covers essential concepts, methodologies, and practical tips tohelp readers develop and implement their own algorithmic tradingstrategies while effectively managing risk and building a sustainabletrading business.</p><p>Due to the significant benefits I received from reading this book, Iwant to write down some of the most important takeways I get from thisbook, with the hope that it can also be useful to you.</p><p>This passage is about the first four chapters, which introduce basicrequirements for independent traders, including search for ideas,perform backtest, and what we need before conducting real trading.</p><span id="more"></span><p>Quantitative trading, also known as algorithmic trading, is thetrading of securities based strictly on the buy/sell decisions ofcomputer algorithms.</p><p>It relies on advanced mathematical and statistical models, computeralgorithms, and data analysis to make trading decisions. It involves theuse of quantitative techniques to identify patterns, trends, andopportunities in financial markets and execute trades automaticallywithout human intervention.</p><p>The quantitative trading this book focuses on is called<strong>statistical arbitrage trading</strong>, which deals with thesimplest financial instruments: stocks, futures, and sometimescurrencies. The book argues that one does not need an advanced degree tobecome a statistical arbitrage trader, compared to those institutionalquantitative traders who received their advanced degrees as physicists,mathematicians, engineers, focusing on trading complex derivativeinstruments</p><h2 id="independent-quantative-trading">Independent QuantativeTrading</h2><p>As this book is focus on independent quantitative traders, it listssome demands for anyone who wants to venturing into this field, the mostimportant one I though is the following one</p><p>When one plunges into independent trading, fear of losses and ofbeing isolated from the rest of the world is natural, and so it helps tohave both a prior appreciation of risks and some savings to lean on. Itis important not to have a need for immediate profits to sustain yourdaily living, as strategies have intrinsic rates of returns that cannotbe hurried</p><p><strong>The ideal independent quantitative trader is thereforesomeone who has some prior experience with finance or computerprogramming, who has enough savings to withstand the inevitable lossesand periods without income, and whose emotion has found the rightbalance between fear and greed</strong>.</p><p>The book also talks about how much time to take for independentquantative trading, since most people who enter this field aims forfreedom of wealth so as to have more time for their lives.And it dependsvery much on the degree of automation you have achieved. The authorlists himself as an example</p><blockquote><p>The largest block of time I need to spend is in the morning beforethe market opens: I typically need to run various programs to downloadand process the latest historical data, read company news that comes upon my alert screen, run programs to generate the orders for the day, andthen launch a few baskets of orders before the market opens and start aprogram that will launch orders automatically throughout the day. Iwould also update my spreadsheet to record the previous day’s profit andloss (P&amp;L) of the different strategies I run based on thebrokerages’ statements. All of this takes about two hours.</p><p>But the two hours reffered above is just the operational side of thebusiness. If you want to grow your business, or keep your currentprofits from declining due to increasing competition, you will need tospend time doing research and backtesting on new strategies. Butresearch and development of new strategies is the creative part of anybusiness, and it can be done whenever you want to. And this may take alot of time</p></blockquote><p>If you are convinced that you want to become a quantitative trader, anumber of questions immediately follow, which will be answered in thefollowing chapters</p><ul><li>How do you find the right strategy to trade?<br></li><li>How do you recognize a good versus a bad strategy even beforedevoting any time to backtesting them?<br></li><li>How do you rigorously backtest them?<br></li><li>If the backtest performance is good, what steps do you need to taketo implement the strategy, in terms of both the business structure andthe technological infrastructure?<br></li><li>If the strategy is profitable in initial real-life trading, how doesone scale up the capital to make it into a growing income stream whilemanaging the inevitable losses that come with trading?</li></ul><h2 id="fishing-for-ideas">Fishing for Ideas</h2><p>This part mainly answers the first question, How do you find theright strategy？</p><p>Finding a strategy is not hard, there are hundreds, if not thousands,of trading ideas that are in the public sphere at any time, accessibleto anyone at little or no cost. But they may not be useful, especiallyfor academics</p><p>The author states in the book that he had found that many strategiesdescribed by academics are either too complicated, out of date (perhapsthe once-profitable strategies have already lost their power due tocompetition), or require expensive data to backtest (such as historicalfundamental data). Furthermore, many of these academic strategies workonly on <strong>small-cap stocks, whose illiquidity may render actualtrading profits far less impressive than their backtests wouldsuggest</strong>.</p><p>However, numerous publicly accessible strategies may not be highlyrigorous, but one can consider making slight adjustments to thesestrategies to achieve profitability. For example, the strategies fromtraders’ forums may have worked only for a little while, or they workfor only a certain class of stocks, or they work only if you don’tfactor in transaction costs. However, the trick is that you can oftenmodify the basic strategy and make it profitable</p><h3 id="capital-matters">Capital Matters</h3><p>There are many factors to consider to get the most suitable strategyfor you, including working hours, programming skills, trading capital,etc. Here we jsut focus on the factor of capital. Because capitalavailability affects many choices</p><ul><li>account</li></ul><p>The first is whether you should open a retail brokerage account or aproprietary trading account, which will be explained with more detailsin chapter 4</p><ul><li>leverage</li></ul><p>With a <strong>low-capital account</strong>, we need to findstrategies that can utilize the <strong>maximum leverage</strong>available. Trading futures, currencies, and options can offer you higherleverage than stocks; intraday positions allow a Regulation T leverageof 4, while interday (overnight) positions allow only a leverage of2</p><p>Capital (or leverage) availability determines whether you shouldfocus on directional trades (long or short only) or dollar-neutraltrades (hedged or pair trades).</p><p>A <span class="exturl" data-url="aHR0cHM6Ly9xdWFudC5zdGFja2V4Y2hhbmdlLmNvbS9xdWVzdGlvbnMvMjMxODcvZG9sbGFyLW5ldXRyYWwtc3RyYXRlZ3k=">dollar-neutraltrades<i class="fa fa-external-link-alt"></i></span> means that hold equal dollar amounts of long and shortpositions, sometimes it’s also called market neutral strategies, and<strong>a dollar-neutral portfolio or market-neutral portfolio requirestwice the capital or leverage of a long or short-onlyportfolio.</strong></p><ul><li>infrastructure</li></ul><p>Capital availability also imposes a number of indirect constraints.It affects how much you can spend on various infrastructure, data, andsoftware.</p><p>For example, if you have low trading capital, your online brokeragewill not be likely to supply you with real-time market data for too manystocks, so you can’t really have a strategy that requires real-timemarket data over a large universe of stocks.</p><p>Similarly, clean historical stock data with high frequency costs morethan historical daily stock data. And historical stock data withoutsurvivorship bias are much more expensive than those that have such abias. Yet if your data have survivorship bias, the backtest result canbe unreliable.</p><ul><li>holding period</li></ul><p>There is a misconception aired by some investment advisers, that isif your goal is to achieve maximum long-term capital growth, then thebest strategy is a buy-and-hold one. This notion has been shown to bemathematically false.</p><p>In reality, maximum long-term growth is achieved by finding astrategy with the maximum Sharpe ratio (defined in the next section),provided that you have access to sufficiently high leverage. Therefore,<strong>comparing a short-term strategy with a very short holdingperiod, small annual return, but very high Sharpe ratio, to a long-termstrategy with a long holding period, high annual return, but lowerSharpe ratio, it is still preferable to choose the short-term strategyeven if your goal is long-term growth</strong>, barring taxconsiderations and the limitation on your margin borrowing (more on thissurprising fact later in Chapter 6 on money and risk management).</p><p>A long holding period does not guarantee a good strategy; however, inmany cases, it is really hard to judge the market trend correctly, whichleads to the truth that long-term approach is more profitable thanshort-term approach</p><p>The following image includes the difference between low capital andhigh capital</p><p><img data-src="https://wulc.me/imgs/lowCapitalVShighCapital.png" height="50%" width="50%" alt="lowCapital_vs_highCapital"></p><p>And the autor's experience may also bring us some insights</p><blockquote><p>I started my life as an independent quantitative trader with $100,000at a retail brokerage account (I chose Interactive Brokers), and Itraded only directional, intraday stock strategies at first. But when Ideveloped a strategy that sometimes requires much more leverage in orderto be profitable, I signed up as a member of a proprietary trading firmas well.</p></blockquote><h3 id="before-backtesting">Before Backtesting</h3><p>Even before doing an in-depth backtest of the strategy, you canquickly filter out some unsuitable strategies if they fail one or moreof these tests:</p><ul><li>Does it outperform a benchmark?<br></li><li>Does it have a high enough <strong><span class="exturl" data-url="aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvU2hhcnBlX3JhdGlv">Sharperatio<i class="fa fa-external-link-alt"></i></span></strong>?<br></li><li>Does it have a <strong>small enough drawdown and short enoughdrawdown duration</strong>?<br></li><li>Does the backtest suffer from <strong>survivorshipbias</strong>?<br></li><li>Does the strategy lose steam in recent years compared to its earlieryears?<br></li><li>Does the strategy have its own “niche” that protects it from intensecompetition from large institutional money managers?</li></ul><p>We will talk about the above questions one by one</p><ul><li>benchmark</li></ul><p>To compare strategy with a benchmark is important, but we also needto realize that different assets require different benchmarks</p><p>Everybody seems to know that if a long-only strategy returns 10percent a year, it is not too fantastic because investing in an indexfund will generate as much, if not better, return on average. However,if the strategy is a long-short dollar-neutral strategy (i.e., theportfolio holds long and short positions with equal capital), then 10percent is quite a good return, because then the benchmark of comparisonis not the market index, but a riskless asset such as the yield of thethree-month U.S. Treasury bill (which at the time of this writing isabout 4 percent).</p><p>And Excess Returns = Portfolio Returns − Benchmark Returns</p><ul><li>sharpe ratio and drawdown</li></ul><p>Don't just consider the return rate, Sharpe ratio is alsoimportant</p><p>There is often a trade-off between the return rate and the sharperatio; however, the book suggests that higher Sharpe ratio often leadsto higher returns because leverage can be applied to benefit, and thepartial risk of leverage can be hedged by the high Sharpe ratio.</p><p>If a strategy has deep (e.g., more than 10 percent) or lengthy (e.g.,four or more months) drawdowns, it is unlikely that it will have a highSharpe ratio</p><p>Any strategy with a Sharpe ratio less than 1 is not considered a goodstrategy, and strategies that are profitable every day typically have aSharpe ratio greater than 3.</p><ul><li>steam and transaction costs</li></ul><p>In addition to commission fees, there are also costs incurred due toliquidity; for example, the inability to sell at a specific price or theprice drop after selling.</p><p>The book explains this point with the following example</p><blockquote><p>when you buy or sell a large chunk of securities, you will not beable to complete the transaction without impacting the prices at whichthis transaction is done. This effect on the market prices due to yourown order is called market impact, and it can contribute to a large partof the total transaction cost when the security is not very liquid</p></blockquote><p>The term "slippage" is used to describe the situation mentionedabove, slippage is the difference between the price that triggers theorder and the execution price. Of course, this slippage can be of eithersign, but <strong>on average it will be a cost rather than a gain to thetrader</strong></p><p><strong>Taking transaction costs into account, the Sharpe ratio of astrategy may shift from positive to negative.</strong></p><ul><li>data</li></ul><p>Usually there are two problems related to data, surviveship bias andregime shifts</p><p>Survivorship bias in data refers to the exclusion of assets that havealready delisted or disappeared from the backtesting data.</p><p>Some strategies are significantly impacted by this bias, such asthose specifically focus on buying cheap stocks. These strategies maynot be targeting undervalued assets, but rather assets that are on theverge of delisting or disappearing.</p><p>As to "regime shifts" in the financial markets, it means thatfinancial data from an earlier period simply cannot be fitted to thesame model that is applicable today</p><p>This point may be hard to swallow for many statistically mindedreaders. Many of them may think that the more data there is, the morestatistically robust the backtest should be. This is true only when thefinancial time series is generated by a stationary process.Unfortunately, <strong>financial time series is famouslynonstationary</strong></p><ul><li>fly under the Radar</li></ul><p>For personal traders, avoid blindly following strategies ofsuperstitious large institutions; instead, find a well-considered andindependent strategy that suits you, or "strategy fly under theRadar"</p><p>You should look for those strategies that fly under the radar of mostinstitutional investors, for example, strategies that have very lowcapacities because they trade too often, strategies that trade very fewstocks every day, or strategies that have very infrequent positions</p><h2 id="backtesting">Backtesting</h2><p>There are many nuts and bolts involved in creating a realistichistorical backtest and in reducing the divergence of the futureperformance of the strategy from its backtest performance.</p><p>Issues discussed here include:</p><ul><li>Data: <strong>Split/dividend adjustments, noise in dailyhigh/low</strong>, and survivorship bias.<br></li><li>Performance measurement: Annualized Sharpe ratio and maximumdrawdown.<br></li><li>Look-ahead bias: Using unobtainable future information for pasttrading decisions.<br></li><li>Data-snooping bias: Using too many parameters to fit historicaldata, and avoiding it using large enough sample, out-of-sample testing,and sensitivity analysis.<br></li><li>Strategy refinement: Common ways to make small variations on thestrategy to optimize performance.<br></li><li>Transaction cost: Impact of transaction costs on performance.</li></ul><h3 id="data">Data</h3><p>There are serveral aspects to which we need to pay attention whendealing with data in backtesting</p><ul><li>Dividend and Split</li></ul><p>In the financial field, a dividend refers to a portion of a company'sprofits distributed to its shareholders. When a company makes a profit,it can choose to return a portion of the earnings to its shareholders inthe form of cash or stock. This is known as a dividend payment. Thereare two main types of dividends:</p><ol type="1"><li>Cash Dividend: A dividend paid by the company directly in the formof cash to its shareholders.<br></li><li>Stock Dividend: An extra share of stock distributed to shareholdersin the form of additional shares.</li></ol><p>As to split, a stock split refers to a company dividing its existingshares into a larger number of shares at a certain ratio, therebyincreasing the number of shares while reducing the price per share. Forexample, a 2-for-1 stock split means each share is split into twoshares, but the price per share is reduced by half. Stock splits do notchange the market value of the company or the total equity ofshareholders.</p><p>The viewpoint of this book is that we need to refresh the price ofthe stock when there is dividen or split, according the the exact numberof dividen or split</p><ul><li>High and Low Data</li></ul><p>A backtest that relies on high and low data is less reliable than onethat relies on the open and close.</p><p>After retrieving the data from a database, it is often advisable todo a quick error check. The simplest way to do this is to<strong>calculate the daily returns based on the data</strong>. If youhave open, high, low, and close prices, you can calculate the variouscombinations of daily returns such as from the previous high to today’sclose as well. You can then examine closely those days with returns thatare, say, 4 standard deviations away from the average.Typically, anextreme return should be accompanied by a news announcement, or shouldoccur on a day when the market index also experienced extreme returns.If not, then your data is suspect</p><ul><li>Survivorship Bias</li></ul><p>One way to overcome this problem is to start collecting point-in-timedata yourself for the benefit of your future backtest. If you save theprices each day of all the stocks in your universe to a file, then youwill have a point-in-time or survivorship-bias-free database to use inthe future. Another way to lessen the impact of survivorship bias is tobacktest your strategies on more recent data so that the results are notdistorted by too many missing stocks.</p><h3 id="performance-measurement">Performance measurement</h3><p>The point in this book is that <strong>sharpe ratio anddrawdowns</strong> are the two most important measurements inbacktesting.</p><p>But usually it did not include average annualized returns, themeasure most commonly quoted by investors. The reason in the book is ifyou use this measure, you have to tell people a number of things aboutwhat denominator you use to calculate returns.</p><p>In general, if you calculate your average and standard deviation ofreturns based on a certain trading period T, whether T is a month, aday, or an hour, and you want to annualize these quantities, you have tofirst find out how many such trading periods there are in a year (callit NT). Then <strong>Annualized Sharpe Ratio = (NT) × SharpeRatio</strong></p><h3 id="common-pitfalls">Common Pitfalls</h3><p>These pitfalls are actually some common problems in machinelearning</p><ul><li><p>Look-Ahead Bias: same as the problem of data leakage in machinelearning</p></li><li><p>Data-Snooping Bias: same as the problem of overfitting in machinelearning, the author offers his experience as follows</p></li></ul><blockquote><p>Usually, an erroneous backtest would produce a historical performancethat is better than what we would have obtained in actual trading</p></blockquote><blockquote><p>As a rule of thumb, I would not employ more than five parameters,including quantities such as entry and exit thresholds, holding period,or the lookback period, in computing moving averages.</p><p>Let’s assume that <strong>the number of data points needed foroptimizing your parameters is equal to 252 times the number of freeparameters your model has.(purely on experience.)</strong></p></blockquote><ul><li>Sensitivity Analysis: to test if a strategy if robust</li></ul><blockquote><p>Once you have optimized your parameters as well as various featuresof your model and have verified that its performance on a test set isstill reasonable, vary these parameters or make some small qualitativechanges in the features of the model and see how the performance changeson both the training and the test sets.</p></blockquote><h3 id="transaction-costs">Transaction Costs</h3><p>In actual financial trading, there are various costs involved, likecommission, liquidity cost, opportunity cost, market impact, andslippage, which we had reffered in the previous chapter</p><p>These costs can greatly impact the final returns in backtesting.Andit should not surprise you to find that a strategy with a high Sharperatio before adding transaction costs can become very unprofitable afteradding such costs</p><p>So you should consider transaction costs in backtesting</p><h3 id="strategy-refinement">Strategy Refinement</h3><p>Usaually there are some very simple strategies that are fairly wellknown in traders’ circles and are still somewhat profitable, thoughtheir returns seem to be diminishing. An example is the pair trading ofstocks. <strong>The reason they are diminishing in returns is that toomany traders are taking advantage of this arbitrage opportunity andgradually erasing the profit margin</strong>. However, it is oftenpossible to introduce minor variations in the basic strategy, which willboost its returns.</p><p>These minor variations are often far less well known than the basicstrategy, and therefore far less well exploited by traders. Sometimesthey involve <strong>excluding certain stocks or groups of stocks fromthe universe</strong>. For example, traders often prefer to excludepharmaceutical stocks from their technical trading program because ofthe dramatic impact of news on their prices, or else they may excludestocks that have pending merger or acquisition deals. Other traders<strong>change the entry and exit timing or frequency of thetrades</strong>. And <strong>a strategy that has a very good Sharperatio when it is applied to small-cap stocks becomes very unprofitablewhen applied to large-cap stocks</strong>.</p><p>When introducing these refinements to your strategy, <strong>it ispreferable that the refinement has some basis in fundamental economicsor a well-studied market phenomenon, rather than some arbitrary rulebased on trial and error</strong>. Otherwise, data-snooping biaslooms.</p><h2 id="setting-up-your-business">Setting up your business</h2><h3 id="retail-or-proprietray">Retail or Proprietray</h3><p>Proprietary trading firms are financial companies specialized inproprietary trading. This means they use their own capital for trading,aiming to profit from market fluctuations. These firms typically havehighly specialized trading teams that employ complex trading strategies.They use their own funds for trading, enabling them to seek profits inhigh-risk, high-return markets.</p><p>Retail brokerage accounts are accounts opened by individual investorswith a brokerage or securities firm. Through retail brokerage accounts,individual investors can buy and sell financial products such as stocks,bonds, and funds. These accounts are typically geared towards thegeneral public and offer relatively simple investment options andtrading functionalities. The funds in these accounts come from theindividual investors themselves and are used to meet their personalinvestment needs.</p><p>Their difference are listed as follows in this book</p><p><img data-src="https://wulc.me/imgs/Retail_versus_Proprietary.jpg" height="40%" width="40%" alt="Retail versus Proprietary"></p><p>In a nutshell, <strong>retail brokerages give you complete freedomand better capital protection but smaller leverage</strong>, whileproprietary trading firms give you less freedom and less capitalprotection but much high leverage. You can choose to have both retailand proprietary accounts, each tailored to the specific needs of yourstrategies</p><p>The decision whether to go retail or to join a proprietary tradingfirm is generally based on your need of capital, the style of yourstrategy, and your skill level.</p><p>For example, if you run a low-risk, market-neutral strategy thatnevertheless requires a much higher leverage than allowed by RegulationT in order to generate good returns, a proprietary account may be betterfor you. However, if you engage in high-frequency futures trading thatdoes not require too much capital, a retail account may save you a lotof costs and hassles. Similarly, a very experienced trader with strongrisk man- agement practices and emotional stability probably doesn’tneed the guidance given by a proprietary firm, but less experiencedtraders may benefit from the imposed restraints.</p><p>Regardless of whether you have chosen to trade in a retail bro-kerage or join a proprietary trading firm, you need to make sure theirtrading account and systems have these features:</p><ul><li>Relatively <strong>low commissions</strong>.<br></li><li>Trade a <strong>good variety of financialinstruments</strong>.<br></li><li>Access to <strong>deep pool of liquidity</strong>.<br></li><li>API for real-time data retrieval and order transmission.</li></ul><p>A "deep pool of liquidity" refers to a financial market or tradingenvironment where there is a significant volume of buy and sell ordersavailable for a particular asset (such as a stock, currency, orcommodity) at various price levels. In other words, it is a market witha large number of participants willing to trade that particular asset,resulting in a high level of trading activity.</p><h3 id="physical-infrastructure">Physical Infrastructure</h3><p>In quantitative trading, high-performance servers and reliablenetwork connections are critical because they directly affect theefficiency of executing trading strategies and the stability oftrades.</p><p>Here are some aspects that need to be cosidered in this part</p><ul><li><p><strong>Server Selection</strong>: Quantitative trading requiresthe use of high-performance servers, typically servers with powerfulprocessing capabilities and large memory capacity. These servers need toprocess market data rapidly, run complex trading strategies, and executetrade instructions efficiently.</p></li><li><p><strong>Low Latency</strong>: The success of quantitative tradingoften relies on quick execution and response times. Therefore, serversneed to have low latency characteristics to ensure that tradeinstructions reach the exchange and receive a response as quickly aspossible, reducing the impact of network latency on tradeslippage.</p></li><li><p><strong>Redundant Systems</strong>: As quantitative tradinginvolves high-frequency, automated trading, server reliability iscrucial. Redundant systems, such as redundant power supplies, redundanthard drives, and redundant network interfaces, are used to preventsingle points of failure and ensure the continuous operation ofservers.</p></li><li><p><strong>Server Location</strong>: Server location is also animportant consideration. To minimize trade execution latency, somequantitative traders place servers in data centers close to theexchange, reducing the transmission time of trade instructions as muchas possible.</p></li><li><p><strong>Network Connectivity</strong>: High-speed and stablenetwork connections are crucial for quantitative trading. Quantitativetraders often choose high-quality dedicated network connections orleased lines to ensure fast and reliable data transmission.</p></li><li><p><strong>Security</strong>: Quantitative trading involves asignificant amount of trade data and sensitive information. Therefore,servers and network infrastructure need to have robust security measuresto protect traders' data and funds.</p></li></ul><p>The above requirements may seem too strict for the trading whichfrequency is relatively lower, since it is usually forultra-high-frequency trading applications. But some infrastructure isstill required to support the development and execution of tradingstrategies. For example, server, network ans security, and it highlydepends on what kind of trading you're performing.</p><h2 id="summary">Summary</h2><p>In summary, this passage discusses various aspects of quantitativetrading and provides practical advice for building an algorithmictrading business. It emphasizes the importance of strategy selection,backtesting, and setting up the necessary infrastructure. Here are thekey points covered:</p><p><strong>Quantitative Trading Overview and Independent QuantitativeTrading</strong>: Quantitative trading, also known as algorithmictrading, uses computer algorithms, mathematical models, and dataanalysis to make buy/sell decisions automatically. The ideal independentquantitative trader should have some prior experience in finance orcomputer programming, sufficient savings to withstand losses, andemotional balance between fear and greed.</p><p><strong>Finding Trading Ideas</strong>: Traders can find tradingstrategies from various sources, but it is essential to verify andrefine them. Minor adjustments to existing strategies can lead toprofitable results. Factors Influencing Strategy Selection: Capitalavailability, infrastructure, and holding period influence the choice oftrading strategy.</p><p><strong>Backtesting</strong>: Backtesting involves testing astrategy's performance using historical data.Considerations includedividend/split adjustments, data accuracy, perfromance measurements,transaction costs, and sensitivity analysis.</p><p><strong>Setting Up Your Business</strong>: Traders can choose betweenretail brokerage accounts and proprietary trading firms. Importantfeatures to consider include low commissions, access to a variety offinancial instruments, deep liquidity, and real-time data retrieval andorder transmission. And traders also need for set up some physicalinfrastructure for real trading.</p>]]></content>
    
    
    <summary type="html">&lt;p&gt;&quot;&lt;span class=&quot;exturl&quot; data-url=&quot;aHR0cHM6Ly93d3cubXlxdWFudC5jbi91cGxvYWRzL2RlZmF1bHQvb3JpZ2luYWwvMVgvNGM3MDM3MzY1YTRiZjE2MjM3MzRjMWM4OTliYWVkNzg1NTA2MWFjZS5wZGY=&quot;&gt;Quantitative
Trading: How to Build Your Own Algorithmic Trading Business&lt;i class=&quot;fa fa-external-link-alt&quot;&gt;&lt;/i&gt;&lt;/span&gt;&quot; by
Ernie Chan is a comprehensive guide that explores the world of
quantitative trading and provides practical advice for building a
algorithmic trading business, especially for individuals interested in
quantitative trading.&lt;/p&gt;
&lt;p&gt;It covers essential concepts, methodologies, and practical tips to
help readers develop and implement their own algorithmic trading
strategies while effectively managing risk and building a sustainable
trading business.&lt;/p&gt;
&lt;p&gt;Due to the significant benefits I received from reading this book, I
want to write down some of the most important takeways I get from this
book, with the hope that it can also be useful to you.&lt;/p&gt;
&lt;p&gt;This passage is about the first four chapters, which introduce basic
requirements for independent traders, including search for ideas,
perform backtest, and what we need before conducting real trading.&lt;/p&gt;</summary>
    
    
    
    <category term="读书" scheme="https://wulc.me/categories/%E8%AF%BB%E4%B9%A6/"/>
    
    
    <category term="读书" scheme="https://wulc.me/tags/%E8%AF%BB%E4%B9%A6/"/>
    
    <category term="量化交易" scheme="https://wulc.me/tags/%E9%87%8F%E5%8C%96%E4%BA%A4%E6%98%93/"/>
    
  </entry>
  
</feed>
