35 岁这个槛,似乎是悬在互联网人头上的达摩克利斯之剑,一直在各大媒体上被鼓吹放大,虽不明真假,但也让人不寒而栗;而持续了三年的疫情加上 2022 随之而来互联网裁员潮,王兴那句开玩笑似的 “2019 可能会是过去十年里最差的一年,但却是未来十年里最好的一年” 似乎一语成谶。

走在奔三的路上,凝望这前面那个迷雾般的 35 岁路口,焦虑就一直萦绕在心头;伴随着的是一系列的疑问:大厂为什么要裁员?所谓的 35 岁危机从何而来?只有互联网才有这个危机么?普通人只能眼巴巴地等待着 35 岁到来然后被裁掉?我们能做些什么?

当我最开始问出自己这一串问题时,焦虑中带着点绝望,因为前方的路虽然处于迷雾,却又似乎一眼能望到头;但是准备写这篇文章,心里又平静了很多,也许是经过这一个多月的调研和自我教育,看到了生活的可能性和随机性,接受了与焦虑为伴这个事实。本文算是写给自己的心理按摩,文章可能会有点发散,祝开卷有益。

阅读全文 »

从年初了解 有知有行 开始,断断续续看了不少上面的内容: 听完了里面投资第一课, E 大干货合集、投资知识体系里的文章也基本是已读状态,一直处于输入的状态; 感觉是时候该 connect the dots,形成一个更系统的框架融入自己的知识体系中, 于是便有了这个系列的文章

这个系列的文章绝大部分内容来自于有知有行,也会有一些笔者深究后调研的内容,且按照笔者的理解划分为:认知与心态、概念与常识、买与卖三大模块。妄图将投资这个大话题以及有知有行的编辑们整理的上百篇文章浓缩到这篇小小的笔记中,自然无法面面俱到,所以这篇文章还是会挑选笔者关注的一些内容,更详细的内容可参考有知有行以及本文里的相关引用。

本文是买与卖部分,也是实操部分;投资赚取的收益本质上就四个字:低买高卖,虽然只有四个字,但是如果要做好这个事情非常难,本文试图为这个没有标准答案的问题寻找一些可参考的解。

这个系列前面两部分的内容可参考

阅读全文 »

从年初了解 有知有行 开始,断断续续看了不少上面的内容: 听完了里面投资第一课, E 大干货合集、投资知识体系里的文章也基本是已读状态,一直处于输入的状态; 感觉是时候该 connect the dots,形成一个更系统的框架融入自己的知识体系中, 于是便有了这个系列的文章。

这个系列的文章绝大部分内容来自于有知有行,也会有一些笔者深究后调研的内容,且按照笔者的理解划分为:认知与心态、概念与常识、买与卖三大模块。妄图将投资这个大话题以及有知有行的编辑们整理的上百篇文章浓缩到这篇小小的笔记中,自然无法面面俱到,所以这篇文章还是会挑选笔者关注的一些内容,更详细的内容可参考有知有行以及本文里的相关引用。

本文是概念与常识的部分,主要是笔者在学习过程中接触到的一些概念性的知识,对于熟悉的人来说,也许是 “常识”,笔者则是在尝试将这些不熟悉的内容变为自己的常识,也希望对你有用。

第一部分的内容见 《投资这件事 (1)- 认知与心态

阅读全文 »

从年初了解 有知有行 开始,断断续续看了不少上面的内容: 听完了里面投资第一课, E 大干货合集、投资知识体系里的文章也基本是已读状态,一直处于输入的状态; 感觉是时候该 connect the dots,形成一个更系统的框架融入自己的知识体系中, 于是便有了这个系列的文章。

这个系列的文章绝大部分内容来自于有知有行,也会有一些笔者深究后调研的内容,且按照笔者的理解划分为:认知与心态、概念与常识、买与卖三大模块。妄图将投资这个大话题以及有知有行的编辑们整理的上百篇文章浓缩到这篇小小的笔记中,自然无法面面俱到,所以这篇文章还是会挑选笔者关注的一些内容,更详细的内容可参考有知有行以及本文里的相关引用。

本文是认知与心态的部分,主要是投资前的心理建设部分,包括对待财富、投资的认知,投资时的心态管理 (收益与风险的预期、投资的时间周期) 等。

阅读全文 »

The long tail problem is common in recommendation/advertising systems (mainly for items). There are many reasons. The author’s understanding is that the system has a feedback loop (training data is generated by the model, and then used for training). Without external intervention, the Matthew effect naturally causes severe head effects, where a small portion of items dominate the system.

For example, in recommendation systems, many videos/articles don’t get exposure opportunities and don’t appear in training sets, while popular videos/articles rank high across different users and get recommended multiple times. In advertising systems, some campaigns have very high spend while others can’t spend at all. This leads to poor user or advertiser experience, often categorized as ecosystem problems.

Since the system’s natural characteristics cause severe head effects (or Pareto effects) without intervention, can forcibly intervening in the system distribution solve this problem? The answer is yes, and most current methods do exactly this. Common approaches are:

  1. Strategy level: Design rules based on system and business characteristics, such as specific support for long-tail items to forcibly reach more users
  2. Model level: Core idea is to let the model better learn long-tail item representations, because the root cause is insufficient samples for long-tail items, leading to poor model learning. Specific methods are detailed below.

This article mainly introduces papers at the model level, since strategy-level methods often require business-specific rules, while model-level methods are more universal.

阅读全文 »

长尾问题在推荐 / 广告系统是一个较为常见的问题 (这里主要针对 item 的长尾),原因可能比较多,笔者理解的主要原因是由于系统存在 feedback loop (即训练数据由模型产生,同时又会被模型用于训练) 的特性,在没有外部干预的情况下,马太效应会天然导致头部效应的现象比较严重,少部分的 item 主导了整个系统。

比如说推荐系统中,很多视频/文章并没有展示机会,在训练集中压根没出现过,高热的视频/文章在不同的用户中排序都比较靠前,进而得到多次被推荐的机会;在广告系统中,部分计划的消耗会特别高,而一些计划压根投不出去;这导致了用户或者广告主体验不佳,而这种现象往往也会被归为生态问题。

既然没有干预时,系统天然的特性导致了头部效应 (或者说二八效应) 比较严重,那强行干预系统的分布能不能改变这个问题?答案是可以的,而且目前绝大部分的方法都是在做这一类事情,常用手段往往有 2 种

(1)策略层面,根据系统和业务特性设计规则,比如说对长尾的 item 有特定的扶持,强行让这些 item 能触达到更多的用户
(2)模型层面,核心思想就是让模型能更好地学习到 long tail item 的 representation,因为这个问题的根本原因就是 long tail item 的样本过少,进而导致模型学习的不好;而具体的手段比较多,这部分会在后面详细介绍。

这篇文章主要介绍的几篇 paper 都是模型层面的,因为策略层面的往往需要根据实际业务需求来拍一些规则,模型层面的一些方法更为通用。

阅读全文 »

之前的文章 Dynamic Creative Optimization in Online Display Advertising 中提到,广告创意往往可分为创意生成、创意优选和创意投放三大块,本文主要讲创意优选这部分的一些做法,这个过程一般会涉及到 E & E 的过程。

本文的主要内容是选自阿里发表的一篇 paper:A Hybrid Bandit Model with Visual Priors for Creative Ranking in Display Advertising,paper 通过 list-wise 的训练方式达到对同一计划下的候选创意进行排序 (即优选) 的目标;list-wise 可以算作 Exploitation 部分,paper 还通过了一个 bandit model 达到 Exploration 的目的,总体的做法比较合理,也在业界实际场景验证了有效性,值得一看。

阅读全文 »

The previous article Dynamic Creative Optimization in Online Display Advertising mentioned that creative optimization can generally be divided into three main parts: creative generation, creative selection, and creative delivery. This article mainly covers some approaches for creative selection, which typically involves an exploration-exploitation (E&E) process.

This article is primarily based on a paper published by Alibaba: A Hybrid Bandit Model with Visual Priors for Creative Ranking in Display Advertising. The paper achieves the goal of ranking candidate creatives under the same campaign (i.e., creative selection) through list-wise training. List-wise can be considered as the exploitation part, while the paper also uses a bandit model for exploration. The overall approach is quite reasonable and has been validated in real-world industry scenarios, making it worth reading.

阅读全文 »

最近在研究广告创意相关内容, 笔者根据当前的调研,将这个领域划分为创意生成、创意优选和创意投放三大块,每一块的具体职责如下

  • 创意生成:利用素材 (标题、图片、视频、落地页等) 生成候选创意 (用户看到的广告)
  • 创意优选:从计划的候选创意 (一个计划下的候选往往有多个) 中选择 topk 个用于投放
  • 创意投放:将优选出来的创意投放至线上

严格来说,这三部分其实也并非泾渭分明,比如前两部分可以统一理解为创意生成 (从最原始的素材生成最终要投放的创意),后两部分可以统一理解为创意投放过程 (从候选中选出来并投放至线上)。

本文主要侧重讲述与创意投放相关的一篇 paper, 而且偏向于上面提到第三块内容 (没有基于 E & E 的优选过程),paper 的标题是 Dynamic Creative Optimization in Online Display Advertising,这篇 paper 将素材在线投放问题建模成一个二部图匹配问题,并提供了严格求解的方法和在线的近似求解方法。更重要的是,这种建模的方法不局限于创意领域,能应用到更多投放场景下。

阅读全文 »

Recently I’ve been researching creative-related content. Based on current investigation, I divide this field into three main parts: creative generation, creative selection, and creative delivery, with specific responsibilities as follows:

  • Creative generation: Using materials (titles, images, videos, landing pages, etc.) to generate candidate creatives (the ads users see)
  • Creative selection: Selecting top-k creatives from a campaign’s candidates (a campaign typically has multiple candidates) for delivery
  • Creative delivery: Delivering the selected creatives online

Strictly speaking, these three parts are not clearly demarcated. For example, the first two can be unified as creative generation (generating final delivery creatives from raw materials), and the latter two can be unified as creative delivery (selecting from candidates and delivering online).

This article mainly focuses on a paper related to creative delivery, particularly the third part (without E&E-based selection). The paper title is Dynamic Creative Optimization in Online Display Advertising. This paper models the online delivery problem as a bipartite graph matching problem, providing both exact and approximate online solutions. More importantly, this modeling approach is not limited to the creative domain and can be applied to many delivery scenarios.

阅读全文 »
0%