从年初了解 有知有行 开始,断断续续看了不少上面的内容: 听完了里面投资第一课, E 大干货合集、投资知识体系里的文章也基本是已读状态,一直处于输入的状态; 感觉是时候该 connect the dots,形成一个更系统的框架融入自己的知识体系中, 于是便有了这个系列的文章。

这个系列的文章绝大部分内容来自于有知有行,也会有一些笔者深究后调研的内容,且按照笔者的理解划分为:认知与心态、概念与常识、买与卖三大模块。妄图将投资这个大话题以及有知有行的编辑们整理的上百篇文章浓缩到这篇小小的笔记中,自然无法面面俱到,所以这篇文章还是会挑选笔者关注的一些内容,更详细的内容可参考有知有行以及本文里的相关引用。

本文是概念与常识的部分,主要是笔者在学习过程中接触到的一些概念性的知识,对于熟悉的人来说,也许是 “常识”,笔者则是在尝试将这些不熟悉的内容变为自己的常识,也希望对你有用。

第一部分的内容见 《投资这件事 (1)- 认知与心态

阅读全文 »

从年初了解 有知有行 开始,断断续续看了不少上面的内容: 听完了里面投资第一课, E 大干货合集、投资知识体系里的文章也基本是已读状态,一直处于输入的状态; 感觉是时候该 connect the dots,形成一个更系统的框架融入自己的知识体系中, 于是便有了这个系列的文章。

这个系列的文章绝大部分内容来自于有知有行,也会有一些笔者深究后调研的内容,且按照笔者的理解划分为:认知与心态、概念与常识、买与卖三大模块。妄图将投资这个大话题以及有知有行的编辑们整理的上百篇文章浓缩到这篇小小的笔记中,自然无法面面俱到,所以这篇文章还是会挑选笔者关注的一些内容,更详细的内容可参考有知有行以及本文里的相关引用。

本文是认知与心态的部分,主要是投资前的心理建设部分,包括对待财富、投资的认知,投资时的心态管理 (收益与风险的预期、投资的时间周期) 等。

阅读全文 »

The long tail problem is common in recommendation/advertising systems (mainly for items). There are many reasons. The author’s understanding is that the system has a feedback loop (training data is generated by the model, and then used for training). Without external intervention, the Matthew effect naturally causes severe head effects, where a small portion of items dominate the system.

For example, in recommendation systems, many videos/articles don’t get exposure opportunities and don’t appear in training sets, while popular videos/articles rank high across different users and get recommended multiple times. In advertising systems, some campaigns have very high spend while others can’t spend at all. This leads to poor user or advertiser experience, often categorized as ecosystem problems.

Since the system’s natural characteristics cause severe head effects (or Pareto effects) without intervention, can forcibly intervening in the system distribution solve this problem? The answer is yes, and most current methods do exactly this. Common approaches are:

  1. Strategy level: Design rules based on system and business characteristics, such as specific support for long-tail items to forcibly reach more users
  2. Model level: Core idea is to let the model better learn long-tail item representations, because the root cause is insufficient samples for long-tail items, leading to poor model learning. Specific methods are detailed below.

This article mainly introduces papers at the model level, since strategy-level methods often require business-specific rules, while model-level methods are more universal.

阅读全文 »

长尾问题在推荐 / 广告系统是一个较为常见的问题 (这里主要针对 item 的长尾),原因可能比较多,笔者理解的主要原因是由于系统存在 feedback loop (即训练数据由模型产生,同时又会被模型用于训练) 的特性,在没有外部干预的情况下,马太效应会天然导致头部效应的现象比较严重,少部分的 item 主导了整个系统。

比如说推荐系统中,很多视频/文章并没有展示机会,在训练集中压根没出现过,高热的视频/文章在不同的用户中排序都比较靠前,进而得到多次被推荐的机会;在广告系统中,部分计划的消耗会特别高,而一些计划压根投不出去;这导致了用户或者广告主体验不佳,而这种现象往往也会被归为生态问题。

既然没有干预时,系统天然的特性导致了头部效应 (或者说二八效应) 比较严重,那强行干预系统的分布能不能改变这个问题?答案是可以的,而且目前绝大部分的方法都是在做这一类事情,常用手段往往有 2 种

(1)策略层面,根据系统和业务特性设计规则,比如说对长尾的 item 有特定的扶持,强行让这些 item 能触达到更多的用户
(2)模型层面,核心思想就是让模型能更好地学习到 long tail item 的 representation,因为这个问题的根本原因就是 long tail item 的样本过少,进而导致模型学习的不好;而具体的手段比较多,这部分会在后面详细介绍。

这篇文章主要介绍的几篇 paper 都是模型层面的,因为策略层面的往往需要根据实际业务需求来拍一些规则,模型层面的一些方法更为通用。

阅读全文 »

The previous article Dynamic Creative Optimization in Online Display Advertising mentioned that creative optimization can generally be divided into three main parts: creative generation, creative selection, and creative delivery. This article mainly covers some approaches for creative selection, which typically involves an exploration-exploitation (E&E) process.

This article is primarily based on a paper published by Alibaba: A Hybrid Bandit Model with Visual Priors for Creative Ranking in Display Advertising. The paper achieves the goal of ranking candidate creatives under the same campaign (i.e., creative selection) through list-wise training. List-wise can be considered as the exploitation part, while the paper also uses a bandit model for exploration. The overall approach is quite reasonable and has been validated in real-world industry scenarios, making it worth reading.

阅读全文 »

之前的文章 Dynamic Creative Optimization in Online Display Advertising 中提到,广告创意往往可分为创意生成、创意优选和创意投放三大块,本文主要讲创意优选这部分的一些做法,这个过程一般会涉及到 E & E 的过程。

本文的主要内容是选自阿里发表的一篇 paper:A Hybrid Bandit Model with Visual Priors for Creative Ranking in Display Advertising,paper 通过 list-wise 的训练方式达到对同一计划下的候选创意进行排序 (即优选) 的目标;list-wise 可以算作 Exploitation 部分,paper 还通过了一个 bandit model 达到 Exploration 的目的,总体的做法比较合理,也在业界实际场景验证了有效性,值得一看。

阅读全文 »

Recently I’ve been researching creative-related content. Based on current investigation, I divide this field into three main parts: creative generation, creative selection, and creative delivery, with specific responsibilities as follows:

  • Creative generation: Using materials (titles, images, videos, landing pages, etc.) to generate candidate creatives (the ads users see)
  • Creative selection: Selecting top-k creatives from a campaign’s candidates (a campaign typically has multiple candidates) for delivery
  • Creative delivery: Delivering the selected creatives online

Strictly speaking, these three parts are not clearly demarcated. For example, the first two can be unified as creative generation (generating final delivery creatives from raw materials), and the latter two can be unified as creative delivery (selecting from candidates and delivering online).

This article mainly focuses on a paper related to creative delivery, particularly the third part (without E&E-based selection). The paper title is Dynamic Creative Optimization in Online Display Advertising. This paper models the online delivery problem as a bipartite graph matching problem, providing both exact and approximate online solutions. More importantly, this modeling approach is not limited to the creative domain and can be applied to many delivery scenarios.

阅读全文 »

最近在研究广告创意相关内容, 笔者根据当前的调研,将这个领域划分为创意生成、创意优选和创意投放三大块,每一块的具体职责如下

  • 创意生成:利用素材 (标题、图片、视频、落地页等) 生成候选创意 (用户看到的广告)
  • 创意优选:从计划的候选创意 (一个计划下的候选往往有多个) 中选择 topk 个用于投放
  • 创意投放:将优选出来的创意投放至线上

严格来说,这三部分其实也并非泾渭分明,比如前两部分可以统一理解为创意生成 (从最原始的素材生成最终要投放的创意),后两部分可以统一理解为创意投放过程 (从候选中选出来并投放至线上)。

本文主要侧重讲述与创意投放相关的一篇 paper, 而且偏向于上面提到第三块内容 (没有基于 E & E 的优选过程),paper 的标题是 Dynamic Creative Optimization in Online Display Advertising,这篇 paper 将素材在线投放问题建模成一个二部图匹配问题,并提供了严格求解的方法和在线的近似求解方法。更重要的是,这种建模的方法不局限于创意领域,能应用到更多投放场景下。

阅读全文 »

2022 年如期而至,如果说上一年还是在犹豫是否要写年度总结,今年则是早有规划要写一下这一年的总结。因为笔者逐渐意识到,记录过去的自己是一件很有意义的事情,这个话题说大了可以上升到各种哲学领域,但对于笔者来说,最重要的意义是能看到过去的自己是一个什么样的人,如今有了什么样的变化,发生了什么事情让自己有了这样的变化,这种跨度一年的自我觉察还是很有意思的。

而比起 vlog 等形式,笔者更倾向于用文字这种形式来记录,因为在写作过程中,会启动大脑的 “慢系统”,能更细致地去回顾和组织过去发生的事情,正好趁着放假的时间去梳理这一年的各种事情。

阅读全文 »

本文是听了 个人投资课 后的一些笔记,课程主要内容可划分为如下四个部分:市场规律、投资工具、自我局限和投资组合构建,前三个部分主要讲一些投资过程中最容易犯的错误,最后一部分则是讲一些具体的投资方法。

本文是最后一部分的内容,介绍了资产配置的必要性、大类资产基本分类即特点、以及三种经典的资产配置方法。课程前面内容介绍可参考

阅读全文 »
0%