吴良超的学习笔记


  • 首页

  • 标签

  • 归档

  • 关于

  • 站内搜索
close
吴良超的学习笔记

Long Tail Problem In Item Recommendation

发表于 2022-04-04 | 计算广告

长尾问题在推荐/广告系统是一个较为常见的问题(这里主要针对 item 的长尾),原因可能比较多,笔者理解的主要原因是由于系统存在 feedback loop(即训练数据由模型产生,同时又会被模型用于训练) 的特性,在没有外部干预的情况下,马太效应会天然导致头部效应的现象比较严重,少部分的 item 主导了整个系统。

比如说推荐系统中,很多视频/文章并没有展示机会,在训练集中压根没出现过,高热的视频/文章在不同的用户中排序都比较靠前,进而得到多次被推荐的机会;在广告系统中,部分计划的消耗会特别高,而一些计划压根投不出去;这导致了用户或者广告主体验不佳,而这种现象往往也会被归为生态问题。

既然没有干预时,系统天然的特性导致了头部效应(或者说二八效应)比较严重,那强行干预系统的分布能不能改变这个问题?答案是可以的,而且目前绝大部分的方法都是在做这一类事情,常用手段往往有 2 种

(1)策略层面,根据系统和业务特性设计规则,比如说对长尾的 item 有特定的扶持,强行让这些 item 能触达到更多的用户
(2)模型层面,核心思想就是让模型能更好地学习到 long tail item 的 representation,因为这个问题的根本原因就是 long tail item 的样本过少,进而导致模型学习的不好;而具体的手段比较多,这部分会在后面详细介绍。

这篇文章主要介绍的几篇 paper都是模型层面的,因为策略层面的往往需要根据实际业务需求来拍一些规则,模型层面的一些方法更为通用。

阅读全文 »
吴良超的学习笔记

A Hybrid Bandit Model with Visual Priors for Creative Ranking in Display Advertising

发表于 2022-03-05 | 计算广告

之前的文章 Dynamic Creative Optimization in Online Display Advertising中提到,广告创意往往可分为创意生成、创意优选和创意投放三大块,本文主要讲创意优选这部分的一些做法,这个过程一般会涉及到 E&E 的过程。

本文的主要内容是选自阿里发表的一篇 paper:A Hybrid Bandit Model with Visual Priors for Creative Ranking in Display Advertising,paper 通过 list-wise 的训练方式达到对同一计划下的候选创意进行排序(即优选)的目标;list-wise 可以算作 Exploitation 部分,paper 还通过了一个 bandit model 达到 Exploration 的目的,总体的做法比较合理,也在业界实际场景验证了有效性,值得一看。

阅读全文 »
吴良超的学习笔记

Dynamic Creative Optimization in Online Display Advertising

发表于 2022-02-01 | 计算广告

最近在研究广告创意相关内容, 笔者根据当前的调研,将这个领域划分为创意生成、创意优选和创意投放三大块,每一块的具体职责如下

  • 创意生成:利用素材(标题、图片、视频、落地页等)生成候选创意(用户看到的广告)
  • 创意优选:从计划的候选创意(一个计划下的候选往往有多个)中选择 topk 个用于投放
  • 创意投放:将优选出来的创意投放至线上

严格来说,这三部分其实也并非泾渭分明,比如前两部分可以统一理解为创意生成(从最原始的素材生成最终要投放的创意),后两部分可以统一理解为创意投放过程(从候选中选出来并投放至线上)。

本文主要侧重讲述与创意投放相关的一篇 paper, 而且偏向于上面提到第三块内容(没有基于 E&E 的优选过程),paper 的标题是 Dynamic Creative Optimization in Online Display Advertising,这篇 paper 将素材在线投放问题建模成一个二部图匹配问题,并提供了严格求解的方法和在线的近似求解方法。更重要的是,这种建模的方法不局限于创意领域,能应用到更多投放场景下。

阅读全文 »
吴良超的学习笔记

2021 小结

发表于 2022-01-03 | 闲话几句

2022 年如期而至,如果说上一年还是在犹豫是否要写年度总结,今年则是早有规划要写一下这一年的总结。因为笔者逐渐意识到,记录过去的自己是一件很有意义的事情,这个话题说大了可以上升到各种哲学领域,但对于笔者来说,最重要的意义是能看到过去的自己是一个什么样的人,如今有了什么样的变化,发生了什么事情让自己有了这样的变化,这种跨度一年的自我觉察还是很有意思的。

而比起 vlog 等形式,笔者更倾向于用文字这种形式来记录,因为在写作过程中,会启动大脑的“慢系统”,能更细致地去回顾和组织过去发生的事情,正好趁着放假的时间去梳理这一年的各种事情。

阅读全文 »
吴良超的学习笔记

张潇雨的个人投资课(3)-投资组合构建

发表于 2021-11-28 | 拾人牙慧 , 投资

本文是听了 个人投资课 后的一些笔记,课程主要内容可划分为如下四个部分:市场规律、投资工具、自我局限和投资组合构建,前三个部分主要讲一些投资过程中最容易犯的错误,最后一部分则是讲一些具体的投资方法。

本文是最后一部分的内容,介绍了资产配置的必要性、大类资产基本分类即特点、以及三种经典的资产配置方法。课程前面内容介绍可参考

  • 张潇雨的个人投资课(1)-市场规律
  • 张潇雨的个人投资课(2)-投资工具与自我局限
阅读全文 »
吴良超的学习笔记

张潇雨的个人投资课(2)-投资工具与自我局限

发表于 2021-11-20 | 拾人牙慧 , 投资

本文是听了 个人投资课 后的一些笔记, 课程主要内容可划分为如下四个部分:市场规律、投资工具、自我局限和投资组合构建,前三个部分主要讲一些投资过程中最容易犯的错误,最后一部分则是讲一些具体的投资方法。

本文是第二部分和第三部分的内容,主要介绍了在投资过程中对一些投资产品的误解,以及投资过程中的一些自我局限。课程第一部分的内容介绍可参考 张潇雨的个人投资课(1)-市场规律

阅读全文 »
吴良超的学习笔记

张潇雨的个人投资课(1)-市场规律

发表于 2021-11-14 | 拾人牙慧 , 投资

因《得意忘形》播客认识张潇雨老师,从中听到了不少令人耳目一新的观点,后来发现张老师还是一名对冲基金经理,在得到上有一门课: 个人投资课,总体听下来,将笔者断断续续学习过的一些投资方面的知识串了起来,值得写一篇文章记录一下。

内容总体可分为两大部分:基本投资原则和具体的方法论,课程在讲解过程中将其划分为如下四个部分:市场规律、投资工具、自我局限和投资组合构建,前三个部分主要讲一些投资过程中最容易犯的错误,最后一部分则是讲一些具体的投资方法。本文主要是市场规律部分相关内容,同时简单介绍了个人投资者现对于专业投资者的一些优势与劣势。

阅读全文 »
吴良超的学习笔记

《商业产品经理的实战修炼》学习笔记

发表于 2021-10-30 | 计算广告

一直觉得从不同视角去看事情,往往能有更全面的了解,也能得出一些更有趣的结论。因此,习惯了从 rd 视角去看商业化广告,老早就想从产品/运营/销售的视角去看这个事情,最近正好找到关于商业化产品经理的一门课,即《商业产品经理的实战修炼》,虽然是几年前的课程,但是其中一些内容放到今天也是值得参考的,也让笔者对商业产品有了进一步的理解。

课程里主要讲了四大部分内容(其实是五章,但是因为对广告进阶这部分比较熟悉,所以略过了这部分):商业产品的定义及演进、商业产品经理的职责与方法论、有效的商业产品需求、商业产品从0 到 1,下文也是按照这四部分展开,内容经过梳理且只摘录了笔者比较关心的一些内容,推荐看原视频。

阅读全文 »
吴良超的学习笔记

《认知红利》阅读笔记(2)-大脑升级

发表于 2021-10-05 | 拾人牙慧

本文是《认知红利》下半部分内容的笔记(书里的上半部分的内容可参考《认知红利》阅读笔记(1)-概念重塑),这里的“大脑升级”采用的是原书的大标题,简单来说就是这部分内容侧重方法论,主要介绍了一些分析问题、解决问题的思维方式,具备一定的实践意义,本文记录了对笔者而言印象比较深刻的观点,推荐读一下原书。

阅读全文 »
吴良超的学习笔记

《认知红利》阅读笔记(1)-概念重塑

发表于 2021-08-22 | 拾人牙慧

最近在看《认知红利》,提到认知,笔者第一时间想到的是认知的四个阶段:不知道自己不知道 -> 知道自己不知道 -> 知道自己知道 -> 不知道自己知道;以及《三体》里那句有名的 “弱小和无知不是生存的障碍,傲慢才是”,而笔者觉得傲慢的原因正是因为“不知道自己不知道”且不愿意去了解,如同井底之蛙一样的看不到更先进的技术,一如闭关锁国的清末,三体里被水滴几乎团灭的人类太空舰队。

回到这本书,可以说是在解决“不知道自己不知道”的问题,而且书里不仅提供了鸡汤,还提供了勺子(即方法论)。虽然这本书在豆瓣上褒贬不一,诟病之处无非是这本“借鉴”了很多其他作品;但是对笔者这种看不懂那些晦涩的大部头、时间不多的“打工人”来说,也不失为一种较好的选择,因为这本书可以说是对其他一些作品里的内容的提炼。整本书可分为两大部分:概念重塑和大脑升级,前者主要是概念重构,后者则侧重方法论。本文主要与概念重塑相关,而且只记录了对笔者而言印象比较深刻的观点,推荐读一下原书。

阅读全文 »
12…24
良超

良超

工程师要把合适的技术放在合适的位置|算法工程师首先得是个工程师

237 日志
43 标签
RSS
GitHub Linkedin E-mail
© 2015 - 2022   |  Powered by Hexo and NexT
Documentation Licensed Under CC BY 4.0