因《得意忘形》播客认识张潇雨老师,从中听到了不少令人耳目一新的观点,后来发现张老师还是一名对冲基金经理,在得到上有一门课: 个人投资课,总体听下来,将笔者断断续续学习过的一些投资方面的知识串了起来,值得写一篇文章记录一下。

内容总体可分为两大部分:基本投资原则和具体的方法论,课程在讲解过程中将其划分为如下四个部分:市场规律、投资工具、自我局限和投资组合构建,前三个部分主要讲一些投资过程中最容易犯的错误,最后一部分则是讲一些具体的投资方法。本文主要是市场规律部分相关内容,同时简单介绍了个人投资者现对于专业投资者的一些优势与劣势。

阅读全文 »

一直觉得从不同视角去看事情,往往能有更全面的了解,也能得出一些更有趣的结论。因此,习惯了从 rd 视角去看商业化广告,老早就想从产品 / 运营 / 销售的视角去看这个事情,最近正好找到关于商业化产品经理的一门课,即《商业产品经理的实战修炼》,虽然是几年前的课程,但是其中一些内容放到今天也是值得参考的,也让笔者对商业产品有了进一步的理解。

课程里主要讲了四大部分内容 (其实是五章,但是因为对广告进阶这部分比较熟悉,所以略过了这部分):商业产品的定义及演进、商业产品经理的职责与方法论、有效的商业产品需求、商业产品从 0 到 1,下文也是按照这四部分展开,内容经过梳理且只摘录了笔者比较关心的一些内容,推荐看原视频。

阅读全文 »

本文是《认知红利》下半部分内容的笔记 (书里的上半部分的内容可参考《认知红利》阅读笔记 (1)- 概念重塑),这里的 “大脑升级” 采用的是原书的大标题,简单来说就是这部分内容侧重方法论,主要介绍了一些分析问题、解决问题的思维方式,具备一定的实践意义,本文记录了对笔者而言印象比较深刻的观点,推荐读一下原书。

阅读全文 »

最近在看《认知红利》,提到认知,笔者第一时间想到的是认知的四个阶段:不知道自己不知道 -> 知道自己不知道 -> 知道自己知道 -> 不知道自己知道;以及《三体》里那句有名的 “弱小和无知不是生存的障碍,傲慢才是”,而笔者觉得傲慢的原因正是因为 “不知道自己不知道” 且不愿意去了解,如同井底之蛙一样的看不到更先进的技术,一如闭关锁国的清末,三体里被水滴几乎团灭的人类太空舰队。

回到这本书,可以说是在解决 “不知道自己不知道” 的问题,而且书里不仅提供了鸡汤,还提供了勺子 (即方法论)。虽然这本书在豆瓣上褒贬不一,诟病之处无非是这本 “借鉴” 了很多其他作品;但是对笔者这种看不懂那些晦涩的大部头、时间不多的 “打工人” 来说,也不失为一种较好的选择,因为这本书可以说是对其他一些作品里的内容的提炼。整本书可分为两大部分:概念重塑和大脑升级,前者主要是概念重构,后者则侧重方法论。本文主要与概念重塑相关,而且只记录了对笔者而言印象比较深刻的观点,推荐读一下原书。

阅读全文 »

最近在找资料的时候意外发现一个与快速阅读相关的干货,就是在得到这个 app 上的一门课《怎样成为快速阅读的高手》,里面介绍了快速阅读的一个比较系统的方法论,总结来说就是阅读三步法:评测、速读和精读。笔者对其中的不少观点有共鸣,因此在本文摘录一些印象深刻的地方,推荐去听原始的课程,也许会有更大收获,也算是支持一下课程的作者。

阅读全文 »

从实习到工作,接触过一些大大小小的广告系统,有麻雀虽小但五脏俱全的小 dsp,也有把 ssp、adx、dsp 都打包了的大媒体 ,算是对业界的广告系统有了一个初步的了解。趁着五一放假这几天,简单地梳理一下当前了解到的广告系统知识,主要是想对零散的知识做个整理,由于广告系统这个概念非常的大,涉及到的部分非常的多,无法面面俱到,所以本文主要是从几个视角(技术、业务、产品)言简意赅的描述一下笔者比较关心的几个部分,中间内容可能不全,欢迎交流指正。

特意声明,本文内容与笔者雇主无关,主要是基于笔者当前的认知梳理的内容;在撰写过程中只会引用公开的内容,不会涉及到笔者雇主内部未公开的信息;如相关同学觉得有敏感内容,可联系删除。而其实在崇尚开源、paper 漫天飞、人员流动越来越快的如今,笔者觉得这些通用技术并不是最核心的地方,数据 + 对业务的理解 + 灵活组装这些通用的技术才是。

阅读全文 »

机器学习本质上是在学习数据的分布,其有效性的假设是模型 training 和 serving 时的数据是独立同分布 (Independent and Identically Distributed, IID) 的,但是在实际应用中,由于采样有偏、具体场景等约束, training 的样本与 serving 时的样本并不是 IID 的。在广告场景下,最典型的就是训练 cvr 模型时,训练样本都是 post clicked 的,但是 serving 时,cvr 模型面临的是所有被召回的样本;这类问题也被称为 exposure bias 或 sample selection bias,除了 exposure bias,position bias 等也是常见的 bias。

本文首先会简单介绍一些机器学习中的常见 bias,并着重介绍上面提到的 exposure bias (也叫 sample selection bias) 的在当前的一些解决思路, 笔者将其总结为 Data Augmentation、IPS 和 Domain Adaption 三大类方法。

阅读全文 »

很久没更新技术文章了,草稿箱里还有几篇半成品一直被我以工作日事情太多、周六日需要休息为由 delay 了好几周;而现在站在 2021 年的起点,望着 2020 年的尾巴,不禁感慨一年就这么呲溜一下就过去了,总想写点东西来复盘一下 2020 这一年,还记得上次写的这种年度总结的文章是 2017 小结,那会还在上研一,现在回看这篇文章还是略有感慨,还是比较佩服当年那个充满激情与精力、对各种知识都充满好奇的自己;趁着元旦放假有空这几天,还是决定简单地对 2020 年做个总结,几年后再回头看看,或许会有不同的感悟。

阅读全文 »

转化是有延迟的,即在点击发生后过一段时间用户可能才会发生转化,且往往转化漏斗越深,延迟的时间越长;在计算广告中,delayed feedback 主要影响下面两个场景

  1. CVR 模型的训练
  2. 基于后验的调价策略

对于场景 1,影响体现在(1)过早把样本送入模型,把最终会转化但是还没回传 label 的事件当做负例,导致模型低估(2)过晚把样本送入模型,即让所有样本都等待一个足够长的时间才送入模型,导致模型没能及时更新

对于场景 2,影响体现控制器控制 cost/value=target 时,分母会小于实际值,导致控制的不稳定

本文主要介绍三篇 paper 针对这个问题在场景 1 的一些解决思路,其中涉及到的一些方法也能应用到场景 2 中(而如果问题 1 能被较好地解决,也能基于预估值而不是后验数据进行调价)

阅读全文 »

本文是 程序的表示、转换与链接 中第 10、11 周的内容,主要介绍了从源文件生成可执行文件的步骤 (预处理、编译、汇编、链接),并详细描述了其中的链接这一步骤中的两大过程:符号解析与重定位,并对比了链接输入的可重定位目标文件和输出的可执行目标文件的差别;对了解文件的从编译到执行原理有一定帮助,可配合 《链接、装载与库》 阅读笔记 一起阅读。

阅读全文 »
0%