Forecasting High-Dimensional Data》 是 Yahoo! 一篇关于流量预估的论文。在合约广告中,需要提前预估某个定向下的流量情况,从而进行合理的售卖和分配。但是由于定向的组合非常多(广告主的多样的需求导致的),而工程上不允许为每个可能的定向预估其流量,因此这篇论文提出了先预估一些基本定向的流量,然后通过 correlation model 从基本定向的流量计算出各种定向下的流量情况,具有较强的工程性,也是之前提到的文章 《Budget Pacing for Targeted Online Advertisements at LinkedIn》 中采用的流量预估方法。

阅读全文 »

本文主要是 Code Complete 中创建高质量的代码部分的的两章笔记:第 8 章(防范式编程)、第 9 章(伪代码编码过程),介绍了如何进行防范式编程(defensive programming),即保护程序免遭非法输入数据的破坏,目的其实就是增强程序的鲁棒性;同时介绍了如何通过伪代码编码方法来创建类和子程序。

阅读全文 »

最近在看 Code Complete(中文译作代码大全),一本关于代码构建的书。虽然研究生阶段做的东西与算法结合比较紧密,找工作的岗位也叫算法工程师,但是始终觉得算法工程师首先也得是个工程师,而不应该仅仅是调参师,因此一些基本的工程能力还是不可或缺的。本文主要是创建高质量的代码部分的的两章笔记:第 6 章(可以工作的类)、第 7 章(高质量的子程序),主要给出了在构建类和子程序过程中的一些建议。

阅读全文 »

统一规范的代码风格在团队协作中非常重要,在若干的风格标准中,Google C++ Style 又是较为被认可的,本文是阅读了 Google C++ Style Guide 中第六 (命名约定)、七 (注释)、八 (格式) 章后的一些笔记,主要涉及代码的一些基本规范。需要注意的是,各种规范之间并没有绝对的好坏之分,只要团队保持一致即可。

阅读全文 »

ROC 曲线和 PR 曲线是评估机器学习算法性能的两条重要曲线,两者概念比较容易混淆,但是两者的使用场景是不同的。本文主要讲述两种曲线的含义以及应用的场景。

阅读全文 »

python 的 format 函数能够对输出做格式化从而使得符合输出的要求,这里记录其一些常见用法,主要参考了博客 飘逸的 python - 增强的格式化字符串 format 函数

阅读全文 »

在之前的文章 强化学习笔记 (2)- 从 Q-Learning 到 DQN 中,我们已经知道 Q-Learning 系列方法是基于 value 的方法, 也就是通过计算每一个状态动作的价值,然后选择价值最大的动作执行。这是一种间接的做法,那有没有更直接的做法呢?有!那就是直接更新策略。本文要介绍的 Policy Gradient 就是这类 policy-based 的方法, 除此之外,还会介绍结合了 policy-based 和 value-based 的 Actor-Critic 方法,以及在 Actor-Critic 基础上的 DDPG、A3C 方法。

阅读全文 »
0%