要通过计算机进行自然语言处理,首先就需要将这些文本数字化。目前用得最广泛的方法是词向量,根据训练使用算法的不同,目前主要有 Word2VecGloVe 两大方法,本文主要讲述通过这两个方法分别训练中文维基百科语料库的词向量。

阅读全文 »

Supervisor 是 Linux 下一个进程管理的工具,主要的功能包括让程序自动启动、程序奔溃后自动重启,指定进程的数目等。本文主要讲述 Supervisor 在 Linux 下的安装与使用。

阅读全文 »
0%