要通过计算机进行自然语言处理,首先就需要将这些文本数字化。目前用得最广泛的方法是词向量,根据训练使用算法的不同,目前主要有 Word2VecGloVe 两大方法,本文主要讲述通过这两个方法分别训练中文维基百科语料库的词向量。

阅读全文 »
0%