《Programming Collective Intelligence》读书笔记 (3)-- 聚类
《Programming Collective Intelligence》(中文名为《集体智慧编程》),是一本关于数据挖掘的书籍,每一章都会通过一个实际的例子来讲述某个机器学习算法,同时会涉及到数据的采集和处理等,是一本实践性很强的书籍。
本文是本书的第三章 Discovering Groups 的读书笔记 , 主要介绍了对文本进行聚类以及对聚类后的结果进行可视化。
《Programming Collective Intelligence》(中文名为《集体智慧编程》),是一本关于数据挖掘的书籍,每一章都会通过一个实际的例子来讲述某个机器学习算法,同时会涉及到数据的采集和处理等,是一本实践性很强的书籍。
本文是本书的第三章 Discovering Groups 的读书笔记 , 主要介绍了对文本进行聚类以及对聚类后的结果进行可视化。
本文转载自 http://www.cnblogs.com/jasonfreak/p/5448462.html, 主要讲述如何通过 sklearn 完成数据挖掘中的一个完整的流程。
本文主要讲述先验概率,后验概率,共轭分布和共轭先验这几个概念。
本文转载自 http://www.cnblogs.com/jasonfreak/p/5448385.html , 在某些部分会拓展补充一些内容,全文主要讲述有关特征工程中通常使用的方法以及在 sklearn 中的相关实现。
本文主要讲述内部网关协议中两个著名的协议 RIP 和 OSPF。
本文主要讲述 IPV6 的一些基础知识,包括 IPV6 的术语,地址,一些基本协议以及从 IPV4 过渡到 IPV6 的的一些技术等。
路由器工作在 IP 层,其作用是根据 IP 地址将数据包传输到正确的目的地,因此路由器必须要知道网络的 “地图” 才能正确投递,而这个网络的 “地图” 就是存储在路由表中的路由规则,简称为路由。
根据获得路由的方式可以将其分为静态路由和动态路由,静态路由就是管理员静态配置的路由,动态路由则是路由器通过算法动态地学习和调整而得到的路由。而常说的路由协议就是指这些动态路由的学习算法,根据其作用域的不同,又可分为内部网管协议 (IGP) 和边界网络协议 (BGP);内部网络协议包括 RIP,OSPF 等,边界网关协议则包括 BGP 等。
本文主要讲述 BGP 相关的一些知识。
组播是介于单播和广播间的一种通信方式,单播是单台源机和单台目的机的通信,广播是单台源机和网络中所有其他主机的通信。而组播则是单台源机和网络中部分主机的通信。本文主要介绍组播中的一些基本概念。
本文为操作系统的课程小结,主要讲述 Linux 内核的一些知识,参考的主要教材为《Linux 内核设计与实现 (第 3 版)》,除此之外还参考了网络上的若干资料,因为 Linux 本来就是可以写若干本书的内容,所以这里只会涉及到博主上课时接触到的一些知识点,由于博主知识有限,个中定存在错漏地方,望不吝指出。
Reducing the Dimensionality of Data with Neural Networks是对深度学习有重要影响的一篇论文,可以说是拉开了深度学习的帷幕,该论文出自 Hinton 大神之手。本文是读了论文后结合其他一些参考资料整理成的读书笔记。