CentOS 下安装 python 的 sklearn 模块

sklearn 是 python 的一个机器学习库,封装了很多常用的机器学习算法,在数据挖掘中经常会用到这个库。在 MacOS 上安装只需要一条命令,可以说是最简单的。在 windows 下也可以直接安装封装好这些模块的程序如 winpython 等。但是我在 CentOS 下的安装可谓痛苦,用 pip 安装会有各种依赖,用 yum 解决依赖又会因为支持 sklearn 的库(如 numpy,scipy)版本不够新而导致 sklearn 无法安装。

最后还是在官方的安装指南中找到了解决方法,所以官方文档真的是非常有参考价值,而且权威性也是很好的。下面说说具体的解决方法。

解决方法实际上是安装一个类似于 Windows 下 winpython 的程序,在 Linux 中就是 Anaconda, 可以认为 Anaconda 是封装了 python 和 sklearn 等第三方库的一个程序。下面讲一下安装步骤以及注意事项。

安装非常简单:

1. 下载安装文件
安装可以选择 32 位或者 64 位以及 python 的版本(提供 2.7 和 3.5),下面下载的是 64 位的 python 2.7 版本的 andconda,若要下载其他版本的请移步到 https://www.continuum.io/downloads

1
wget https://3230d63b5fc54e62148e-c95ac804525aac4b6dba79b00b39d1d3.ssl.cf1.rackcdn.com/Anaconda2-2.5.0-Linux-x86_64.sh  

2. 运行安装文件

1
bash Anaconda2-2.5.0-Linux-x86_64.sh  

在安装过程中会询问安装的目录,默认是当前目录下创建 anaconda2 目录,也可以自己在询问时输入指定目录。安装到最后还会问是否要在~/.bashrc 中添加环境变量,添加环境变量的作用是为了方便某些命令的输入如 python、conda 等。连配置环境变量的功夫都省去了。

3. 安装第三方模块
因为 Anaconda 采用了 conda作为包管理程序,所以更新或卸载已安装的模块、安装其他模块都可以用 conda 命令。
conda update scikit-learn 可以更新已经安装了的 sklearn,conda remove scikit-learn 可以卸载已安装的 sklearn。conda install 可以安装新的第三方模块。简直就是一个加强版的 python shell。

到这里安装就结束了,比起之前折腾的一个一个包来安装的要方便得多。