吴良超的学习笔记

CentOS下安装python的sklearn模块

sklearn是python的一个机器学习库,封装了很多常用的机器学习算法,在数据挖掘中经常会用到这个库。在MacOS上安装只需要一条命令,可以说是最简单的。在windows下也可以直接安装封装好这些模块的程序如winpython等。但是我在CentOS下的安装可谓痛苦,用pip安装会有各种依赖,用yum解决依赖又会因为支持sklearn的库(如numpy,scipy)版本不够新而导致sklearn无法安装。

最后还是在官方的安装指南中找到了解决方法,所以官方文档真的是非常有参考价值,而且权威性也是很好的。下面说说具体的解决方法。

解决方法实际上是安装一个类似于Windows下winpython的程序,在Linux中就是Anaconda,可以认为Anaconda是封装了python和sklearn等第三方库的一个程序。下面讲一下安装步骤以及注意事项。

安装非常简单:

1.下载安装文件
安装可以选择32位或者64位以及python的版本(提供2.7和3.5),下面下载的是64位的python 2.7 版本的andconda,若要下载其他版本的请移步到https://www.continuum.io/downloads

1
wget https://3230d63b5fc54e62148e-c95ac804525aac4b6dba79b00b39d1d3.ssl.cf1.rackcdn.com/Anaconda2-2.5.0-Linux-x86_64.sh

2.运行安装文件

1
bash Anaconda2-2.5.0-Linux-x86_64.sh

在安装过程中会询问安装的目录,默认是当前目录下创建anaconda2目录,也可以自己在询问时输入指定目录。安装到最后还会问是否要在~/.bashrc中添加环境变量,添加环境变量的作用是为了方便某些命令的输入如python、conda等。连配置环境变量的功夫都省去了。

3.安装第三方模块
因为Anaconda采用了conda作为包管理程序,所以更新或卸载已安装的模块、安装其他模块都可以用conda命令。
conda update scikit-learn可以更新已经安装了的sklearn,conda remove scikit-learn可以卸载已安装的sklearn。conda install可以安装新的第三方模块。简直就是一个加强版的python shell。

到这里安装就结束了,比起之前折腾的一个一个包来安装的要方便得多。