干货 | 深度学习环境搭建（入门篇）

admin

102322
文章

87
评论

2022年6月22日12:24:18评论38 views字数 6508阅读21分41秒阅读模式

与其相忘于江湖，不如点击“蓝字”关注

本文作者——肖何

插播广告：

肖老师的【大数据高薪就业班】即将开启，快乐学习模式，超强实战项目，一对一深度辅导，100%高薪就业，还等什么，点击阅读原文申请试听吧！关注大数据学习，关注e安在线！

我是干货开始的分割线

机器学习是人工智能最热门的领域之一。作为学习爱好者，尝试管中窥豹，看看如何下手吧。

（1）硬件配置（电脑主机）

GPU：
高配版/ Titan X （建议3~4块）

经济版/ GTX 1080/Ti

版本对比：

硬盘SSD：
高配版/ EVO 2T （建议2块=4T）

经济版/ EVO 500G/1T

主板：
高配版/ X99A SLI PLUS （4块显卡）

经济版/ X99A Ultra （2块显卡）

CPU
高配版/i7-7700k

经济版/i5-7600k

机箱/电源
高配版/水冷

经济版/组合

总结：

1套高配版：~55K
1套经济版：~26K

（2）软件配置（Linux+软件框架）

操作系统

Ubuntu 16.04 LTS

软件

Anaconda(对应Python 3.6扩展版)－Anaconda是一个性能非常强大的Python发行版本，包含了100多个数据科学适用的Python,R语言和Scala的热门安装包。
R－用于统计计算和统计绘图的语言和操作环境
Scala －Scala全称为Scalable Language，是一门类似于JAVA而且性能极佳的的模块化语言。
Jupyter－编程代码的web应用程序，便于用户共享文档并且支持实时代码。

驱动
* Nvidia驱动程序
* CUDA－一种由Nvidia推出的通用并行计算架构和应用程序编程接口模型。
* cuDNN－一套Nvidia专门为深度神经网络设计的GPU计算加速库。

深度学习框架/库
* TensorFlow－谷歌的开源DL框架，可以说支撑起了部分产品，比如谷歌翻译。
* Theano－一个靠谱而且受欢迎的机器学习框架。
* Caffe－来自伯克利的深度学习框架。
* Torch－一个GPU优先的科学计算框架，广泛支持机器学习算法。
* MXNET－可扩展性极强的DL系统，得到了亚马逊和一些大学的支持。
* Keras－一个很棒的用Python语言编写的神经网络库，基于TensorFlow或Theano开发
* Lasagne－用于构造和训练神经网络的轻量库。

python库
* Pip＝Python安装包管理工具
* Pandas＝高性能数据分析库
* Scikit-learn ＝强大机器学习库
* Numpy＝Python的一种开源的数字扩展
* Matplotlib＝可视化库（注：Python的2D绘图库）
* Scipy＝数值计算库
* IPython ＝交互式Python
* Scrappy＝网络数据爬取框架
* NLTK＝自然语言工具箱
* Pattern＝网络挖掘库
* Seaborn＝统计数据可视化
* OpenCV＝计算机视觉库
* Rpy2＝R语言接口
* Py-graphviz＝统计数据绘图
* OpenBLAS ＝线性代数库

（3）环境配置(如何搭建环境 )

开机启动
安装操作系统（UEFI）

驱动问题
打开最新的Nvidia驱动，然后reboot：
* 登陆TTY中的root账号
* 运行 sudo apt-get purge nvidia-*
* 运行 sudo add-apt-repository ppa:graphics-drivers/ppa
* sudo apt-get update
* 运行sudo apt-get install nvidia-375
* Reboot，这时图像的问题应该就解决了。

系统升级
sudo apt-get update -y
sudo apt-get upgrade -y
sudo apt-get install -y build-essential cmake g++ gfortran git pkg-config python-dev software-properties-common wget
sudo apt-get autoremove
sudo rm -rf /var/lib/apt/lists/*

CUDA
>
从英伟达官网上下载CUDA 8安装包，打开下载目录然后安装好CUDA。
sudo dpkg -i cuda-repo-ubuntu1604-8-0-local.deb
sudo apt-get update -y
sudo apt-get install -y cuda
加载CUDA为环境变量

echo ‘export PATH=/usr/local/cuda/bin:$PATH’ >> ~/.bashrc
echo ‘export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH’ >> ~/.bashrc
source ~/.bashrc

检查以确认安装的CUDA版本正确：

nvcc –V
重启电脑：
sudo shutdown -r now
检查CUDA安装情况
首先，安装CUDA样本：

/usr/local/cuda/bin/cuda-install-samples-*.sh ~/cuda-samples
cd ~/cuda-samples/NVIDIA*Samples
make -j $(($(nproc) + 1))

然后在命令结果上做记录，用+1表示电脑所具有的GPU数量，如果出现多于一个的情况，只要把数字加上去就可以了，这样不论是安装还是编译，速度都会快上很多。
接着运行deviceQuery并确保显卡的情况能够顺利被检测，还要保证测试被通过：
bin/x86_64/linux/release/deviceQuery

cuDNN
cuDNN是DNN的GPU加速库，不幸的是，你没办法从repo里下一个，要在Nvidia上注册并申请获得许可，点击此链接前往申请。等待获批的时间少则几个小时，多则几天，拿到许可之后请下载版本4或5，在这个教程中我安装的是版本5。
进行下一步之前，请耐心等待直到装好cuDNN为止，否则其他以cuDNN为基础的框架可能会安装失败。
提取并复制文件：
cd ~/Downloads/
tar xvf cudnn*.tgz
cd cuda
sudo cp /.h /usr/local/cuda/include/
sudo cp /libcudnn /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
输入以下代码以做检查：
nvidia-smi
顺利的话，计算机会输出一些GPU数据。

Python
sudo apt-get install -y python-pip python-dev
sudo apt-get update && apt-get install -y python-numpy python-scipy python-nose python-h5py python-skimage python-matplotlib python-pandas python-sklearn python-sympy libfreetype6-dev libpng12-dev libopenjpeg5
sudo apt-get clean && sudo apt-get autoremove
rm -rf /var/lib/apt/lists/*
现在通过Pip（安装包工具）将其余库安装完毕
pip install seaborn rpy2 opencv-python pygraphviz pattern nltk scrappy

Tensorflow
$ sudo pip install –upgrade https://storage.googleapis.com/tensorflow/linux/cpu/tensorflow-0.8.0-cp27-none-linux_x86_64.whl

$ python
...
>>> import tensorflow as tf
>>> hello = tf.constant('Hello, TensorFlow!')
>>> sess = tf.Session()
>>> print(sess.run(hello))
Hello, TensorFlow!
>>> a = tf.constant(10)
>>> b = tf.constant(32)
>>> print(sess.run(a + b))
42
>>>

OpenBLAS
sudo apt-get install -y libblas-test libopenblas-base libopenblas-dev

Jupyter
pip install -U ipython[all] jupyter

Theano
sudo apt-get install -y python-numpy python-scipy python-dev python-pip python-nose g++ python-pygments python-sphinx python-nose
sudo pip install Theano

python
>>> import theano
>>> exit()
nosetests theano

Keras
sudo pip install keras

Lasagne
pip install -r https://raw.githubusercontent.com/Lasagne/Lasagne/v0.1/requirements.txt

Python安装MXNet
克隆MXNet的库，在终端运行以下命令(没有”sudo”)
git clone https://github.com/dmlc/mxnet.git ~/mxnet –recursive
我们在使用GPU，所以要加入一些配置到config.mk file中去。
cd ~/mxnet
cp make/config.mk .
echo “USE_CUDA=1” >>config.mk
echo “USE_CUDA_PATH=/usr/local/cuda” >>config.mk
echo “USE_CUDNN=1” >>config.mk
添加到路径：
source ~/.bashrc

R语言安装MXNet
我们之后会用到R语言的，所以现在就一起装了吧。点击链接跳转至R语言适用的MXNet的安装脚本。在设置好R语言之后下面的这些步骤可以调用脚本。

首先添加R repo:
sudo echo “deb http://cran.rstudio.com/bin/linux/ubuntu xenial/” | sudo tee -a /etc/apt/sources.list
其次把R添加到Ubuntu Keyring:
gpg — keyserver keyserver.ubuntu.com — recv-key E084DAB9
gpg -a — export E084DAB9 | sudo apt-key add –
然后安装R-Base：
sudo apt-get install r-base r-base-dev
再安装R-Studio(如果版本号不同要修改命令)
sudo apt-get install -y gdebi-core
wget https://download1.rstudio.org/rstudio-0.99.896-amd64.deb
sudo gdebi -n rstudio-0.99.896-amd64.deb
rm rstudio-0.99.896-amd64.deb
最后安装R 适用的MXNet :
cd ~/mxnet/setup-utils
bash install-mxnet-ubuntu-r.sh

Caffe安装前提：
sudo apt-get install -y libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler
sudo apt-get install -y –no-install-recommends libboost-all-dev
sudo apt-get install -y libgflags-dev libgoogle-glog-dev liblmdb-dev
克隆Caffe repo:
cd ~/git

git clone https://github.com/BVLC/caffe.git

cd caffe
cp Makefile.config.example Makefile.config
在Makefile中用cuDNN

设置参数: USE_CUDNN := 1 :
sed -i ‘s/# USE_CUDNN := 1/USE_CUDNN := 1/‘ Makefile.config
修改BLAS的open参数值：
sed -i ‘s/BLAS := atlas/BLAS := open/’ Makefile.config
安装好所需的东西，然后构建Caffe，构建测试并确保顺利通过所有测试。记住这些工作将花费一些时间。另外再次记住+1表示构造Caffe 所需GPU的数量，数量超过一个的时候要加上去。
sudo pip install -r python/requirements.txt
make all -j (nproc) + 1))
make test -j (nproc) + 1))
make runtest -j (nproc) + 1))
搭建PyCaffe，Python到Caffe的接口
make pycaffe -j (nproc) + 1))
加载Caffe为环境变量

echo ‘export CAFFE_ROOT=$(pwd)’ >> ~/.bashrc
echo ‘export PYTHONPATH=$CAFFE_ROOT/python:$PYTHONPATH’ >> ~/.bashrc
source ~/.bashrc

测试以确认Caffe安装成功。要是成功的话在执行输入命令的时候不会有任何警告和错误：
ipython

import caffe
exit()

Torch
git clone https://github.com/torch/distro.git ~/git/torch — recursive
cd torch; bash install-deps;
./install.sh

Scala
sudo apt-get -y install scala

Anaconda
下载 Anaconda for Python 3.6 ，同时也提供2.7.x版本选择。
安装：
sudo bash Anaconda3–4.3.0-Linux-x86_64.sh
此外，Anaconda支持用户创造版本之间灵活切换的环境。
让我们创建两个Anaconda环境:
conda create -n py2 python=2.7
conda create -n py3 python=3.6
激活py3的环境：
source activate py3
source activate py3
完成所有包的安装：
conda install pip pandas scikit-learn scipy numpy matplotlib ipython-notebook seaborn opencv scrappy nltk pattern
然后通过pip安装Conda（Anaconda的管理工具）内不提供的pygraphviz和R语言桥：
pip install pygraphviz rpy2
Reboot:
sudo shutdown -r now

Anaconda安装Tensorflow, Theano, 和 Keras
你要给Python 2和3两个版本的Anaconda安装这些库，他们自带性能最优化，所以用这些Anaconda支持的库能获得更好的效果。
让我们从Python 3开始:
source activate py3
pip install tensorflow Theano keras
接着休眠Python 3，激活py2环境。
source deactivate
激活py2环境：
source activate py2
给py2安装:
pip install tensorflow Theano keras
休眠环境：
source deactivate

OK，今天关于深度学习环境如何搭建就介绍到这里。请大家继续关注，下期更精彩！

PS: 肖老师何许人也？且听下回分解！

干货 | 深度学习环境搭建（入门篇）

END

更多资讯请点击“阅读原文”

原文始发于微信公众号（e安在线）：干货 | 深度学习环境搭建（入门篇）

左青龙
微信扫一扫

右白虎
微信扫一扫

干货 | 深度学习环境搭建（入门篇）

【资料】美国海军研究实验室：未来25年25项关键技术展望

【公益译文】《后量子密码技术》报告

【暗网必备】Tor网络的私密性和安全性如何?

NSFOCUS旧友记我有故事、你有酒吗？(2)

新瓜速递微软最新RCE?!

网安众生相【三十七】关于工作选择

十条工作思路

Linux Shell基础详解

如何构建内网域名系统

科技十大黄金法则，对网络安全也适用吗？

发表评论

在线咨询

微信