Python数据分析入门之教你怎么搭建环境

2021-08-17 11:18:16 浏览数 (2303)

刚开始学习数据分析的小伙伴,都会在数据分析环境上陷入抉择,是使用python还是matlab?是使用pycharm还是VSCode亦或者是anaconda?今天小编就来告诉你,数据挖掘最好的选择还是anaconda。那么怎么搭建数据分析环境(anaconda)呢?接下来的这篇文章告诉你。

一、Anaconda

Anaconda(水蚺)是一个捆绑了Python、conda、其他相关依赖包的一个软件。包含了180多个可学计算包及其依赖。Anaconda3是集成了Python3的环境,Anaconda2是集成了Python2的环境。Anaconda默认集成的包,是属于内置的Python的包。并且支持绝大部分操作系统(比如:Windows、Mac、Linux等)。下载地址如下:https://www.anaconda.com/distribution/(如果官网下载太慢,可以在清华大学开源软件站中下载:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/)。根据自己的操作系统,下载相应的版本,因为Anaconda内置了许多的包,所以安装过程需要耗费相当长的时间,大家在安装的时候需要耐心等待。在安装完成后,会有以下几个模块:Anaconda prompt、Anaconda Navigator、Spyder、jupyter notebook,以下分别做一些介绍。

二、naconda prompt

Anaconda prompt是专门用来操作anaconda的终端。如果你安装完Anaconda后没有在环境变量的PATH中添加相关的环境变量,那么以后你想在终端使用anaconda相关的命令,则必须要在Anaconda prompt中完成。

anaconda命令行

三、Anaconda Navigator

这个相当于是一个导航面板,上面组织了Anaconda相关的软件。

四、Spyder

一个专门开发Python的软件,熟悉MATLAB的同学会比较有亲切感,但在后期的学习过程中,我们将不会使用这个工具写代码,因为还有更好的可替代的工具。

Spyder

五、jupyter notebook

一个Python编辑环境,可以实时的查看代码的运行效果。

jupyter notebook

使用jupyter notebook的姿势:

1. 先打开Anaconda Prompt,然后进入到项目所在的目录。

2.输入命令jupyter notebook打开jupyter notebook浏览器。

六、conda基本使用

conda伴随着Anaconda安装而自动安装的。conda可以跟virtualenv一样管理不同的环境,也可以跟pip一样管理某个环境下的包。以下来看看两个功能的用法。

环境管理:

conda能跟virtualenv一样管理不同的Python环境,不同的环境之间是互相隔离,互不影响的。为什么需要创建不同的环境呢?原因是有时候项目比较多,但是项目依赖的包不一样,比如A项目用的是Python2开发的,而B项目用的是Python3开发的,那么我们在同一台电脑上就需要两套不同的环境来支撑他们运行了。创建环境的基本命令如下:

shell
# conda create --name [环境名称] 比如以下:
conda create --name da-env

这样将创建一个叫做da-env的环境,这个环境的python解释器根据anaconda来,如果anaconda为3.7,那么将默认使用3.7的环境,如果anaconda内置的是2.7,那么将默认使用2.7的环境。然后你就可以使用conda install numpy的方式来安装包了,并且这样安装进来的包,只会安装在当前环境中。有的同学可能有想问,如果想要装一个Python2.7的环境,anaconda中没有内置Python2.7,那么该怎么实现呢?。实际上,我们只需要在安装的时候指定python的版本,如果这个版本现在不存在,那么anaconda会自动的给我们下载。所以安装Python2.7的环境,使用以下代码即可实现:

conda create --name xxx python=2.7

以下再列出conda管理环境的其他命令:

创建的时候指定需要安装的包:

conda create --name xxx numpy pandas

创建的时候既需要指定包,也需要指定python环境:

conda create --name xxx python=3.6 numpy pandas

进入到某个环境

windows: activate xxx mac/linux: source activate xxx

退出环境:

 deactivate

列出当前所有的环境:

conda env list

移除某个环境:

conda remove --name xxx --all

环境下的包导出和导入:

导出:conda env export > environment.yml。

导入:conda env create --name xxx -f environment.yml。

包管理:

conda也可以用来管理包。比如我们创建完一个新的环境后,想要在这个环境中安装包(比如numpy),那么可以通过以下代码来实现:

conda remove --name xxx --all

以下再介绍一些包管理常用的命令:

在不进入某个环境下直接给这个环境安装包:

conda remove --name xxx --all

列出该环境下所有的包:

 conda list

卸载某个包:

 conda remove [包名]

设置安装包的源:

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ 
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ 
conda config --set show_channel_urls yes

到此这篇怎么搭建数据分析环境的文章就介绍到这了,更多数据分析的学习内容请搜索W3Cschool以前的文章或继续浏览下面的相关文章。