![Python数据分析入门:从数据获取到可视化](https://wfqqreader-1252317822.image.myqcloud.com/cover/536/23914536/b_23914536.jpg)
1.1.1 在Ubuntu系统下搭建Python集成开发环境
1.Anaconda(Spyder)安装与配置
Ubuntu是自带Python环境的(Python 2),按下快捷键[Ctrl + Alt + T](或者在桌面空白处单击右键,在弹出的快捷菜单中选择“open terminal”命令)打开终端,输入python即可,如图1-1所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0011_0001.jpg?sign=1739193422-rICmzV5HW6PbhZWfzCZY3GA5YCB2sKBL-0-a6ee5d88ff0d4fc86a4849aec3630f11)
图1-1
由于我们学习的是Python 3,所以将使用Anaconda完成Python 3的环境配置。
“Anaconda是用于大规模数据处理、预测分析和科学计算的Python和R编程语言的免费平台,旨在简化包管理和部署”。第三方库的安装对于初学者来说可能是一件比较头疼的事,但是它集成了很多用于数据处理和科学计算的第三方库,使得我们不用额外再去安装。同时,Anaconda提供了强大的安装包管理功能,这点会在后面详细介绍。Anaconda还自带一款十分优秀的编辑器——Spyder,它的界面和使用方法与MATLAB和RStudio十分相像,其特点在于中间变量的储存。下面介绍具体的安装步骤。
注意:下面的命令均是在终端执行的,并且要根据需要切换到特定目录后再执行对应的命令。此外随着版本的更新,下载文件的文件名可能会改变,请读者仔细查看并在必要时对命令做出修改。
首先,进入Anaconda官网(https://www.anaconda.com/download)下载对应版本的安装文件,这里选择Python 3.6 version 64-BIT(X86)INSTALLER(499M),默认下载到Downloads文件夹。之后,通过快捷键[Ctrl + Alt + T](或者在桌面空白处单击鼠标右键,在弹出的快捷菜单中选择“open terminal”命令)打开终端,输入命令cd Downloads/后切换到包含下载文件的目录下,运行命令bash Anaconda3-4.4.0-Linux-x86_64.sh,开始安装(Anaconda3-4.4.0-Linux-x86_64.sh是下载的文件名),如图1-2所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0012_0001.jpg?sign=1739193422-njfr3Ie5th08C5haepuYIkUibTFKosMD-0-d06e009bfd423eebb10920a6bec8817b)
图1-2
然后按回车键确认,继续运行安装程序。接着会出现与协议相关的确认信息,如图1-3所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0013_0001.jpg?sign=1739193422-m25RmRDrUMGvXk0pP6uEmFCWaao6KjJ2-0-499c2787523061bef75ebd51ca88c78f)
图1-3
输入yes并按回车键继续安装,接下来选择安装路径,这里直接按回车键选择默认的路径,如图1-4所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0013_0002.jpg?sign=1739193422-TZeEAOGNYtrOkTcjqCqXdaZaPYnFk8WD-0-3dea5914466ee10abe616ceadd5ee100)
图1-4
接着会进行一系列的配置,稍后询问是否将Anaconda加入环境变量,这里选择加入,如图1-5所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0014_0001.jpg?sign=1739193422-7p3Xr7fAgHEK9Wh4OaQyqzcUIcK36Q0l-0-911fcd124acb0d95b393c577601491f8)
图1-5
按照提示,打开一个新的终端测试是否成功安装,如图1-6所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0014_0002.jpg?sign=1739193422-kDHIE8fomrlTRmn3XscMaxarTfKlUyN8-0-745408c7b99ac6b4b0e9979704cd4ddb)
图1-6
从图1-6中可以看出,conda list命令给出了已经安装的第三方库的列表,表示安装成功。
由于已经将其加入环境变量,所以此时默认的Python版本即为Python 3.6,由Anaconda提供,而原来的Python 2也可以正常使用,调用方法如图1-7所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0014_0003.jpg?sign=1739193422-XxC9Jd7I3r9d0CDEDSQmajw85lGpeFA1-0-391154ec275b331165bf35d8bdcc0b30)
图1-7
我们也可以在终端通过ipython命令来使用IPython这一优秀的交互式环境,如图1-8所示。本书大部分的代码便是在此进行测试。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0015_0001.jpg?sign=1739193422-LvuOkgyrd24sOVjCvoZqszatY77uhGk3-0-afea53228d6854340b83adfaf802d245)
图1-8
此外,可以通过spyder命令启动自带的编辑器Spyder,如图1-9所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0015_0002.jpg?sign=1739193422-GvpuCGLMY39HFdRocrqultvJmQlONv0X-0-df0a7e5b4153ae03f5fa56266b1a19b4)
图1-9
其界面与MATLAB和RStudio十分类似,主要分为三部分:左侧的编辑区,右上方的变量查看和文件管理区,以及右侧下方的IPython交互式命令行区。可以通过选中左侧部分代码,再按快捷键[Ctrl+Enter]测试部分代码,十分方便。
作为专注于数据的开源工具,新版Anaconda提供导航器(navigator),其包含更加丰富的内容,可以通过命令anaconda-navigator启动,界面如图1-10所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0016_0001.jpg?sign=1739193422-GIeonA9vTV90B5QBpzK3wF8x0aIofJGV-0-62e0dab0dad1c6b8f0cce324f7104903)
图1-10
这里可以便捷地启动一系列的工具,此外,还包含其他有用的内容,读者可自行探索。
至此,完成了对Anaconda安装和基本使用方法的介绍。接下来就可以使用Spyder编辑器开发了,不过在此之前先为大家介绍另一款更加优秀的编辑器——PyCharm。不过PyCharm需要Java环境,所以接下来首先介绍Java环境的搭建。
2.Java环境搭建
Ubuntu默认是没有Java环境的,可以通过命令java-version查看,如图1-11所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0017_0001.jpg?sign=1739193422-sEXE6vFJm4kfZmQ1bfPf4eSbjZCTsvpu-0-8d8225b82f51c68fdaeac58e6a87ccb9)
图1-11
首先到Oracle官网(http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html)找到对应的下载文件,这里选择jdk-8u131-linux-x64.tar.gz。默认下载到Downloads文件夹。之后通过命令sudo su,输入密码,切换到管理员身份进行下面的配置;然后输入命令cd '/usr',切换到usr文件夹下,再通过tar -zxvf '/home/shen/Downloads/jdk-8u131-linux-x64.tar.gz’将压缩包解压(注意:这里的路径是压缩包的绝对路径)。运行mv jdk1.8.0_131 jdk-8,将文件重命名为jdk-8。
接下来修改系统配置文件,运行gedit /etc/profile,打开文件,在文件最后加入以下代码。
export JAVA_HOME=/usr/jdk-8 export JRE_HOME=$JAVA_HOME/jre export CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib:$JRE_HOME/lib export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin
最后运行source /etc/profile,使配置文件生效。再次查看Java环境版本,可以看到安装成功,如图1-12所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0018_0001.jpg?sign=1739193422-Xe7ZpxdLzOLlQKamnw8laWoobUFnSEdU-0-5ab8b76d22d8d0fdfaf6237f6882ac8b)
图1-12
至此,完成了对Java环境的搭建,接下来就可以安装PyCharm了。
3.PyCharm安装
PyCharm是由JetBrains公司提供的一款专门用于Python的编辑器。它是一款十分优秀的软件,本书很多程序也是在PyCharm中运行测试的。PyCharm分为社区版(免费)和专业版,一般社区版就足够用了。当然有需要的读者可以购买专业版,学生或者老师可以用学校的教育邮箱免费申请使用权限,一般很快就能审核通过。这里以社区版安装为例,专业版也是一样的。
首先进入PyCharm官网(https://www.jetbrains.com/pycharm/)下载安装文件,默认下载到Downloads文件夹下。之后运行命令切换到此文件夹,并进行解压,代码如下。
cd Downloads/ tar -xzf pycharm-community-2017.1.4.tar.gz
然后通过cd pycharm-community-2017.1.4/bin/切换目录到包含PyCharm安装文件的文件夹下。运行./pycharm.sh,开始安装。安装开始后,会询问是否引入之前的设置,如图1-13所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0018_0002.jpg?sign=1739193422-vTAuddpUdkV4L3bSohyUKJNvrDN5z5Cf-0-3845e4c2b1806385cb2686c6419612eb)
图1-13
由于是首次安装,所以选择不引入,单击“OK”按钮即可。弹出主题等配置信息,可先选择默认配置,单击“OK”按钮,有需要时再改即可,如图1-14所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0019_0001.jpg?sign=1739193422-wmbHU2woU5TgnNbjfGPPpjEYcF6sUX9n-0-39e4df4879ef6c25c8bb90b3698c6dc9)
图1-14
安装完成后,新建项目,如图1-15所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0019_0002.jpg?sign=1739193422-Xy0J1pQRxqrmqBvFFgQ7bnzKLCwIdQA3-0-03fa21bd333b8d493e4d674bf30108e8)
图1-15
PyCharm检测到系统有多个Python环境,所以在创建项目的时候,可以根据需要选择对应的Python版本,这里选用Anaconda提供的Python环境,如图1-16所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0020_0001.jpg?sign=1739193422-DSspye9H2GmF7EjFr7EPlnlo4cd6mSYd-0-5ce7b31d0fdf4779cd3f99f8db69a591)
图1-16
项目创建后,就能创建.py文件进行运行测试了,如图1-17所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0020_0002.jpg?sign=1739193422-08ydPfiMrnVfPmRkEFBT6zUb9a7Cj6OD-0-9cdfd7edbbcacb64e7ef940438cc643e)
图1-17
这里创建了Hello.py,接下来编辑文件。在首次打开时,一般会弹出如图1-18所示的提示框,意为没有为项目指定Python解释器。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0021_0001.jpg?sign=1739193422-3JFZTIcEPqZXEU9UznlAGE4iBasXHeJe-0-b8d2fd87f2317fa5e4b6dfa65ab1a140)
图1-18
直接单击提示栏右侧的链接,进行配置即可(也可以在开始页面选择“File”命令,然后选择“Settings”命令)。
选择“Project Python DA”选项下的“Project Interpreter”子项,在右侧选择Anaconda对应的解释器,然后依次单击“Apply”、“OK”按钮即可,如图1-19所示(这里可能需要一段时间进行配置)。最后单击鼠标右键,选择“运行”命令或者按下快捷键[Shift+F10]。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0021_0002.jpg?sign=1739193422-Vh0r9pZ9jOBDeWV9ebrfITd7WZ7FzO02-0-819a2739b3f152b358b94ee30d33069b)
图1-19
也可以单击右上角的绿色三角形运行,成功打印输出结果,如图1-20所示。exit code为0,表示一切正常。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0022_0001.jpg?sign=1739193422-USEgVb7s88SKkXOv3GIBACvkvOGmj9sQ-0-80eae3a01587d85a54994c8922ba206d)
图1-20
至此完成了PyCharm的安装和配置。