R语言统计分析与应用
上QQ阅读APP看书,第一时间看更新

1.5 程序包

R提供了大量备用功能,通过可选模块的下载和安装来实现。目前有2500多个称为包的用户贡献模块可从http://cran.r-project.org/web/packages下载。这些包提供了横跨各种领域、数量庞大的新功能,包括分析地理数据、处理蛋白质质谱,甚至是心理测验分析的功能。

1.5.1 什么是程序包

R程序包是多个函数的集合,具有详细的说明和示例。Windows下的R程序包是经过编译的zip包。每个程序包包含R函数、数据、预编译代码、帮助文件、描述文件等。计算机上存储包的目录称为库。函数.libPaths()能够显示库所在的位置,函数library()则可以显示库中有哪些包。R自带了一系列默认包(包括base、datasets、utils、grDevices、graphics、stats以及methods),它们提供了种类繁多的默认函数和数据集。其他包可通过下载来进行安装。安装好以后,它们必须被载入会话中才能使用。

1.5.2 安装程序包

R程序包是R功能扩展特定的分析功能,需要用相应的程序包实现。例如:系统发育分析常用到ape程序包、群落生态学vegan包等。常用的安装包有以下几种。

·ade4:利用欧几里得方法进行生态学数据分析。

·Adephylo:系统进化数据挖掘与比较方法。

·Ape:系统发育与进化分析。

·apTreeshape:进化树分析。

·boot:Bootstrap检验。

·cluster:聚类分析。

·ecodist:生态学数据相异性分析。

·FD:功能多样性分析。

·Geiger:物种形成速率与进化分析。

·Graphics:绘图。

·Lattice:栅格图。

·Maptools:空间对象的读取和处理。

·Mefa:生态学和生物地理学多元数据处理。

·Mgcv:广义加性模型相关。

·Mvpart:多变量分解。

·Nlme:线性及非线性混合效应模型。

·Ouch:系统发育比较。

·Pgirmess:生态学数据分析。

·Phangorn:系统发育分析。

·Picante:群落系统发育多样性分析。

·Raster:栅格数据分析与处理。

·Seqinr:DNA序列分析。

·Sp:空间数据处理。

·Spatstat:空间点格局分析,模型拟合与检验。

·Splancs:空间与时空点格局分析。

·Stats:R统计学包。

·SDMTools:物种分布模型工具。

·Vegan:植物与植物群落的排序,生物多样性计算。

CRAN提供了每个包的源代码和编译好的程序包,有许多R函数可以用来管理包。第一次安装一个包,使用命令install.packages()即可。不加参数执行install.packages()将显示一个CRAN镜像站点的列表,选择其中一个镜像站点之后,将看到所有可用包的列表,选择其中的一个包即可进行下载和安装。如果知道自己想安装的包的名称并已经连接到互联网,可以直接将包名作为参数提供给这个函数。在括号中输入要安装的程序包名称,选择镜像后,程序将自动下载并安装程序包。一个包仅需安装一次。但和其他软件类似,包经常被其作者更新。使用命令update.packages()可以更新已安装的包。要查看已安装包的描述,可以使用installed.packages()命令,这将列出安装的包,以及它们的版本号、依赖关系等信息。

Windows下的程序包为zip文件,安装时不要解压缩。路径为“Packages>install packages from local files”,选择本地磁盘上存储zip包的文件夹。

包的安装是从某个CRAN镜像站点下载包,并将其放入库中的过程。程序包中的函数,都要先导入再使用,因此导入程序包是第一步。需要使用library()命令载入这个包,程序包内的函数的用法与R内置的基本函数用法一样。在载入一个包之前必须已经安装了这个包。在一次应用中,包只需载入一次。如果需要,你可以自定义启动环境以自动载入会频繁使用的那些包。

载入一个包之后,就可以使用一系列新的函数和数据集了。包中往往提供了演示性的小型数据集和示例代码,能够让我们尝试这些新功能。帮助系统包含了每个函数的一个描述(同时带有示例),每个数据集的信息也被包括其中。查询程序包内容最常用的方法包括菜单和查看PDF帮助文档。