![搜索引擎技术与发展](https://wfqqreader-1252317822.image.myqcloud.com/cover/53/35011053/b_35011053.jpg)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.3 你也可以做搜索引擎
由于开源软件的发展,可以借助开源软件简化搜索引擎开发工作。Java开源软件的开发环境除了JDK和Eclipse,常用的还有版本管理工具Git与构建源代码工程工具Ant和Maven。
Ant和Maven都与项目管理软件make类似。Solr本身就是用Ant构建的。从http://ant.apache.org/bindownload.cgi可以下载Ant的最新版本。
在Windows操作系统中,ant.bat与ANT_HOME、CLASSPATH 和JAVA_HOME这3个环境变量有关。需要用路径设置ANT_HOME和JAVA_HOME环境变量,并且路径不要以“\”或“/”结束,不要设置CLASSPATH。如果把Ant解压到C:\apache-ant-1.10.7,则修改环境变量PATH,增加当前路径C:\apache-ant-1.10.7\bin。
大部分用Ant构建的项目只需要如下命令:
![](https://epubservercos.yuewen.com/50C77E/18685354608165406/epubprivate/OEBPS/Images/39803_33_1.jpg?sign=1739137090-m9Ii4dVZJdenDJjVzXnD0YexX35PpcZw-0-bf12b0fbbdfeab56d10ef275b83cc568)
可以从http://maven.apache.org/download.html下载最新版本的Maven。以maven-2.2.1版本为例,将下载的Maven压缩文件解压到C:根路径下,创建一个C:\apache-maven-2.2.1路径。修改 Windows 操作系统中的环境变量PATH,增加当前路径 C:\apache-maven-2.2.1\bin。
为了快速下载依赖项,可以修改settings.xml文件,配置Maven镜像地址:
![](https://epubservercos.yuewen.com/50C77E/18685354608165406/epubprivate/OEBPS/Images/39803_33_2.jpg?sign=1739137090-MnjWdiZOXy8eDjokING6LZqiJu4oOclM-0-29d45994c767452bc8ab8dcacb1297fc)
大部分用Maven构建的项目只需要如下命令:
![](https://epubservercos.yuewen.com/50C77E/18685354608165406/epubprivate/OEBPS/Images/39803_33_3.jpg?sign=1739137090-Lm6Zp5DK6D2wyZ0zTZHWjuEuGpPFk95S-0-2d79ee33b2ee30c20de3d884d46654cc)
一个最简单的搜索引擎由索引和搜索界面两部分组成,其简单结构如图1-1所示。
![](https://epubservercos.yuewen.com/50C77E/18685354608165406/epubprivate/OEBPS/Images/39803_34_1.jpg?sign=1739137090-5W5WS16cszetdqDk3TLpF0euEwSkaocq-0-305a5f2dae929310e8d8fd7185b27786)
图1-1 搜索引擎的简单结构
搜索的数据来源可以是Web或数据库,也可以是本地路径等。