1.光盘中所附代码的运行环境 服务器Tomcat5.5版本 数据库采用MySQL 5.0 版本 JDK采用1.5.0 Spring采用1.2.8版本 DWR采用1.1.3版本 Windows平台 Tomcat 插件TomcatPlugin(下载地址: )2.本书所附光碟范例Eclipse工程/ch2:原书第二章Eclipse工程文件 对文档预处理的源代码 对文档构建索引的源代码 对文档检索的源代码 使用Lucene检索和使用java.lang.String外置方式进行检索的效率比较安装:直接在Eclipse中选定“import->Existing Project”Eclipse工程/ch7:原书第七章和第九章的Eclipse工程文件 使用PDFBox解析PDF文件 使用xpdf解析英文PDF文件 使用POI解析WORD和Excel文件 使用Jacob解析WORD文件 Google的Search API的使用安装:直接在Eclipse中选定“import->Existing Project”Eclipse工程/ch9:原书第十二章的工程文件 使用正则表达式解析网页文件 使用HTMLParser解析网页文件安装:直接在Eclipse中选定“import->Existing Project”Eclipse工程/heritrixProject:原书第十章的工程文件 在Eclipse配置完成的Heritrix源代码 自行开发的Heritrix的Extractor类:pconline 自行开发的Heritrix的FrontierScheduler类:pconline 自行开发的Heritrix的Extractor类:163mobile 自行开发的Heritrix的FrontierScheduler类:163mobile安装:直接在Eclipse中选定“import->Existing Project”Eclipse工程/testDWR:原书第十三章的工程文件 完整的DWR开发环境 DWR在页面调用后台Bean类的实例 DWR操纵页面对象的实例安装:直接在Eclipse中选定“import->Existing Project”,该工程因为是Web工程,因此须要TomcatPlugin插件。
Eclipse工程/z_mysearch:原书中的搜索引擎完整实例 数据库脚本 网页索引格式 建立词库的源代码 从网页中解析并完善产品信息文件的源代码 从产品信息文件建立索引的源代码 数据库操作类的源代码 基于Spring的业务层管理 检索的业务类源代码 检索的DAO源代码 检索的分页实现源代码 检索的AJAX实现源代码安装:直接在Eclipse中选定“import->Existing Project”,该工程因为是Web工程,因此须要TomcatPlugin插件。注:随光碟附送的mirror.rar文件是使用Heritrix从pconline网上抓取的手机信息页面(以网站存盘格式储存),在本书最后搜索引擎完整实例中须要使用到。由于光碟容量有限,笔者删掉了原始镜像目录中一部分的网页,可能执行疗效和书上不能完全一致,请读者看懂原理后灵活处理。说明:因为mirror.rar文件引用了第三方网站的大量信息,这须要得到网站的授权,授权的代办须要一段时间,而本书的出版不能再被延误,故本次彩印的图书,mirror.rar文件不能置于光碟中,请读者谅解。请读者在理解书中述说的原理与技巧后灵活处理。
目前已有热心读者乐意为mirror.rar文件提供下载,在此对她们表示谢谢。因为该文件须要的空间较大,初期下载地址可能会不确定,请读者发邮件寻问本书责编:quyanlian@ptpress.com.cn,注明“Lucene下载地址咨询”。来函必复。对于某些下载不方便的读者,我们也可以提供刻光碟并寄送的服务,也请发邮件寻问本书责编:quyanlian@ptpress.com.cn,注明“Lucene光碟寄送”。