当前位置: 首页 > 资源下载  > 电子书 > 计算机

解密搜索引擎技术实战Lucene&Java精华版(第3版)

12/16/2018 9:53:18 PM 人评论

适读人群 :本书适合需要具体实现搜索引擎的程序员,对于自然语言处理等相关研究人员也有一定参考价值,同时猎兔搜索团队也已经开发出以本书为基础的专门培训课程。1、《解密搜索引擎技术实战:Lucene&Java精华版(第3版)》是畅销书的升级版,从实用的角度出发,全面介绍

解密搜索引擎技术实战Lucene&Java精华版(第3版)

解密搜索引擎技术实战Lucene&Java精华版(第3版)

编辑推荐

适读人群 :本书适合需要具体实现搜索引擎的程序员,对于自然语言处理等相关研究人员也有一定参考价值,同时猎兔搜索团队也已经开发出以本书为基础的专门培训课程。

  1、《解密搜索引擎技术实战:Lucene&Java精华版(第3版)》是畅销书的升级版,从实用的角度出发,全面介绍了搜索引擎相关技术。
  2、作者罗刚对搜索引擎技术非常熟悉,本书是其软件研发和教学实践的经验汇总。
  3、《解密搜索引擎技术实战:Lucene&Java精华版(第3版)》非常适合想全面了解搜索引擎技术及实现方法的读者阅读,亦可作为相关专业学生的参考用书。



内容简介

  本书是猎兔搜索开发团队的软件研发和教学实践的经验汇总。本书总结搜索引擎相关理论与实际解决方案,并给出了Java实现,其中利用了流行的开源项目Lucene和Solr,而且还包括原创的实现。
  本书主要包括总体介绍部分、爬虫部分、自然语言处理部分、全文检索部分以及相关案例分析。爬虫部分介绍了网页遍历方法和如何实现增量抓取,并介绍了从网页等各种格式的文档中提取主要内容的方法。自然语言处理部分从统计机器学习的原理出发,包括了中文分词与词性标注的理论与实现及在搜索引擎中的应用等细节,同时对文档排重、文本分类、自动聚类、句法分析树、拼写检查等自然语言处理领域的经典问题进行了深入浅出的介绍,并总结了实现方法。在全文检索部分,结合Lucene介绍了搜索引擎的原理与进展。用简单的例子介绍了Lucene的*新应用方法,包括完整的搜索实现过程:从完成索引到搜索用户界面的实现。此外还进一步介绍了实现准实时搜索的方法,展示了Solr的用法以及实现分布式搜索服务集群的方法。*后介绍了在地理信息系统领域和户外活动搜索领域的应用。

作者简介

  罗刚,猎兔搜索创始人,带领猎兔搜索技术开发团队先后开发出猎兔中文分词系统、猎兔信息提取系统、猎兔智能垂直搜索系统以及网络信息监测系统等,实现互联网信息的采集、过滤、搜索和实时监测。曾编写出版《自己动手写搜索引擎》、《自己动手写网络爬虫》、《使用C#开发搜索引擎》,获得广泛好评。在北京和上海等地均有猎兔培训的学员。

附件下载

  • 下载

    百度网盘下载

    下载: 所需积分:90

  • 积分获取方法:先给账户进行充值,然后进行积分兑换,积分兑换比例:1元可兑换10个积分.
    具体可参考帮助如何获取积分说明

相关资源