一篇就懂!230页Elasticsearch大数据搜索引擎解读PDF
智慧生物的大规模协作造就了惊人的进化奇迹。大规模机器集群造就机器系统进化成为强大的智能系统。Elasticsearch作为大数据与搜索引擎技术的结合体,随着社会对大规模开源分布式搜索引擎的需求迅速成长。
本篇文章从基本概念开始熟悉Elasticsearch,接下来介绍了Elasticsearch在 Windows和Linux操作系统下的安装。除了CURL命令,介绍了使用常用的编程工具和Elasticsearch 搜索服务交互,包括Java、Python、Scala和 PHP,以及使用SQL语句查诲Elasticsearch 索引的方法。自然语言文本理解往往以插件形式存在于Elasticsearch集群中。
第2章介绍了如何开发与测试插件。因为 Elasticsearch经常用于实时搜索或分析,所以性能优化很重要。第3章介绍了如何管理 Elasticsearch 集群。为了更合理地使用和扩展Elasticsearch,第4章简单分析了 github 中托管的Elasticsearch源代码。对于搜索引擎来说,返回结果的相关性是一个重要的话题,第5章讨论了这个问题。第6章介绍了使用Java开发搜索引擎Web 用户界面的几种方法。
随着人工智能领域技术的发展,让搜索引擎智能加速变成现实。智能搜索引擎需要能够检测到并识别出图像中的文字,第7章介绍了结合OpenCV使用Tesseract 识别文字的方法。第8章介绍了根据问题返回搜索结果的问答式搜索。目前 Elasticsearch是实时系统监控的首选,第9章介绍了使用Elasticsearch 监控与分析日志,也介绍了通过物联网监控系统的方案。
第1章 使用Elasticsearch

编辑切换为居中
添加图片注释,不超过 140 字(可选)
-
1.1 基本概念
-
1.2 安装
-
1.3 搜索集群
-
1.4 创建索引
-
1.5 使用Java客户端接口

编辑切换为居中
添加图片注释,不超过 140 字(可选)
-
1.6 RESTClient
-
1.7 使用Jest
-
1.8 Python客户端
-
1.9 Scala客户端
-
1.10 PHP客户端
-
1.11 SQL支持
-
1.12 本章小结
第2章 开发插件
-
2.1 搜索中文
-
2.2 搜索英文
-
2.3 使用测试套件
-
2.4 本章小结

编辑
添加图片注释,不超过 140 字(可选)

编辑切换为居中
添加图片注释,不超过 140 字(可选)
第3章 管理搜索集群
-
3.1 节点类型
-
3.2 管理集群
-
3.3 写入权限控制
-
3.4 使用X-Pack
-
3.5 快照
-
3.6 Zen发现机制
-
3.7 联合搜索
-
3.8 缓存
-
3.9 本章小结

编辑切换为居中
添加图片注释,不超过 140 字(可选)

编辑切换为居中
添加图片注释,不超过 140 字(可选)
第4章 源码分析
-
4.1 Lucene源码分析
-
4.2 Gradle
-
4.3 Guice
-
4.4 Joda-Time
-
4.5 Transport
-
4.6 线程池
-
4.7 模块
-
4.8 Netty
-
4.9 分布式
-
4.10 本章小结

编辑切换为居中
添加图片注释,不超过 140 字(可选)

编辑切换为居中
添加图片注释,不超过 140 字(可选)
第5章 搜索相关性
-
5.1 BM25检索模型
-
5.2 学习评分

编辑
添加图片注释,不超过 140 字(可选)

编辑切换为居中
添加图片注释,不超过 140 字(可选)
第6章 搜索引擎用户界面
-
6.1 JSP实现搜索界面
-
6.2 使用Spring实现的搜索界面
-
6.3 实现搜索接口
-
6.4 实现相似文档搜索
-
6.5 实现AJAX搜索联想词
-
6.6 推荐搜索词
-
6.7 查询意图理解
-
6.8 集成其他功能
-
6.9 查询分析
-
6.10 部署网站

编辑切换为居中
添加图片注释,不超过 140 字(可选)

编辑切换为居中
添加图片注释,不超过 140 字(可选)
第7章 OCR文字识别
-
7.1 Tesseract
-
7.2 使用TensorFlow识别文字
-
7.3 OpenCV
-
7.4 JavaCV
-
7.5 本章小结

编辑切换为居中
添加图片注释,不超过 140 字(可选)

编辑切换为居中
添加图片注释,不超过 140 字(可选)
第8章 问答式搜索
-
8.1 生成表示语义的代码
-
8.2 信息整合
-
8.3 自动问答
-
8.4 本章小结

编辑切换为居中
添加图片注释,不超过 140 字(可选)

编辑切换为居中
添加图片注释,不超过 140 字(可选)
第9章 Elastic系统监控
-
9.1 Logstash
-
9.2 Filebeat
-
9.3 消息过期
-
9.4 Kibana
-
9.5 Flume
-
9.6 Kafka
-
9.7 Graylog
-
9.8 物联网数据
-
9.9 本章小结

编辑
添加图片注释,不超过 140 字(可选)

编辑切换为居中
添加图片注释,不超过 140 字(可选)