2021-10-09 17:20 北京科技大学 Java

关注

在ES数十亿数据量级的场景下，如何优化查询性能？

ES 客户端读取数据的流程

客户端 -> shard -> filesystem cache -> 磁盘文件

海量数据检索查询性能优化思路

如果内存足够大， filesystem cache 会缓存，如果查询走filesystem cache 则速度耗时在毫秒级别，如果查询请求走磁盘文件，则最少查询耗时都在秒级别。

如果整个磁盘上索引数据文件在3台机器上，一共占用了1T的磁盘容量，ES数据量是1T，每台机器的数据量是300G。ES性能最佳情况，你的机器内存至少可以容纳总数据量的一半。

生产环境试验，最好用ES存储少量的数据，用来搜索的那些索引，内存留给filesystem cache ， 100G。数据量控制在100G以内，相当于查询的数据几乎全部走内存来搜索，性能非常高，几乎搜索结果在1秒以内就可以出结果。

另外还有注意的一点，就是在ES中真正存储的记录字段都应该是你需要查询的字段，不应该把整条记录中的所有字段都放在ES中，如果全部字段都放到ES中，则会导致你机器的filesystem chche 占据空间很大，很多记录其实查询都要走硬盘文件，这样会导致查询性能会很低。

数据预热

后台系统自动搜索一下热数据，提前让数据加载到filesystem cache 中，当客户端查询时，直接从 filesystem cache中找到，性能非常高。

冷热分离

类似于MySQL的冷热分离，将大量访问不频繁的数据放到单独的一个索引。将查询频繁的放到一个索引，提高查询的性能。

模型设计

写入索引的时候，就将关联的数据直接写入进去，不要在搜索的时候进行join，因为ES中的复杂查询都很耗费性能。

分页查询

分布式的，查100页的10条数据，必须从每个shard，都查询一批数据过来，然后拿过来在内存里面分页，页翻得越深，基本查询性能很差。

优化策略：

1.不允许深度分页

2.类似于下拉分页的话，可以使用 scroll api 进行查询。它的分页原理，会一次性生成快照，然后通过游标一次一次往下翻，无论翻多少页，性能就是毫秒级的，scroll 智能一页一页往后翻，天然适合微博，往下拉的时候。

全部评论

推荐最新楼层

05-16 11:35

已编辑

腾讯_研发一组员工

上牛客发对象，还有人不知道吗？

看到创造者群内关于 牛爱网520的活动，让我有一种强烈的冲动想要跟大家分享一下我们俩的故事～我要替牛爱网声明！牛爱网真的能找到美好的爱情！-----------------------------------2021年底，我刚刚大二，正在北京开启我的第一段实习生涯。有一天在例行公事（工位摸鱼），看到牛爱网的板块更新了，打开一看，嚯！金色传说，是一个交友文档的活动。鬼使神差之下就在其中留下了我的一份自我介绍和个人信息。这个事情本就是当时高强度水牛客时光中的一个小插曲，直到3个月后的一个微信小红点。我想遍了各大公司HR的可能，但是没有想到会是春风送来爱情的开始我常常让朋友猜一猜我们俩认识的开端，他...

请hr大人把offer狠狠摔在我的脸上：举报了，点什么赞

520告白墙我在牛爱网找对象

点赞评论收藏

05-16 10:37

已编辑

同济大学 ARM工程师

我动了谁的蛋糕？资本你赢了

之前给加上一个人脸识别。需要有登录，注册，还要调用百度 api，还要一天内弄完 把程序员当成月入 3000 的小丑吗，你放家门口通马桶的工人电话，问一下他疏通一次马桶低于 400 干不干全网最受欢迎的嵌入式面经面经一共32篇文章，12w+字数，包含全部最新的面试必问考点，4.7w+同学学习，2800+订阅，非常适合在找工作面经薄弱的同学，3000+订阅还会涨价，提前订阅提前享受，持续更新中。原帖链接：https://www.nowcoder.com/creation/manager/columnDetail/MJNwoM

弦五Strings：第二个我可以

ai做完cv

投递百度等公司6个岗位 >

点赞评论收藏

04-17 18:32

门头沟学院 Java

boss直骗上遇到的hr

不尊重985爷了😅😓

野猪不是猪🐗：他跟你一个学校，你要是进来之后待遇比他好，他受得了？

点赞评论收藏

04-17 09:29

已编辑

湖南农业大学后端

0Offer的我心里暖暖的

25届0Offer，投的比较晚，兄弟们都怎么样了？ 0offer互助地## 

睡姿决定发型丫：本硕末9也是0offer，简历挂了挺多，只有淘天美团中兴给了面试机会，淘天二面挂，美团一面kpi面，中兴一面感觉也大概率kpi（虽然国企，但一面0技术纯聊天有点离谱吧）

现在还是0offer，延毕还是备考

点赞评论收藏

05-16 09:20

已编辑

中国民航大学 Java

这题不是等于中心对称吗

点赞评论收藏

全站热榜

创作者周榜

正在热议