我热搜的设计思路是用es存各个话题以及对应热度,至于话题的生成可以选一些比较热的文章,提取出一些内容作为话题,然后对于新增的文章,把文章的内容跟话题表去匹配,根据这种基于分词的倒排索引,如果文章和某个话题的关键词匹配度达到一定阈值,就认为文章属于这个话题,给这个话题热度增加,或者文章直接带了某个话题的tag,也给这个话题加热度,看起来面试官接受了这个说法
4 1

相关推荐

牛客网
牛客企业服务