技术交流:搜索结果排序优化
楼主目前在实习,做关键词搜索优化这一块,碰到一个问题,是关于分词搜索结果优化的。
比如说有一本书《校花的贴身高手》,分词结果为 校花|的|贴身|高手
然后对分词做倒排索引搜索得到以下结果:
校花(set1):book1,book2,book3,......
的(set2):book1,book2,book4,book5,......
贴身(set3):book2,book3,book4,book6,......
高手(set4):book21,book3,book5,book6,......
然后对set1 set2 set3 set4做交集,那么交集中必然含有 校花的分身高手 这几个字,也可以有 校花的贴身高手xx 这种结果
然后现在的问题是,我搜索《校花的贴身高手之xx》,假定搜索库里面没有这本书,然后分词,对分词搜索结果做交集,交集为空的时候接下来我要怎么回退放宽限制,使得《校花的贴身高手》可以出来,要是再退一步这里只有《贴身高手》这本书,或者只有《校花的贴身高手之YY》,我怎么把这些书显示出来并且做恰当排序
我查过一些搜索引擎的策略,基本上都只是说到做交集就完事了,基本没有涉及到如果交集为空怎么回退。还有搜索引擎里面每一个词都有上亿条索引,做交集然后排序我觉得基本也不现实,耗时太长了。
牛油们有没有可行方案,或者有什么技术文章链接也可以甩一个给我,感激不尽哈哈(ಡωಡ)hiahiahia
还有我发现牛客的搜索策略似乎也不是很好,看起来是基于精准匹配的,但是部分匹配和广泛匹配似乎没做好的样子

比如说有一本书《校花的贴身高手》,分词结果为 校花|的|贴身|高手
然后对分词做倒排索引搜索得到以下结果:
校花(set1):book1,book2,book3,......
的(set2):book1,book2,book4,book5,......
贴身(set3):book2,book3,book4,book6,......
高手(set4):book21,book3,book5,book6,......
然后对set1 set2 set3 set4做交集,那么交集中必然含有 校花的分身高手 这几个字,也可以有 校花的贴身高手xx 这种结果
然后现在的问题是,我搜索《校花的贴身高手之xx》,假定搜索库里面没有这本书,然后分词,对分词搜索结果做交集,交集为空的时候接下来我要怎么回退放宽限制,使得《校花的贴身高手》可以出来,要是再退一步这里只有《贴身高手》这本书,或者只有《校花的贴身高手之YY》,我怎么把这些书显示出来并且做恰当排序
我查过一些搜索引擎的策略,基本上都只是说到做交集就完事了,基本没有涉及到如果交集为空怎么回退。还有搜索引擎里面每一个词都有上亿条索引,做交集然后排序我觉得基本也不现实,耗时太长了。
牛油们有没有可行方案,或者有什么技术文章链接也可以甩一个给我,感激不尽哈哈(ಡωಡ)hiahiahia
还有我发现牛客的搜索策略似乎也不是很好,看起来是基于精准匹配的,但是部分匹配和广泛匹配似乎没做好的样子
