avatar-decorate
获赞
1107
粉丝
763
关注
1
看过 TA
1.2W
上海交通大学
2023
搜索算法
IP属地:北京
前Shopee逐风计划信息检索算法工程师实习生
私信
关注
2022-12-21 打饭有感之乌鸦反哺!​​今年的两篇论文都在说HEM算法,需要在每个属性上做两次位集运算,​比如对于5,6,7,8里的桶,要找HVE上的G1和LVE上的G2,分别和全局位集做一次或运算,对于9,10,11,12里的桶,要找HVE上的G2和LVE上的G1,分别和全局位集做一次或运算。​对于事件落入的某个cell(桶),之前是要找两个位集,做两次或运算的,其实hve上的位集和lve上的位集是一一配对的!只需要存这两个位集的并集就好,也就是在一开始插入订阅时就把这两个位集当成一个来标记这样一来,直接妥妥地少了一半的或运算次数,缓存也少了一半空间占用!​​奈何子欲养而亲不待,会议论文已见刊,期刊论文昨天已提交审稿意见回复,毕业论文这一部分已经翻译好还得赶后面的。​​这是在买晚饭时想到的,下午是在想如何解释把HEM应用于包分类领域设计一个新算法,解释了协议号属性上的逻辑,直接给每个协议号设一个位集,以为相当于HEM上桶数c等于组数g,瞬间发现不等价,HEM上的组是前缀桶或者后缀桶,那么,把包分类协议号上这个穷举做法又折回去应用到HEM上呢?那可不就是为每个桶单独设置一个位集嘛?于是就自然想到了把现有的两个位集合并起来,也发现了它们一直存在着一一对应关系没注意到!一年半了!​​只是遗憾地是双重选择策略用不了了,但双重选择就是为了用一半的缓存实现相同的加速效果,现在缓存也减半了,或运算还可以进一步减半!
0 点赞 评论 收藏
转发
牛客网
牛客企业服务