哈希表与字符串哈希

哈希表是一种非常带劲的存储方法,它将一定个数内的数据以一种降低数据规模的方式存储着,哈希表的主要操作就是添加数据和查找数据,当然你也可以用标记来标记数据是否被删除(实际上,它只是被你标记删除了,并未被实际删除并释放内存)

 

上模板题让我们直观感受下:
Acwing840 模拟散列表:传送门 :https://www.acwing.com/problem/content/842/

这题就让我们实现了哈希表的存储和查找:

比较好用的两种方法:拉链法和开放寻址法

 

1.拉链法

一个节点上存储着 取模后位置相同的数据,由于存储位置相同,为避免矛盾,采用拉链法将其以拉链形式展开存储

首先创建存储位置的数组,这个数组的每个元素作为拉链的头结点,即每个元素都作为一个单链表的头结点,之后按照数据的模后存储位置存储单链表的数据即可

如图所示:


2. 开放寻址法

为了避免查找时的寻找次数过多,一般数组大小为题目所给数据范围的2~3倍,且数组大小尽量设置为质数减少冲突。

主要思路就是如果数据取模后的位置未被占用,那么就直接将该数据存储着该位置,如果已被占用,则往后寻找直至找到一个未被占用的位置。

 

这里直接上代码:

题目Acwing840 :https://www.acwing.com/activity/content/code/content/45308/

#include<stdio.h>
#include<string.h>

const int null = 0x3f3f3f3f;
const int N = 200003; //开为题目数据范围的2倍

int h[N]; //存储的值


void init(){
    memset(h, 0x3f, sizeof(h));
}

//插入值和查找值只需一个函数
int find(int x){
    int k = ((x % N) + N) % N;
    while(h[k] != null && h[k] != x){ //当这个位置被占用了,且x未被存储
        k++;
        if(k == N) k = 0; //如果到了最后一个位置,就返回初位置再开始寻找
    }
    return k;
}

int main(){

    init();

    int n;
    scanf("%d", &n);

    while(n--){
        char op[2];
        int x;
        scanf("%s%d", op, &x);

        if(op[0] == 'I'){            
            int k = find(x);
            h[k] = x;
        }   
        
        else if(op[0] == 'Q'){
            if(h[find(x)] == null) puts("No"); 
            else puts("Yes");
        }
    }

    return 0;
}

 

 

字符串哈希

所谓字符串哈希,就是将一个字符串以哈希表的形式存储下来,由于哈希表近乎O(1)的时间复杂度,使得面对大部分问题时,都可以使用哈希表暴力卡过。

这里我们介绍的是字符串前缀哈希法

这里有一个字符串   “ABCD”,给你L1, R1, L2, R2让你求下LR范围内的字符串是否相同

那么我们用哈希可以怎么做呢?

s[] = "ABCD";

h[N]为哈希值

这里我们先预处理出所有前缀的哈希值:

h[i] 是指前i个字符的哈希值,这里定义h[0] = 0

如h[1] = "A"的哈希值, h[2] = "AB"的哈希值,h[3] = "ABCDA"的哈希值,以此类推

那么定义字符串的哈希值时将字符串定义为p进制的数,一般取p = 131或13331

A是第1位:p^0, B是第2位:p^1, C是第3位:p^2,D是第4位:p^3

那么这里h[1] = h[0]  * p ^ 0 + 'A', h[2] = h[1] ^ p + 'B', h[3] = h[2] ^ p + 'C', h[4] = h[3] * p + 'D', h[5] = h[3] * p + 'A'

这里的'A'值也可以不用哈希值,可以使用1~26,但是一定要保证所有字符的相对位置是固定的,即A比B小1,A比C小2等。。

 

这时候就知道了整个字符串每个子串的哈希值了。所以当我们要求解某两部分是否相等时,就可以直接使用哈希值相减了。

但是需要注意的是:(我们这里定义1~26为'A'~'Z'的哈希值, 为了简便计算,p为2)  如"ABCDA"

h[1] = h[0] * p + 1 = 1;

h[2] = h[1] * p + 2 = 4;

h[3] = h[2] * p + 3 = 11;

h[4] = h[3] * p + 4 = 26;

h[5] = h[4] * p + 1 = 53;

 

求1~1到 5~5的两个子串是否相同

"ABCDA"

h[r] - h[l - 1] * p^(r - l + 1)就是这个子串的哈希值,你问我为什么,我说的是,以2~4的子串为例子

BCD这个子串是个3位的p进制数,而ABCD是4位p进制数,A是1位p进制数,因此:要想用ABCD处理A得到一个3位的p进制数BCD,由于A是子串ABCD的最高位第4位,因此我们拿ABCD减去A*p^3即可,通过观察可以发现,每个相减子串的位数相差的是他们最后一个字符之间的距离,即r - l + 1。所以有h[r] - h[l - 1] * p^(r - l + 1)是l~r这个子串的哈希值。

关于模板题:推荐Acwing 841 传送门:https://www.acwing.com/problem/content/843/

全部评论

相关推荐

咦哟,从去年八月份开始长跑,两处实习转正都失败了,风雨飘摇,终于拿到offer了更新一下面试记录:秋招:多部门反复面试然后挂掉然后复活,具体问了啥已经忘了,只是被反复煎炸,直至焦香😋春招:base北京抖音hr打来电话说再次复活,准备面试,gogogo北京抖音一面:六道笔试题:1.promise顺序2.定义域问题3.flat展开4.并发请求5.岛屿数量算法(力扣)深度,广度都写6.忘记了,好像也是算法,难度中等其他问题多是框架底层设计,实习项目重难点~~~秒过😇北京抖音二面:三道笔试题:(为什么只有三道是因为第三道没做出来,卡住了)1.中等难度算法(忘记啥题了,应该是个数组的)2.认识js的继承本质(手写继承模式,深入js的面相对象开发)3.手写vue的响应式(卡在了watch,导致挂掉)---后知后觉是我的注册副作用函数写得有问题,有点紧张了其他题目多是项目拷打,项目亮点,对实习项目的贡献~~~第二天,挂,but立马复活转战深圳客服当天约面深圳客服一面:六道笔试题,由于面过太多次字节,面试官叫我直接写,不用讲,快些写完😋,具体都是些继承,深拷贝(注意对数组对象分开处理,深层次对象,循环引用),加中等难度算法题~~~秒过深圳客服二面:口诉八股大战:大概囊括网络,浏览器渲染原理,动画优化,时间循环,任务队列等等(你能想到的简单八股通通拉出来鞭尸😋)算法题:笔试题6道:1:找出数组内重复的数,arr[0]-arr[n]内的数大小为[1-n],例如[1,2,2,3,3]返回[2,3],要求o(n),且不使用任何额外空间(做到了o(n),空间方面欠佳,给面试官说进入下一题,做不来了)2:原滋原味的继承(所以继承真滴很重要)3:力扣股票购买时机难度中等其他滴也忘记了,因为拿到offer后鼠鼠一下子就落地了,脑子自动过滤掉可能会攻击鼠鼠的记忆😷~~~秒过深圳客服三面:项目大战参与战斗的人员有:成员1:表单封装及其底层原理,使用成本的优化,声明式表单成员2:公司内部库生命周期管理成员3:第三方库和内部库冲突如何源码断点调试并打补丁解决成员4:埋点的艺术成员5:线上项目捷报频传如何查出内鬼成员6:大文件分片的风流趣事成员7:设计模式对对碰成员8:我构建hooks应对经理的新增的小需求的故事可能项目回答的比较流利,笔试题3道,都很简单,相信大家应该都可以手拿把掐😇~~~过过过无hr面后续煎熬等待几天直接hr打电话发offer了,希望大家也可以拿到自己心仪的offer
法力无边年:牛哇,你真是准备得充分,我对你没有嫉妒,都是实打实付出
查看19道真题和解析
点赞 评论 收藏
分享
04-08 10:36
已编辑
华南理工大学 C++
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务