小琢卷不动

2021-11-11 08:06 安徽大学人工智能

关注

题解 | #作弊#

作弊

https://ac.nowcoder.com/acm/problem/217473

先引用一段百度百科对哈夫曼树的介绍：

在计算机数据处理中，哈夫曼编码使用变长编码表对源符号（如文件中的一个字母）进行编码，其中变长编码表是通过一种评估来源符号出现机率的方法得到的，出现机率高的字母使用较短的编码，反之出现机率低的则使用较长的编码，这便使编码之后的字符串的平均长度、期望值降低，从而达到无损压缩数据的目的。

据此我们可以知道，出现机率高的字母使用较短的编码，反之出现机率低的则使用较长的编码 可以使得我们对字符的编码的 字符串的平均长度、期望值降低。

事实上根据本题样例，手玩一下也能得到类似的结论：如果某个字符老是出现，那么它一定不能用太长的编码表示，否则我们的消耗实在太高了。

哈夫曼树又称最优二叉树，是一种带权路径长度最短的二叉树。所谓树的带权路径长度，就是树中所有的叶结点的权值乘上其到根结点的路径长度（若根结点为0层，叶结点到根结点的路径长度为叶结点的层数）。树的路径长度是从树根到每一结点的路径长度之和，记为 $WPL=W_1\times L_1+W_2\times L_2+W_3\times L_3+\cdots+W_n\times L_n$ ， $N$ 个权值 $W_i(i=1,2,\cdots n)$ 构成一棵有 $N$ 个叶结点的二叉树，相应的叶结点的路径长度为 $L_i(i=1,2,\cdots n)$ 。可以证明哈夫曼树的 $W P L$ 是最小的。

事实上根据我们这道题的性质，任何一个字符串不能有它的前驱出现，也能发现类似的结论：所谓树的带权路径长度，就是树中所有的叶结点的权值乘上其到根结点的路径长度（若根结点为0层，叶结点到根结点的路径长度为叶结点的层数）。

那么解决这道题只需要把哈夫曼树的板子（优先队列实现）粘上来就好了，注意到每个字符出现次数用桶来统计一下即可：

#include<queue>
#include<cstdio>
#include<cstring>
#define int long long
int init(){
	char c = getchar();
	int x = 0, f = 1;
	for (; c < '0' || c > '9'; c = getchar())
		if (c == '-') f = -1;
	for (; c >= '0' && c <= '9'; c = getchar())
		x = (x << 1) + (x << 3) + (c ^ 48);
	return x * f;
}
void print(int x){
	if (x < 0) x = -x, putchar('-');
	if (x > 9) print(x / 10);
	putchar(x % 10 + '0');
}
const int N = (int) 5e6 + 5;
char s[N]; int tot[1 << 8];
std::priority_queue<int, std::vector<int>, std::greater<int> >Q;
signed main(){
	scanf("%s", s + 1);
	int len = strlen(s + 1);
	for (int i = 1; i <= len; ++i)
		++tot[s[i]];
	for (char c = 'a'; c <= 'z'; ++c)
		if (tot[c]) Q.push(tot[c]);
	int ans = 0;
	if (Q.size() == 1) { print(len); return 0; }
	while (Q.size() > 1) {
		int x = Q.top(); Q.pop();
		int y = Q.top(); Q.pop();
		ans += x + y;
		Q.push(x + y);
	}
	print(ans), putchar('\n');
}

全部评论

推荐最新楼层

小琢卷不动

楼主

安徽大学人工智能

是板子吧

点赞回复分享

发布于 2022-07-15 21:12

青岛农业大学 C#工程师

while (Q.size() > 1) { int x = Q.top(); Q.pop(); int y = Q.top(); Q.pop(); ans += x + y; Q.push(x + y); } 这是板子吗？还是现推呀

点赞回复分享

发布于 2022-06-03 21:28

04-21 19:46

已编辑

门头沟学院 Java

求问，测开后端不等式

大厂测开年包42，10.5-8 双休，不太卷，签了三方。求问什么样的拿到什么样的后端offer值得毁约这个测开offer，年包35w以上就行吗？求大佬分享经验引流腾讯字节美团华为快手百度滴滴京东选项没有的可以评论区分享，感谢大佬

我的求职进度条

点赞评论收藏

分享

04-18 12:54

西北大学 Java

腾讯WXG暑期面经

三轮技术面主要集中在实习经历的拷打上，带一点八股以及一些场景题(面试周期比较长，有些忘了，所以不太全)八股：1.JDK版本特性2.你认为java哪些地方做的不好3.java和C++的区别4.HTTP状态码以及底层5.进程、线程、协程的区别6.io有哪些，select，poll，epoll说一下6.redis的持久化方案7.redis的部署方案8.mysql的主从有哪些方案9.主从同步的底层了解吗，你认为有什么问题？场景：1.从操作系统角度来看你认为怎么避免并发安全问题2.如果让你来设计一个完整的交易系统，假设并发量在千万级别或者说上亿级别，怎么做3.从操作系统角度来看怎么让线程真正在同一时间开...

查看14道真题和解析

点赞评论收藏

分享

03-17 08:17

山东大学 Java

求助，怎么改进。约面都没有🙂‍↔️  

今天你投了哪些公司？

点赞评论收藏

分享

04-02 13:42

已编辑

北京航空航天大学后端工程师

字节暑期已offer

算上这次也是三战字节了timeline3.24一面 当晚约二面3.25二面 当晚约三面3.27三面 3.30约HR面4.1HR面4.2 oc+offer加油加油，希望暑期能活下来

点赞评论收藏

分享

04-17 10:26

已编辑

南京大学 golang

深圳小厂后端一面

🙌面试感想：这次面试比较简单1.get post区别2.http https区别3.TCP UDP区别4.mysql b+树5.mysql事务6.线程进程协程区别7.go channel select定义8.gc垃圾回收9.restful api规则10.用户量突增如何处理11.redis三剑客12.gin框架13.session cookie区别

查看12道真题和解析

点赞评论收藏

分享

评论

3

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 哪些AI项目值得做？ #

7872次浏览 252人参与

# 市场营销人求职交流聚集地 #

208030次浏览 1271人参与

# 华泰星战营，提前锁定校招offer #

10258次浏览 337人参与

# 实习时最怕听到的一句话 #

7282次浏览 98人参与

# 机械人还在等华为开奖吗？ #

333059次浏览 1618人参与

# 找不到大厂实习可以去小厂吗？ #

7735次浏览 59人参与

# 没有面试的日子里，你在做什么 #

5938次浏览 142人参与

# 拼多多工作体验 #

57375次浏览 399人参与

# 简历上如何体现你的“AI”能力？ #

4498次浏览 101人参与

# 你总挂在第__面？ #

3089次浏览 37人参与

# 你知道最慷慨和最抠的公司分别是 #

5728次浏览 49人参与

# 你简历上最心虚的一句话 #

11446次浏览 74人参与

# 26届的你们有几段实习？ #

178622次浏览 1110人参与

# 机械笔面试考察这些知识点 #

18442次浏览 142人参与

# 嵌入式岗知多少 #

73028次浏览 580人参与

# 产品每日一题 #

96609次浏览 711人参与

# 快消秋招求职进展汇总 #

11854次浏览 43人参与

# 实习最晚的一次下班是几点 #

34635次浏览 169人参与

# 我们是不是被“优绩主义”绑架了？ #

46557次浏览 543人参与

# 找工作的破防时刻 #

291096次浏览 2070人参与

# 锐捷网络求职进展汇总 #

9374次浏览 29人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务