09-24 21:34 香港大学推荐算法发布于上海

关注

华为AI算法华为AI算法笔试华为秋招 0917

笔试时间：2025年9月17日

往年笔试合集：

2023春招秋招笔试合集

2024春招秋招笔试合集

第一题：大模型分词

您正在为一种罕见的语言构建一个专用的大语言模型。由于训练样本缺失，传统BPE等标准的分词器效果不佳，使得大模型推理生成的句子不理想。

幸运的是，一位语言学家为罕见语言的已知词根和词缀（统称为"词元"或"Token"）都标注了一个置信度分数，这个分数代表了该词元作为一个"独立单位"的合理性。同时，语言学家还总结出了一个转移分数表，表示当前词元选择对下一个词元"置信度"的影响。

您的任务是设计并实现一个"最优分词器"，它能将输入的罕见语言句子（一个不含空格的英文小写字符串）切分成一系列词元，并使得所有词元的置信度分数之和达到最大。

输入描述

第1行为输入的、不含空格的罕见字符串 text，假设只含英文小写字符
第2行为已知置信度词汇表的个数 n
随后 n 行为已标注词元及其置信度分数 P，以空格分隔
第 n+3 行为转移分数的个数 m
随后 m 行为转移分数数据，包括起始词、下一个词、转移分数加分 X，以空格分隔

输入限制：

0 < len(text) ≤ 100
-100 ≤ 转移分数表中的影响分数 X ≤ 100
-100 ≤ 词汇表置信度分数 P ≤ 100
0 < 词汇表大小 n ≤ 100

输出描述

返回最高的分词得分，若根据已知词汇表无法拆分则返回0。

样例输入

applepie

2

pen 3

apple 10

2

pen apple 5

pie apple 2

样例输出

0

样例说明： text句子中含有不在已知词汇表中出现的词，无法进行拆分。

参考题解

解题思路：

这是一个动态规划分词问题，需要将输入字符串切分为一系列已知词元，使得所有词元的置信度分数之和加上转移分数之和达到最大。

状态定义：使用dp[i]表示处理到第i个字符时的最优解状态。由于需要考虑转移分数，dp[i]需要记录以不同词元结尾时的最大得分。
状态转移：对于每个位置i，遍历所有可能的起始位置j（0≤j<i），检查子串text[j:i]是否在已知词元表中。
边界条件：dp[0]初始化为空字符串''得分为0。
最终结果：dp[len(text)]中所有可能状态的最大值。

Python：

import sys

def optimal_tokenizer():
    text = sys.stdin.readline().strip()
    n = int(sys.stdin.readline())
    
    confidences = {}
    for _ in range(n):
        token, score_str = sys.stdin.readline().split()
        confidences[token] = int(score_str)
    
    m = int(sys.stdin.readli

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

2025 春招笔试合集文章被收录于专栏

2025打怪升级记录，大厂笔试合集 C++, Java, Python等多种语言做法集合指南

全部评论

推荐最新楼层

09-23 10:55

门头沟学院推荐算法

快手算法一面

1. 实习期间主要干了啥？讲讲最核心的一个需求？为什么要用RPC开发？怎么开发的，整个流程怎么样？2. ArrayList和LinkedList区别？3. 说说HashMap4. 说说反射，哪些开源框架中用到了？5. 说说JVM内存结构6. 说说Redis数据结构，zset作用？7. 说说布隆过滤器8. MySQL索引结构9. 用过哪些消息队列？说说kafka10. 有哪些方法实现分布式锁？11. 手撕LRU12. 1G的文件，每行一个词，不超过16K，内存限制1M，如何返回词频前100的词？给思路，多种方法 总结：50多分钟结束，问的都是常规八股，不算很难。这是第二次一面，上次太菜了被挂了，...

点赞评论收藏

分享

09-23 17:13

美团_agent开发(实习员工)

小红薯你要寄扒干啥

投递了用人部门筛选1个月是吧。我的简历就这么不入眼吗 就不能畅快的给我挂掉吗

点赞评论收藏

分享

09-20 15:30

门头沟学院推荐算法

数组操作，为什么一直 wa ，感觉算法是对的呀

投递淘天集团等公司10个岗位

点赞评论收藏

分享

09-11 10:47

腾讯_算法(实习员工)

26届算法秋招（含已通过和凉经）

主包的bg普通，有两段实习 + 一篇CCFB，主要是生成类算法百度：Timeline：8.5一面 --> 8.11二面 --> 8.13三面 --> 8.20Hr通知面试通过，等排序三面一共手撕了三道，只记得其中两道了：1. 最小会议室数量（贪心）2. 不同路径（动态规划）其实百度的面试时间卡的很死，都在一个小时内，所以没聊太多，我觉得就是二面围绕我的一个实习项目让我从头介绍到尾中间结合场景问了一些八股，例如：1. 在这个模型中你注意力机制的Q K V分别由谁提供？2. 不同的Tokens之间如何拼接？还是用一个特殊的tokens进行分割？快StarTimeline：8.18一面 --> 8.27 挂快手的面试官很专业，以下是部分提问：1. Flow Matching与扩散模型（DDPM）的区别？架构上有区别吗？2. DiT预测的噪声实际上是什么？如果只是符合高斯噪声的分布那rand_like一个噪声也符合高斯分布3. 如何去做一个AR+DiT的一个架构？还有其他的公司流程后续可能新开帖子...

查看7道真题和解析

点赞评论收藏

分享

09-11 14:54

门头沟学院运营

全程面试官都很有耐心，会时不时点头微笑，给人一种非常亲和的感觉 其实在开始之前，没有找到这个岗位的面经，有些帖子说大疆的面试是压力面，会问得很深刻或者打断什么的目前一面暂时没有遇到

我的秋招日记

点赞评论收藏

分享

评论

点赞

收藏

招聘动态

平安产险科技中心

2026届校园招聘

招商银行上海分行

2026校园招聘

字节跳动火山引擎

2026校园招聘

滴滴

2026届秋季校招

联想

2026届校园招聘

字节跳动

2026校园招聘

联想

26届AI专项｜内推码NK2026

快手

2026届校园招聘

红杉中国联合校招

联想

2026届校园招聘

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI创作大赛：牛可乐的国庆之旅 #

13009次浏览 189人参与

# 材料专业可以靠半导体脱坑吗？ #

23173次浏览 129人参与

# 携程求职进展汇总 #

636391次浏览 4648人参与

# 通信硬件人社招/春招/实习投递现状 #

29441次浏览 946人参与

# 国庆假期，给大脑放个假 #

1669次浏览 22人参与

# 大学四年该怎么过，才不算浪费时间？ #

12194次浏览 72人参与

# 深信服秋招来了 #

270849次浏览 2905人参与

# 五一假期，你打算“躺”还是“卷”？ #

80484次浏览 715人参与

# 你小时候最想从事什么职业 #

121299次浏览 1891人参与

# 海康威视求职进展 #

106327次浏览 515人参与

# 网申一定要掌握的小技巧 #

13078次浏览 74人参与

# 2025，我想...... #

73047次浏览 606人参与

# 长江存储求职进展汇总 #

57289次浏览 227人参与

# 国庆放假，你还会投简历吗？ #

9699次浏览 108人参与

# 牛友的国庆旅行碎片 #

6714次浏览 55人参与

# 国庆放假，你还会主动学习吗？ #

13803次浏览 67人参与

# 查收我的offer竞争力报告 #

215371次浏览 1397人参与

# 你认为工作的意义是什么 #

184198次浏览 1148人参与

# 你认为哪个岗位找工作最卷 #

51227次浏览 228人参与

# 设计人如何选offer #

151703次浏览 795人参与

# 距离放假还有_天，我已经…… #

15177次浏览 184人参与

# 教师节，你送祝福了吗 #

6062次浏览 52人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务