华为ai算法笔试 华为秋招 华为笔试题 1017

笔试时间:2025年10月17日

往年笔试合集:

2023春招秋招笔试合集

2024春招秋招笔试合集

第一题

【背景信息】在现代运维体系中,大量告警可能指向同一故障根源(如"服务器CPU利用率过高"和"应用响应超时"可能由同一硬件资源不足导致)。若能将语义相似的告警归为一类,不仅可以减少重复信息的干扰,还能帮助运维人员快速定位故障核心,缩短故障修复时间。

行业内普遍采用自然语言处理(NLP)技术对告警文本进行语义理解,采用基于预训练语言模型(如BERT、sBERT等)的语义向量(embedding)转化技术:通过模型处理,每条告警文本被转化为一个高维数值向量,向量的数学特征能够准确反映告警的语义信息,使得两条描述相同故障的告警(即使措辞有差异),其对应的向量在空间中的距离会非常靠近;而语义无关的告警,向量距离则较远。

【任务目标】通过语义向量(embedding)对给定的告警信息进行聚类:每条告警包含唯一的ID和对应的向量embedding,要求将余弦相似度≥0.95的告警归为同一个聚类,并返回数量最大的聚类的告警数量。

【规则要求】聚类判定标准:1)相似度阈值:当两条告警的余弦相似度≥0.95时,判定为语义相似。2)弱传递聚类(连通图聚类)规则:

  • 初始状态:每条告警单独构成一个类别。
  • 归入规则:若告警A与某类别C中的任意一条告警的余弦相似度≥0.95,则将A归入类别C。
  • 合并规则:若告警A同时满足归入多个类别的条件(即与多个类别中的告警均相似),则这些类别需合并为一个新类别,A归入该新类别。
  • 传递性保证:聚类过程需确保所有满足相似条件的告警最终被合并到同一类别中。例如:若A与B相似(余弦相似度≥0.95),且B与C相似(余弦相似度≥0.95),则A、B、C必须属于同一类别(即使A与C的相似度可能<0.95)。

输入描述

每一行为一个告警信息,其中第一个字段是告警ID,后面的字段是告警的嵌入向量。告警信息的总行数不会超过1000条。(请注意,测试集中可能包含如样例2所示的那种异常情况)

输出描述

找到包含告警数量最多的聚类,输出该聚类的告警数量。若所有告警均无法聚类(即每个类别仅包含1条告警),则返回1;若输入为空列表(无任何告警),或者输入告警信息的向量维度不一致(即不同告警的embedding长度不同),则返回0。

样例输入

1 1.0 0.0 0.0

2 0.99 0.01 0.0

3 0.0 1.0 0.0

4 0.0 1.0 0.01

5 0.1 0.0 0.0

样例输出

3

样例说明1

根据余弦相似度≥0.95的规则,我们得到以下聚类关系:

  • 告警1、2、5构成一个聚类
  • 告警3、4构成一个聚类 所有聚类的大小分别为3、2,其中数量最大的为3,因此输出为3。

参考题解

解题思路:

将告警文本的语义向量进行聚类,使用并查集(Union-Find)数据结构高效处理连通关系:

  1. 异常情况处理:检查输入是否为空,向量维度是否一致
  2. 使用并查集管理聚类关系,具有传递性
  3. 计算余弦相似度:cosine_similarity = dot(v1,v2) / (||v1|| * ||v2||)
  4. 遍历所有告警对,如果相似度≥0.95,合并它们所在的类
  5. 统计每个连通分量的大小,返回最大值

Python:

import sys
import math
from collections import Counter

p = []

def f(x):
    if p[x] == x:
        return x
    p[x] = f(p[x])
    return p[x]

def u(a, b):
    ra = f(a)
    rb = f(b)
    if ra != rb:
        p[rb] = ra

def sim(v1, v2):
    s = 0.0
    m1 = 0.0
    m2 = 0.0
    for i in range(len(v1)):
        s += v1[i] * v2[i]
        m1 += v1[i] * v1[i]
        m2 += v2[i] * v2[i]
    m1 = math.sqrt(m1)
    m2 = math.sqrt(m2)
    if m1 == 0 or m2 == 0:
        return 0.0
    return s / (m1 * m2)

def work():
    global p
    data = []
    dim = -1
    
    while True:
        line = sys.stdin.readline()
        if not line:
            break
        line = line.strip()
        if not line:
            continue
        
        parts = line.split()
        vec = [float(x) for x in parts[1:]]
        
        if not vec:
            print(0)
            return
        
        if dim == -1:
            dim = len(vec)
        elif len(vec) != dim:
            print(0)
            return
        
        data.append(vec)
    
    if not data:
        print(0)
        return
    
    n = len(data)
    if n == 1:
        print(1)
        return
    
    p = list(range(n))
    
    for i in range(n):
        for j in range(i + 1, n):
          

剩余60%内容,订阅专栏后可继续查看/也可单篇购买

2025 春招笔试合集 文章被收录于专栏

2025打怪升级记录,大厂笔试合集 C++, Java, Python等多种语言做法集合指南

全部评论

相关推荐

头像
昨天 09:28
已编辑
东北师范大学 Java
红榜&nbsp;华为云计算&nbsp;BU👉&nbsp;2026&nbsp;届秋招开放软件测试、渗透测试等岗位,流程快(部分岗位&nbsp;10&nbsp;天内出结果),薪资&nbsp;24-40K,五险一金按最高比例缴纳,提供入职电脑和补充商业保险。👉&nbsp;适合人群:对云原生、AI&nbsp;安全感兴趣的技术型选手。字节跳动👉&nbsp;AI&nbsp;岗位占比超&nbsp;90%,算法、大模型、AIGC&nbsp;方向扩招,提供Top&nbsp;Seed&nbsp;顶尖人才计划”(年薪&nbsp;50W+),面试注重技术深度和项目落地能力,流程透明(每轮面试后&nbsp;24&nbsp;小时内反馈)。👉&nbsp;避坑提示:二面难度陡增,建议提前准备&nbsp;LeetCode&nbsp;Hard&nbsp;题和系统设计。小米👉&nbsp;硬件、自动驾驶、IoT&nbsp;领域岗位多,面试不搞纯八股,会结合项目深入探讨技术细节,薪资&nbsp;18-35K,部分岗位提供北京户口指标。👉&nbsp;推荐岗位:嵌入式开发、AI&nbsp;算法(机器人方向)。国家电网👉&nbsp;稳定性天花板,计算机类岗位覆盖电力系统自动化、大数据分析等,薪资&nbsp;12-25K(一线城市),六险二金&nbsp;+&nbsp;补充医疗,适合追求&nbsp;WLB&nbsp;的同学。👉&nbsp;投递建议:关注各省电力科学研究院(如江苏电科院),竞争较总部小。中国一汽👉&nbsp;新能源汽车赛道核心企业,智能驾驶、车联网岗位需求大,薪资&nbsp;15-28K,提供免费员工宿舍和购车补贴,适合机械&nbsp;+&nbsp;计算机交叉背景。中国海油👉&nbsp;能源领域高薪代表,海上岗位薪资可达&nbsp;30K+(28&nbsp;天上班&nbsp;+&nbsp;28&nbsp;天休息),计算机岗聚焦油气勘探数据处理,福利齐全(企业年金、住房补贴)。神州数码👉&nbsp;AI&nbsp;咨询顾问岗位提供七险一金&nbsp;+&nbsp;落户机会,要求硕士学历,需熟悉云计算平台(AWS/Azure)和机器学习框架,薪资&nbsp;20-30K,团队年轻化且项目资源丰富。轻舟智航👉&nbsp;自动驾驶领域黑马,算法岗不海笔海面,HR&nbsp;响应快(面试后&nbsp;1&nbsp;天内出结果),薪资&nbsp;25-40K,适合非&nbsp;C9&nbsp;但技术扎实的同学。黑榜蔚来👉&nbsp;HC&nbsp;极少却大量开放岗位,同一岗位挂掉后需重新投递并重复笔试;面试中面试官多次迟到、不开摄像头,技术面涉嫌套方案(如追问自动驾驶算法细节后无后续)。👉&nbsp;替代选择:理想汽车(流程快、薪资对标蔚来)。经纬恒润👉&nbsp;面试体验极差(如二面中途断电、HR&nbsp;已读不回),实习期间强制加班且无转正机会,正式员工反馈做的项目重复性高,技术成长有限”。科大讯飞👉&nbsp;提前批约面时间固定(仅周六早&nbsp;9:30),无协商余地;流程卡壳严重(部分候选人系统状态显示面试中长达&nbsp;2&nbsp;个月),薪资低于行业平均水平。OPPO👉&nbsp;校招&nbsp;HC&nbsp;极少(如&nbsp;2026&nbsp;届算法岗全国仅招&nbsp;10&nbsp;人),面试淘汰率超&nbsp;90%,薪资倒挂严重(同岗位应届生比社招低&nbsp;30%)。👉&nbsp;真实薪资:算法岗约&nbsp;18K,开发岗&nbsp;15K&nbsp;左右。某自动驾驶创业公司(匿名)👉&nbsp;宣称年薪&nbsp;30W&nbsp;+&nbsp;股权激励”,实际薪资拆分比例为60%&nbsp;基本工资&nbsp;+&nbsp;40%&nbsp;绩效”,且绩效几乎拿不满;入职后发现项目停滞,团队半年内流失率超&nbsp;70%。某上市外包公司(匿名)👉&nbsp;以接触核心项目为诱饵签约,实际分配维护老旧系统;临近毕业以岗位取消为由毁约,且不提供赔偿金。👉&nbsp;避坑提示:签约前要求&nbsp;HR&nbsp;书面承诺岗位内容和转正比例。
点赞 评论 收藏
分享
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务