03-09 15:15 吉林农业大学算法工程师发布于河北

关注

AI-Agent 面试题汇总 - 机器学习篇

1. 机器学习中特征的理解

特征（Feature）是样本可量化的属性，是模型输入。特征质量通常决定模型效果上限。常见有数值、类别、文本、时间、统计聚合、交叉特征等。

2. 机器学习中有哪些特征工程方法？

常见方法：缺失值处理、异常值处理、编码、标准化/归一化、特征构造、特征选择、降维。

from sklearn.preprocessing import StandardScaler, OneHotEncoder
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline
from sklearn.impute import SimpleImputer
from sklearn.linear_model import LogisticRegression

num_cols = ["age", "salary"]
cat_cols = ["city", "edu"]

preprocess = ColumnTransformer([
    ("num", Pipeline([
        ("imputer", SimpleImputer(strategy="median")),
        ("scaler", StandardScaler())
    ]), num_cols),
    ("cat", Pipeline([
        ("imputer", SimpleImputer(strategy="most_frequent")),
        ("onehot", OneHotEncoder(handle_unknown="ignore"))
    ]), cat_cols)
])

clf = Pipeline([
    ("prep", preprocess),
    ("model", LogisticRegression(max_iter=200))
])

3. 机器学习中的正负样本

二分类中目标类一般记为正样本（1），非目标类为负样本（0）。当类别不平衡时，常用重采样、类别权重、阈值调优、PR-AUC等方式处理。

4. 线性分类器与非线性分类器的区别及优劣

线性分类器决策边界是超平面，训练快、可解释性好；非线性分类器表达能力强，可拟合复杂边界，但更易过拟合、调参成本更高。

5. 如何解决过拟合问题

可通过增加数据、正则化、降低模型复杂度、交叉验证、早停、集成学习等方式缓解过拟合。

from sklearn.model_selection import cross_val_score
from sklearn.ensemble import RandomForestClassifier

model = RandomForestClassifier(
    n_estimators=300,
    max_depth=8,
    min_samples_leaf=5,
    random_state=42
)
scores = cross_val_score(model, X, y, cv=5, scoring="f1")
print(scores.mean())

6. L1 和 L2 正则的区别，如何选择 L1 和 L2 正则

L1 倾向产生稀疏解（可做特征选择）；L2 倾向让参数整体变小（更稳定）。高维稀疏场景可优先尝试 L1，通用场景常先试 L2。

from sklearn.linear_model import LogisticRegression

l1_model = LogisticRegression(penalty="l1", solver="liblinear", C=1.0)
l2_model = LogisticRegression(penalty="l2", solver="liblinear", C=1.0)

7. 有监督学习和无监督学习的区别

有监督学习有标签（分类/回归）；无监督学习无标签（聚类/降维/异常检测）。

8. 有

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

AI-Agent面试实战专栏文章被收录于专栏

本专栏聚焦 AI-Agent 面试高频考点，内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线，提供高频题解析、标准答题思路与工程落地方法，帮助你高效查漏补缺.

全部评论

推荐最新楼层

代码练习生_code

门头沟学院 C++

很强啊大佬面了多少家

点赞回复分享

发布于 03-10 23:02 河北

在迎接offer的牛可乐很想潜水

太及时了

点赞回复分享

发布于 03-10 22:17 云南

再晒一会鱼

国家开放大学前端工程师

感谢分享所以现在算法主要是使用Adam吗？

点赞回复分享

发布于 03-10 21:46 黑龙江

03-07 02:20

门头沟学院推荐算法

LLM算法实习百度二面面经

继续来分享下之前的面经~强度好大，俺不中咧。。。。1.实习中多智能体系统包含几个智能体？它们之间如何交互？2.意图识别模型需要识别多少个意图？3.750B 模型用于什么场景？4.实习中 Qwen3VL 模型是多少 B 的？用于什么场景？5.在实习中，你主要的贡献是什么？6.检索环节做了哪些优化？7.答案生成环节做了哪些优化？8.是否做了 SFT 或强化学习相关工作？在哪个环节做的？9.SFT 过程中是否对类别标签做了清洗或修正？10.强化学习的样本量是多少？11.基础模型经常分类分不准的案例有哪些？12.在校项目中，为什么用对话数据来增强数据集？13.在校项目任务的输出可以简单描述并举例吗？14.单智能体能否完成在校项目相关工作？为什么要使用多智能体？15.LangGraph 相对其他开源智能体编排工具的优点是什么？16.在现有场景中是否需要用到 LangGraph 的状态管理功能？17.如何理解 Long-term Memory 的实现方式？18.若将电商场景中用户的购买、点击、兴趣等信息设计为长期记忆，有什么想法？19.Context Window 能否储存大量电商交互信息？如何解决存储问题？20.推理时若将大量 Memory 以 Token 形式给到大模型，Token 长度过长该如何处理？21.强化学习有哪些常用技巧？22.若通过 SFT 进一步提升模型准确率，常用的手段有哪些？23.SFT 的理想数据量是多少？如何确定？24.SFT 数据分布一般怎么取？为什么选择该分布而非其他分布？

点赞评论收藏

分享

03-09 15:13

吉林农业大学算法工程师

AI-Agent 面试题汇总 - 大模型篇

一、大语言模型基础1. 目前主流的开源模型体系有哪些？主流开源模型体系包括：LLaMA 系、Qwen 系、GLM/ChatGLM 系、Mistral/Mixtral 系、Baichuan 系、DeepSeek 系、InternLM、Yi 等。面试里建议从以下维度比较：参数规模（7B/13B/70B…）上下文长度（8K/32K/128K…）多语言能力工具调用能力（function calling / agent）推理成本与部署难度开源协议（是否可商用）2. Prefix LM 和 Causal LM 区别是什么？Causal LM：严格自回归，token 只能看左侧历史（下三角 mask）。Pr...

AI-Agent面试实战...

点赞评论收藏

分享

02-26 05:35

门头沟学院机器学习

字节LLM算法二面-实习面经

攒人品中！ 1.手撕mha写完之后问了几个问题：1. rope应该加在哪里2. kvcache怎么加3. dropout加在哪4. mask怎么加拷打简历业务场景题：比如针对业务需求怎么构建数据集

查看5道真题和解析

点赞评论收藏

分享

02-23 22:11

上海交通大学算法工程师

线程池有哪些核心参数？

面试题简述你平时用过线程池吧？那你说一下线程池有哪些核心参数？提交任务有哪几种方式？如果线程池里的任务抛异常了，你一般是怎么感知和处理的？面试官想听的这道题本质上考察的是并发模型的理解。核心考点在于：1、你是否理解线程池设计背后的资源控制和并发治理，而不仅仅是记住参数；2、你是否理解不同任务提交方式的语义差异，特别是它们如何影响任务的执行和异常处理；3、你是否处理过线程池异常丢失的问题，并能在生产环境中做到预防和监控。面试回答举例线程池的核心目标在于 复用线程、控制并发度、避免资源耗尽。线程池的设计围绕着资源控制和并发治理展开，其核心参数都是为了确保在并发任务量突增的情况下，既能保证系统稳定运...

技术必备题库

点赞评论收藏

分享

03-05 18:53

中国地质大学（武汉）数据仓库

腾讯后端一面

历时80分钟，全程被面试官笑着拷打。。。1.自我介绍2.上来两道算法题要求30分钟，一是树的层序遍历，而是数组的深度遍历（ [1,2,3] 输出[1,3,2],[1,2,3],[2,3,1],[2,1,3] [xxx]）3.说说你了解的比较熟悉的技术栈3.实习觉得做的比较自豪的事情4.实习时候的数据的准确率和及时性怎么保证的5.怎么理解元数据的，怎么完善数据资产/血缘的6.rag怎么做的7.说说进程和线程区别，线程是不是越多越好8. cpu内存访问的流程9. tcp为什么三次握手不是两次？10. tcp拥塞控制了解吗11.  https相比http具体还用了什么协议？12  输入一个网页地址发生了什么？13 索引失效的例子14 怎么判断sql是否慢，命中了索引没有？15 了解数据库里面的binlog reglog之类吗16  了解协程吗？（只了解携程。。。。）17  说说大模型和agent区别，mcp和function call 区别18  skill和之前的提示词工程有啥区别19  对ai未来的看法面试官知道我是搞数开的没问啥java后端方面的技术，而且一直跟我说没关系，再加加油吧

SilkSong_Z...：我去，问的比较基础啊，而且算法也是比较简单的，有后续吗？

点赞评论收藏

分享

评论

4

6

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你感受到金三银四了嘛？ #

42722次浏览 447人参与

# 你都用AI做什么 #

33490次浏览 314人参与

# 今天你投了哪些公司？ #

78991次浏览 1562人参与

# 携程笔试 #

116190次浏览 722人参与

# 虽然0面试，但今天___，夸夸自己 #

4237次浏览 109人参与

# 秋招感动瞬间 #

117696次浏览 544人参与

# 春招 / 实习投递，你最焦虑的一件事 #

37266次浏览 779人参与

# 如果给AI员工评绩效，我的答案是…… #

5363次浏览 130人参与

# 找工作，你都让AI帮你做什么？ #

3772次浏览 140人参与

# 哪一刻你对工作祛魅了？ #

12936次浏览 131人参与

# 实习学不到东西正常吗？ #

5117次浏览 83人参与

# 签约/解约注意事项 #

889099次浏览 4727人参与

# 刚工作的你，踩过哪些坑？ #

3224次浏览 78人参与

# 滴滴求职进展汇总 #

313297次浏览 2488人参与

# 今年找实习到底有多难？ #

11353次浏览 116人参与

# 为了秋招你都做了哪些准备？ #

34279次浏览 544人参与

# 快手工作体验 #

312512次浏览 2914人参与

# AI时代下，你的岗位要求有什么变化？ #

5842次浏览 114人参与

# 苦尽甘来时，再讲来时路 #

74143次浏览 958人参与

# 2023毕业生求职有问必答 #

238655次浏览 1676人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务