闭麦源杀鸡

昨天 17:07 门头沟学院 Java 发布于山东

关注

4.7智谱华章一二面

一面：

感觉没问什么

像是被迫来面试我的

二面：

被拷打完了

1.这个skill是怎么测评的？（被说明做这个没有意义）

需要有一定的指标，比方说之前生产图片的质量不行，人为进行标注可利用率65%，之后调用完了可利用率到达80%作用，效果非常可观；具体指标这个得根据需求来说，需求覆盖哪些风格，哪些镜头，甚至一致性的，对应出一系列的测试集，可以人工评测也可以用模型去评，重点是评测数据结果。

2.最后用户的使用数据？

没有评测数据，也没有用户的使用数据，那你这个东西做了和没做有什么区别？？命中率是如何提升的？

3.所做的任务对于命中率的贡献是多少？

4.工作有问题，对结果并不敏感，做了和没做一样。

反问：公司的评测标准是什么样子的？

根据需求和指标，设计不同的测试集，比方说我们要实现skill，一定是因为我们认为当前阶段用裸模型他没有办法完成我们的交付或者说是技术上的指标；

对于标准产品的话，我们其实会有一些自动化的方法，或者就是跑个评测的agent，然后我们认为评测的agent和我们人工标注对齐，就可以采纳使用了。

核心是评测，而不是评测办法，做一件事情一定是有指标的，去设计一些指标他能准确的评估你对做这件事情的价值。

感觉整场面试全是围绕着指标，感觉面试官讲的很有道理，感觉像是大手子哈哈哈哈

虽然被狠狠拷打了但也是学到了一些思想和方法

加油干吧

全部评论

推荐最新楼层

昨天 14:43

南京信息工程大学 golang

26届春招0面试

bg南京某双一流本，go后端开发，一段小厂实习三月中下开始投递，陆续收到了五六个笔试，推了一两个之后没再收到下一次的笔试通知。笔试完的公司也都在简历筛选中不发面试。有几家直接发了感谢信或者笔试都没有发。boss投递的基本上是已读不回，要么就是让去官网网申或者收了简历之后没下文。真的好焦虑，每天坐下来先投一会简历，学也学不下去，感觉人都有点麻木了，完全不像刚开始每天坐下还能学一会，刷点算法看点八股，感觉每天都到图书馆坐下发呆，也不知道在干什么。秋招的时候有实习公司的转正，自己还给拒绝了想着春招冲一波，这下是真的被狠狠打败了。

春招至今，你收到几个面试...

点赞评论收藏

昨天 18:56

电子科技大学软件测试

智元机器人-软测

3个面试官，没开摄像头，我最开始开着摄像头，但电脑黑屏了一下，摄像头自动关了，面试官也没说什么1.首先自我介绍2.项目提问 面试官很好，技术非常棒，针对我的项目还给我讲了相关问题。我项目经验讲的一般，多亏了面试官，补充了细节上的不足。3.你之前应该是自动化做过一些自动化测试，那你对于完整的测试流程，常规的一些测试流程了解吗？4.举个例子吧，说一下你的你之前的写的用例，你的需求是什么样，你是怎么设计的。5.我们是做机器人，你有没有了解过机器人，或者是说你觉得做机器人测试最核心的测试点是什么，比较关注什么？6.问毕设完成没？问什么时候实习。反问由于项目没有回答得很好，基本上就没问什么。

点赞评论收藏

昨天 17:45

门头沟学院 Java

百度ai agent开发春招一面

一、自我介绍与项目深挖做一下自我介绍。简单讲一个你最有代表性的项目，你在其中解决的最关键问题是什么？结合实习或项目，做细节追问（工作流、职责、决策、挑战等）。二、Agent 与提示工程相关提示词模板是怎么设计与迭代的？你如何判断一个模板真的变好了？你们的 Agent 是单 Agent 还是多 Agent？为什么这么设计？有没有考虑过替代方案？Agent 的任务是怎么拆分的？拆分粒度是怎么决定的？上下文是如何构建的？你们怎么避免上下文过长或信息污染？如果上下文窗口不够，你会优先保留哪些信息？为什么？三、代码理解与单测生成（工程场景）做代码理解时，AST、调用关系这些信息是怎么用起来的？单测生成里，哪些代码不适合生成单测？你们是如何识别并过滤的？覆盖率高但测试质量很差，你见过吗？你们是如何解决的？mock 在单测里什么时候是必须的？什么时候反而会带来问题？如果一个函数同时依赖数据库和 RPC，你怎么让模型生成的单测稳定运行？你们如何评估生成单测的质量？ 除了覆盖率，还有哪些指标有效？四、LLM 基础与 Transformer 细节LLM 的输入到底是什么？模型真正看到的内容包含哪些？self-attention 的核心作用是什么？为什么要拆成 Q、K、V？为什么 attention 能建模长距离关系？为什么需要 multi-head？attention 为什么可以看成动态加权？同一个 token 的 Q、K、V 为什么不相同？attention 复杂度很高，当上下文特别长时，你会怎么优化？模型产生幻觉的常见原因是什么？工程上有哪些方法可以降低幻觉？五、后端与系统基础Python 有多线程吗？GIL 是干嘛的？什么时候多线程才是有用的？讲一下 C++ 从源码到可执行文件的完整编译流程。六、算法题（手撕）给定一个数组 nums，计算所有子数组的中位数之和。定义：如果子数组长度为奇数：中位数 = 排序后中间的数。如果为偶数：中位数 = 排序后靠左的那个数。要求：计算所有子数组的中位数之和。

查看24道真题和解析

点赞评论收藏

昨天 16:23

香港理工大学测试开发

度小满内推码

作为金融科技公司，日常都会有各种技术技巧课堂，快来加入我们吧!!! 度小满内推码：BN2E98M 内推链接：https://duxiaoman.jobs.feishu.cn/s/pkFdqSQd4KA 度小满是一个极好的工作场所，加入我们的大家庭！

点赞评论收藏

昨天 21:21

已编辑

西安电子科技大学后端工程师

腾讯录用评估，求伯乐码

timeline:3.19 一面3.24 二面，6天后流程结束3.30复活赛4.2 一面4.7 二面4.8 hr面+云证

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 给工作过的公司写一条大众点评，你会怎么写？ #