说实话,看了一眼牛客还挺难受的

本人bg:华东理工大学,软件工程专业,24届,目前在B站,人工智能平台部做开发工程师,做大语言模型(LLM)相关的业务

最近同事聊到了牛客,来看了一眼,发现刚入职的或者刚实习的好多人都在吐槽,刚开始还觉得比较好,这里可以作为承载大家情绪的出口,但是后面仔细想想,越想越不对,一直这么吐槽还是治标不治本,公司还是这样,大家也可能要越来越卷,还是觉得来分享一下我的心得感受,希望一来能缓解一下大家的焦虑,不管是求职的还是在职的,二来希望能帮助今年的25届有更多的视角,防止后面选择offer后进入公司发现不符合预期的被动。

1. 工作以后真的会不开心么

先说我的结论吧,我目前是开心的,我觉得这个取决于两个方面,一方面是你对于工作的态度,另一方面是公司本身到底如何。

先说对于工作的态度,这个是很容易被忽略的,因为我们从小都是被社会推着走的,什么时候告诉我们该高考了,什么时候告诉我们该找工作了,但是其实没人告诉我们为什么要找工作,都是别人找了你就需要找。我是属于工作需要做感兴趣的事情,同时能有正向的激励回馈就可以。

刚好B站是我最喜欢的网站,而且是喜欢了好多年的产品了,记得我刚高考完那一阵,我最喜欢的游戏up主在B站开号了,我就一直跟着看,到后面看一些喜欢的电影up主,音乐up主,二次元up主,鬼畜up主,B站一直也是我刷手机和电脑必开的网站。

说回正向激励,我觉得正向激励回馈和付出是正相关的,至于有多正相关,就看个人的度了,建议是客观的,围绕市场情况来建立预期,就不太会有苦恼的时候了,而且反而越是这种情况你的潜能发挥的也越多,比如我当时拿到好几个头部大厂的offer,薪资包其实差不多,可能差个一两万,说实话都是第一梯队,没有什么差距,相比之下我更在乎我后面可以成为什么样的人,这个还是涉及到我对于工作的地位,其实去哪里都是打工,所以我更喜欢去一个我喜欢的地方,同时能快速成长的地方,这样我不会觉得我在虚度青春,既做了感兴趣的事情,也给自己加了铁饭碗的能力。

再回到公司本身到底如何,我看牛客上的职场吐槽大会,有吐槽加班文化的、有吐槽领导pua的、有吐槽公司不管应届生的、有吐槽同事的。。我建议是多去实习,多去了解,因为听谁说都不如自己见到的,像我自己当时就是在B站实习了一年,在这之前也在阿里美团小红书都实习过,我觉得城市上的话上海整体比北京松弛一些,公司的话B站的工作环境和氛围是最好的,也很人性化,是我唯一见到可以带宠物上班的公司,累了可以吸一吸猫,而且也不卷,就是没有那种无意义的卷,没着急项目的时候可以早走,不用在乎领导在不在,我觉得可以做到wlb,工作时间也很弹性,晚的时候可以11点多到,还有很多见到明星和up主的机会,去年跨年演唱会还见到了周深,现场有人把我眼镜都挤掉了哈哈哈,太夸张了。。。

(捕捉公司内部各种猫,没有什么是撸猫解决不了的)

所以25届的学弟学妹别担心,建立合理预期,想清楚自己对工作的定位,找出满足的公司,好好努力拿到offer。

2. 怎么建立合理预期

合不合理其实都是自己说了算,但是要结合市场情况,以我实习这么多家的感受来看,给大家分享一些个人心得吧。

太卷的有加班文化的我个人不是很推荐,我个人觉得加班文化的形成就是从最开始成立就卷导致的,而且深入骨髓,最开始就没有杜绝或者放任这种文化的形成,那就很难改变,而且我真的不喜欢无意义的卷,如果说项目偶尔比较紧急,短期的工作量大加加班都是能理解的,如果长期加班或者有加班文化,那我会觉得公司没有把重心放在解决问题上,只会无脑控制员工来达成所谓的目标,而且这样的公司往往可能也不人性化,不注重你的身心健康,那必然也不太可能开心。

还看要组内氛围怎么样,毕竟影响我们工作的心情和顺利程度,我的mentor对我也很好,而且第一印象就很深,记得刚实习的时候做向量知识库项目,遇到了faiss索引查询过慢的问题,mentor帮我解答了一些经验上的问题,公司内部也每周有技术交流会,各部门交流先进技术解决方案,有问题可以随时提问,下来也可以交流,技术大佬们都很愿意交流,这样的工作环境真的很难抑郁,还会很有成就感。

另外我个人不建议去技术氛围一般的公司,我觉得技术力还是比较核心的要提升的第一生产力,这个如果大家都是大厂的话大概率技术都不会差,额外需要注意的是部门,因为只有核心部门才更有技术氛围,一方面可能因为核心部门的技术大佬比较多,另一方面核心部门一定也对技术的要求会更高,像我们私下也会偶尔聊聊技术,前段时间独立承担了一个模块的前后端开发,需要用到Go、vue等前后端语言,之前没接触过前端,开发过程中进度也比较慢,我和我们组一个搞前端的前辈一起吃饭的时候他给我输入了很多,最后成功上线了,还蛮感谢的,我个人能力也提升了不少,没准以后可以做全栈了哈哈。这里多提一嘴,我问了我们部门leader我们招不招校招生,说不光招,还得知据说这次盘校招需求,都是确保部门有骨干能培养人,整体稳定发展空间大的,比较边缘化的不太会随便招校招生进来做这个岗位,这点还是挺谨慎,对校招生负责的。

3、如何拿到offer

建立好预期之后,剩下的就是怎么拿到offer了,给大家分享一些我的经验

①如果可以,一定要多实习

实习的好处不仅仅是可以提前了解公司,更是丰富个人代码经历的,可以写到简历上,面试的时候也有的聊,当然,有实习经历的简历也更容易通过。但是不要对实习有太大的可以参与重要项目的预期,很多公司都是打杂,更重要的意义是接触企业真实的开发环境和业务,提升项目实际会遇到的问题的解决能力、思维方式、协作方式等等,当然,也有少部分公司的实习不打杂,可以参与到重要项目中,这个就看幸运程度了。

②多写代码

如果实在有一些困难不能实习,那就多写代码,可以多刷题,也可以自己做一些感兴趣的项目玩玩,多看相关岗位的公开技术资料,这样可以更好的解决自己项目或者写代码会遇到的问题。

而且只要写到简历上的,尤其项目经历、实习经历、刷题经验这三点要准备充分,面试的时候能说清楚,体现出自己的技术能力和理解力。

③真诚和热爱是加分项

B站是个真诚阳光的公司,面试中表现的真诚一些更加分,如果你热爱技术,同时又热爱B站,那一定是更加分的。

差不多就是这么多了,希望大家都能越来越好,在秋招的学弟学妹可以好好准备秋招,选择offer的时候想清楚自己想要什么样的工作,做好调研,已经在工作的但是不太顺心的兄弟姐妹们,我个人建议可以想想自己对工作的态度和公司之间有没有什么gap,有的话可以看看有没有必要离职,不然过于内耗长期下去真的不行,后面一样会离职。

希望这篇能帮助到你们~

看到很多同学都在问,补充一下,b站校招开了,投递链接:哔哩哔哩-招聘,内推码 Y1XET1,看内部内推宣传 ,很多服务端、前端岗位简历量少,竞争没有那么激烈,可以冲。

#B站校招#
全部评论
羡慕上班可以撸猫...
11 回复 分享
发布于 2024-08-28 11:17 上海
uu请问一下大模型方面的开发岗位具体叫什么哇,我在b站秋招看到的岗位都是什么(大模型)算法工程师,算法真卷不了一点
7 回复 分享
发布于 2024-08-28 11:20 上海
🐮
6 回复 分享
发布于 2024-08-28 12:07 湖北
跟算法相关的开发岗真的是我很心仪的方向!因为纯算法有点太卷哈哈。如果做开发能选到自己喜欢的应用场景真的体验会不错。
1 回复 分享
发布于 2024-08-29 15:56 新加坡
🐮
1 回复 分享
发布于 2024-08-28 20:56 上海
二次元工作氛围😂
1 回复 分享
发布于 2024-08-28 16:57 北京
校友可惜前一段时间已经投b站了,还没有面试消息
1 回复 分享
发布于 2024-08-28 16:12 上海
羡慕校友,能问问为什么投了b站一直在初筛中吗
1 回复 分享
发布于 2024-08-28 14:42 福建
1 回复 分享
发布于 2024-08-28 12:30 上海
没办法,总有一些卷人卷公司
1 回复 分享
发布于 2024-08-28 10:57 广东
B站开始了么
1 回复 分享
发布于 2024-08-28 10:53 江苏
好正啊
点赞 回复 分享
发布于 2024-10-18 15:24 湖南
多挤出点hc比什么都好
点赞 回复 分享
发布于 2024-10-09 13:53 陕西
校友,祝好
点赞 回复 分享
发布于 2024-09-29 13:38 北京
已投,感谢🙏
点赞 回复 分享
发布于 2024-09-12 17:43 河南
双非还有机会吗
点赞 回复 分享
发布于 2024-09-04 00:07 湖南
徐汇区华东理工
点赞 回复 分享
发布于 2024-09-02 19:07 四川
一直初筛中是不是要挂了呀,需要换个岗吗,8.19投递的了
点赞 回复 分享
发布于 2024-09-02 16:47 江苏
已取内推码投递,感谢博主分享
点赞 回复 分享
发布于 2024-09-02 12:47 上海
论文是不知名期刊,能投研发工程师【2025届】 三个方向:搜推、模型工程、大模型和AIGC嘛 真诚发问
点赞 回复 分享
发布于 2024-09-02 00:46 安徽

相关推荐

1. 什么是MCP参考面试回答:MCP模型上下文协议)是为大型语言模型提供的一个统一标准化接口、让AI能够无缝连接各种外部数据源和工具。可以将它比作AI世界的USB接口—只要遵循这个协议标准、任何数据源或工具都能与语言模型实现即插即用比如说传统的AI只能依赖预训练的静态知识、无法获取实时数据。而通过MCP,模型可以动态访问最新信息、比如查询搜索引擎、读取本地文件、调用第三方API、甚至直接操作各种工具库。比如说可以访问Github、IDEA这个协议最大的价值是标准化、它是MCP的核心价值 - 你不需要为每个AI模型和每个工具之间的连接编写专门的代码、只要双方都支持MCP协议、它们就能自动"对话"。这大大简化了系统集成、降低了开发成本、也提高了系统的可扩展性总结就是 MCP 创建一个通用标准、使 AI 应用程序的开发和集成变得更加简单和统一2. 大模型输出出现重复和幻觉如何解决参考面试回答:在大模型生成内容时、出现重复和幻觉是两个常见的问题。重复指的是模型在生成文本时出现内容重复的现象、而幻觉则是指模型生成了看似合理但实际上不真实或不准确的信息。为了解决这两个问题、可以通过微调(fine-tuning)的方法进行优化为了解决这些问题、首先微调是非常有效的手段。首先可以确保用于训练的数据质量、要高质量的真实的信息。我们可以减少模型学到错误的信息。特别是领域特定的微调、能帮助模型更准确地生成内容,避免在特定领域(比如医疗、金融)中产生幻觉。此外在训练过程中引入惩罚机制、比如对模型生成重复或不准确内容进行惩罚、也能够引导模型生成更为多样和真实的内容。另一个有效的策略是使用参数高效微调(PEFT)、通过像LoRA这样的技术、在不改变模型主体结构的情况下调整部分参数、从而提高微调效率并减少幻觉的产生。同时强化学习与人类反馈(RLHF)也是一种非常有用的方法、结合人类的评价、模型可以在生成内容时更符合实际世界的逻辑,降低幻觉的风险。最后检索增强生成(RAG)技术也能够显著提高模型输出的准确性、通过在生成过程中引入外部知识库、确保模型生成的信息更为真实和可靠。总的来说:通过微调、引入惩罚机制、领域特定训练和强化学习等方法、可以有效减少大模型的重复和幻觉问题3. 什么是RAG?流程是什么?面试参考回答:RAG就是结合信息检索和生成式模型的技术。主要流程包括两个核心环节:检索:基于用户的输入、从外部知识库(如数据库、文档、网页)检索与问题相关的信息。通常使用向量化表示和向量数据库进行语义匹配。将知识库中的文档进行预处理、分块、清洗并转换为向量表示、存储在向量数据库中。常用的如 Faiss、Milvus等向量数据库存储所有文档向量。用户提问后、对问题进行向量化、并在数据库中执行最近邻搜索、找出语义最相近的 N 条内容然后就是增强:也可以说是构建 Prompt1.将检索到的信息作为上下文、输入给生成模型(如 GPT)。2.相比纯生成模型、RAG 能引用真实数据、减少幻觉(胡编乱造)最后就是由将增强后的上下文输入到大型语言模型、综合已有上下文生成最终生成最终的回答或内容。一句话总结: RAG = 向量搜索引擎 + 大模型、让 AI 回答更靠谱、减少幻觉4. RAG的详细完整的工作流程参考面试回答流程:RAG(检索增强生成)的完整流程可分为5个核心阶段:1. 用户提问2. 数据准备:清洗文档、分块处理(如PDF转文本切片)2. 向量化:使用嵌入模型(如BERT、BGE)将文本转为向量。也就是Embedding 向量化3. 索引存储:向量存入数据库(如Milvus、Faiss、Elasticsearch)。4. 检索增强:用户提问向量化后检索相关文档。也就是构建 Prompt (问题 + 检索内容)5. 生成答案:将检索结果与问题组合输入大模型生成回答。5. 在 RAG 中的 Embedding 嵌入是什么参考面试回答:Embedding是RAG系统的核心组件、Embedding(嵌入)技术本质上是将文本、图像等非结构化数据转换为高维向量的过程。在实际应用中Embedding解决了传统关键词检索的局限性。比如用户询问如何煮奶茶时、传统检索可能无法找到包含'奶茶制作步骤'的文档、因为它们字面上不匹配。而通过Embedding、系统能够理解这两个表达在语义上的相似性、从而返回相关内容。Embedding的工作原理是通过深度学习模型(如BERT、Sentence-Transformers等)将文本映射到768维或更高的向量空间。在RAG系统中、Embedding的核心价值在于建立查询和文档之间的语义桥梁。当系统收到用户问题后、会将其转化为向量、然后在预先索引的文档向量库中寻找最相似的内容、无论它们在字面表达上是否匹配。这种基于语义的检索方式大幅提升了信息获取的准确性和完整性、为生成模型提供了更高质量的上下文信息,从而产生更精准的回答6. 什么是LangChain参考面试回答:LangChain 是一个开源框架、专为快速构建复杂的大语言模型应用而设计。简单来说就是它集成和内置了很多我们开发 AI 大模型应用需要的东西、如内置文档加载器、向量数据库、HTTP API 封装、云服务适配器等、让咱们开箱即用、有点像咱们 Java 届的 Spring。它最大的特点是把模型调用、提示词管理、工具使用、记忆管理这些能力模块化了、让开发者可以很方便地把大模型和数据库、搜索引擎、API服务等结合起来,用链式结构组织复杂任务。主要支持复杂任务编排:通过 Chains(链)和 Agents(代理)将多个LLM调用和工具操作组合成工作流以及实现上下文管理Memory(记忆):通过 Memory 组件(如对话历史缓存、实体关系跟踪)实现长对话连贯性。6. 什么是向量数据库参考面试回答:我的理解是:向量数据库它可以将非结构化数据(如文本、图片、音频等)转换成高维向量的形式进行存储、通过向量数据库预先存储结构化段、实时检索最相关的 Top-K 内容作为上下文输入、并通过高效的相似性搜索算法、快速找到与目标向量最接近的数据项。传统数据库采用存储数据、主要用于精确匹配查询、常用的检索方式就是精确匹配、索引结构有像B+树或者倒排索引的结构。而向量数据库针对高维向量数据优化、支持近似最近邻(ANN)搜索算法、更适合语义相似性搜索。可以理解为TopN系列、检索TopK相关内容作为上下文输入。向量数据库预先向量化并建立索引(如 HNSW、IVF),实现亚秒级检索。代表性的向量数据库就是Milvus:一个开源的向量数据库系统8. 向量数据库的核心原理是什么?核心技术是什么参考面试回答:向量数据库的核心原理是通过将高维数据(如图像、文本)转换为多维向量、并基于相似性度量(如余弦相似度、欧氏距离),利用高效的索引结构和近似最近邻(ANN)算法、快速检索与目标最相似的向量结果。这一过程可概括为三个关键步骤:首先是向量化:我们通过嵌入模型将非结构化数据映射为稠密向量、比如用BERT处理文本、ResNet处理图像、或CLIP处理多模态数据。这些模型能捕获数据的语义或特征信息、通常生成128到2048维的向量其次是索引构建:为了高效检索、我们会采用分层导航小世界图(HNSW)等结构预处理向量。HNSW能将搜索复杂度降至对数级O(log N)。同时我们还会利用乘积量化(PQ)来压缩向量、减少内存占用、以及通过倒排索引(IVF)缩小搜索范围。最后是近似搜索:在实际应用中我们允许一定误差来提升速度。ANN算法会在准确性和效率间寻找平衡点、确保在毫秒级延迟内返回Top-K相似结果、同时保持95%以上的召回率。总的来说就四个核心层:向量化引擎->索引结构 ->相似度计算->搜索原始数据 → 向量化 → 索引构建(HNSW/PQ/LSH) → 输入查询向量 → ANN近似搜索 → 返回Top-K结果(格式明天再改吧___发帖于2025.6.25 00:47)
everll:更多见《牛客面经八股》https://www.nowcoder.com/exam/interview
点赞 评论 收藏
分享
评论
214
230
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务