首页 / 数据人的面试交流地
#

数据人的面试交流地

#
630064次浏览 9805人互动
虽然说每年秋招都很难,但今年真的是难破天际了!即时记录你的面试,跟其他小伙伴抱团交流吧~
此刻你想和大家分享什么
热门 最新
字节大数据开发(广告业务)
首先自我介绍,然后I.上来就是两道中等的sql题目:1.SELECT   CASE     WHEN name_count > 1 THEN CONCAT(d.name, s.name)    ELSE s.name  END AS display_nameFROM (  SELECT sp.*, COUNT(*) OVER (PARTITION BY sp.name) AS name_count  FROM student_profile sp) sJOIN department d ON s.department_id = d.id;唯一记录的一条sql,我感觉有小问题,但是感觉面试官很急。我想改他直接说赶紧下一个。为什么select里面用的别名不能直接用到同一个语句中,我回答sql执行顺序的问题,以及在hive中会报错,未找到相应的名字。他笑了,我的回答错了???whateverIII. 考了spark shuffle 的过程,非常的细节,怎么给partition分区?我的回答:spark.default.parallelism,通常等于集群的 CPU 核心数,默认值为 200。或者读取文件时指定分区数。然后这里他又笑了,内心os:这位大佬是微笑大使。IV. 他让我直接写ods 和 dwd 层建模的过程!这一考法我有点不理解要考什么,有木有大佬给我解答一下(感谢)。虽然我写了一部分,但是有的还是忘了。V. 考了我HTTP中reception的作用,不知道这里是不是我听错了,我说能再说一遍吗?他说没时间了,今天就这样吧。总结:自我介绍我太简略了?我想着他手上有我的简历,他好像对我的实习经历有点不感兴趣,因为他说我介绍的时候都是业务层面的?Interview time:One Hour中间还有一些,我就没写了。。。#如何判断面试是否凉了##大家都开始春招面试了吗##数据人的面试交流地##牛客AI配图神器#
查看5道真题和解析
点赞 评论 收藏
分享
面试官:Langchain是什么?与Agent区别
LangChain 是一个开源框架,旨在帮助开发者更高效地构建基于大型语言模型(LLM)的应用程序。其核心思想是通过模块化设计,将语言模型与外部工具、数据源和流程连接起来,从而扩展模型的能力并支持复杂任务的自动化。一、LangChain 的核心概念与功能1. 模块化架构LangChain 提供了六大核心组件,开发者可以像“乐高积木”一样灵活组合这些模块,构建定制化应用。例如:- Models:集成多种语言模型(如 GPT-4)和文本嵌入模型。- Prompts:通过模板管理提示词,优化模型输出质量。- Indexes:支持文档加载、分割、向量存储和检索,增强模型对结构化数据的处理能力。- Memory:维护对话历史或上下文信息,确保交互的连贯性。- Chains:将多个模块串联为固定流程(如问答链、摘要链)。- Agents:动态选择工具执行任务(后文详述)。2. 实际应用场景LangChain 被广泛用于构建智能问答系统、自动化客服、文档分析工具等。例如,一个旅行顾问机器人可通过 LangChain 整合实时天气 API 和航班数据库,提供动态建议。二、Agent 的定义与作用Agent 是 LangChain 中的一个核心组件,其本质是“动态决策引擎”,利用语言模型的推理能力选择工具并执行任务。特点包括:1. 动态流程控制Agent 根据问题类型和上下文选择工具,例如先调用搜索引擎获取信息,再通过数据库检索补充细节,形成多步骤推理(如 ReAct 范式)。2. 工具集成支持内置工具(如 Google 搜索、Wikipedia)和自定义工具(如调用内部 API),通过tool快速注册功能函数。3. 适用场景适用于需要灵活决策的复杂任务,例如多条件数据分析、动态旅行规划等。 #牛客激励计划#  #产品经理#  #产品每日一题#  #晒晒你的元宵动态#  #牛客创作赏金赛#  #数据人的面试交流地#  #总结:offer选择,我是怎么选的# #牛客AI配图神器#
点赞 评论 收藏
分享
面试官:Prompt vs SFT的优缺点分析?
点赞 评论 收藏
分享
4.25腾讯云智数开一面
1. 基本情况方向:数据工程,时间:40分钟结束、16:00开始,无手撕,多场景2. 自我介绍3. 一些能够回忆起来的(或许有不正确的地方):(1)提问R:你这个项目是课程作业还是什么?R:那你说说Hive和ClickHouseR:你谈到了OLAP,那和OLTP有啥区别?R:没了?ClickHouse适合那种场景?R:可以用作实时数仓吗?R:课程中有数据库相关的吗?只有数据结构与算法?R:MySQL系统学习过吗?R:数据怎么导入到ClickHouse的?R:直接到ClickHouse?R:数仓分层?四层讲讲。R:那为什么要分层呢?DWS已经差不多了为什么还需要ADS呢?R:场景题:在你的表上新...
牛客861513826号:A场景题:数量统计不说了;退货平均时间:先沟通清楚,月平均退货时间算不算上不退货的用户,不算的话,就只计算退货用户;一个用户的退货时间减去到货时间拿到这件商品的退货时间,然后计算每个退货用户的退货时间,AVG开窗partition by月份,计算出每个月的平均退货时间。如果要算上不退货的用户,也就是让这个用户的退货时间是0,然后对所有用户计算AVG同上。 B场景题:结合下面他提示你再想想数据倾斜,其实这道题是想靠你数据倾斜怎么解决;本来是一个商品购买信息表,记录商品信息和购买者信息,如果给购买者信息加上性别,要求算出每个商品不同性别的购买人数。百分之八十女性用户,所以如果单纯对表进行分组聚合,会产生数据倾斜问题,由分组聚合产生。五种办法可以解决,两种hive参数,三种SQL,往SQL方向聊,以防他追问参数底层,参数这种东西最难聊了,别给自己挖坑
查看29道真题和解析
点赞 评论 收藏
分享
2024-11-05 17:16
门头沟学院 C++
WPS金山C++一面凉经
1.C++有哪些特性,请使用一段代码演示这些性质。我写了一些经典的继承,子类中重写的父类的虚函数,然后用父类指针指向子类对象,去实现多态。但是写的时候有点脑子发昏,把所有成员全public了,被面试官点评为这违背了封装。2.写两个类,两个类分别有一个虚函数,然后有一些char和int类型,写一个子类去继承这两个类。3.问上述子类的大小?我考虑两个虚函数指针以及内存对齐之后,给出了正确的大小。然后被面试官套路了,问我有子类有两个虚函数指针吗?我说没有只有一个,然后把答案改错,我是个傻子。4.如何指针类外访问私有成员?一开始是问如何访问私有成员,我说可以使用友元函数。忘了面试官怎么说的,但是引导我用指针去思考。我没写出来。后面查了一下,可以把类的指针转用reinterpret_cast成对应的数据类型,然后考虑此前类内的内存分布后,给指针位移去找到对应的变量。5.一些常规C++八股,智能指针和移动语义。6.问智能指针对象本身是不是线程安全的。7.问我自己写的一行代码,代码内容是用new申请一块堆内存,问这是不是线程安全的。8.c++的STL八股。9.问map和vector在已知key和下标的查询复杂度。我回答都是O(1)。10.c++sort是怎么实现的?我回答:我说根据数据量大小选择快排,堆排。不知道有没有归并,我没查过。11.用快排实现查询第K大的数。这个我写出来了,但是差以为,因为小标是0开始的,所以我实现的版本是第0大的数字是大的,而不是第一大的数字。#哪些公司面试官让你印象深刻?###金山###wps##牛客创作赏金赛##数据人的面试交流地##远程面试的尴尬瞬间##面试中的破防瞬间#
国棉17厂丶小王:sort是长度小于32选择插入排序。大于32选择快排,快排采用递归进行,如果递归栈的层数超过了1.5log n,那么就改用堆排,快排随机数的划分,40个以上采用九数取中,40个以下3数取中。(随机选择和递归深度msvc是这样的,其他stl不清楚),但是排序算法是这三个都一样的
查看11道真题和解析
点赞 评论 收藏
分享
玩命加载中
牛客网
牛客企业服务