2023-01-11 21:42 华为HUAWEI_华为电信云平台开发

发布于广东

关注

中原银行算法工程师面试之解答

Bert的模型架构讲一下？

BERT模型的全称是：BidirectionalEncoder Representations from Transformer，也就是说，Transformer是组成BERT的核心模块，而Attention机制又是Transformer中最关键的部分，因此，利用Attention机制构建Transformer模块，在此基础上，用多层Transformer组装BERT模型。

Attention机制主要涉及到三个概念：Query、Key和Value。在上面增强字的语义表示这个应用场景中，目标字及其上下文的字都有各自的原始Value，Attention机制将目标字作为Query、其上下文的各个字作为Key，并将Query与各个Key的相似性作为权重，把上下文各个字的Value融入目标字的原始Value中。该Attention机制也叫Self-Attention。

说一下机器学习和神经网络之间的模型之间的区别

1.数据依赖

随着数据量的增加，二者的表现有很大区别：

深度学习适合处理大数据，而数据量比较小的时候，用传统机器学习方法也许更合适。

2.硬件

深度学习十分地依赖于高端的硬件设施，深度学习都要求有GPU参与运算。相反，普通的机器学习对于硬件不太依赖。

3.特征工程

在机器学习方法中，几乎所有的特征都需要通过行业专家在确定，然后手工就特征进行编码。

然而深度学习算法试图自己从数据中学习特征。

4.模型大小

深度学习训练出来的模型参数可以达到几千亿，非常大。而机器学习模型很小，甚至有的算法本身就是模型，可执行文件很小。

5.运行时间

深度学习需要花大量的时间来训练，因为有太多的参数需要去学习。但是机器学习一般几秒钟最多几小时就可以训练好。

而运行时间机器学习更快，甚至几ms

6.可理解性

深度学习很多时候我们难以理解。至今无法用精准的数学模型来描述。

但是机器学习不一样，比如决策树算法，就可以明确地把规则给你列出来，每一个规则，每一个特征，你都可以理解。

如果模型过拟合了应该怎么处理？

以上答案均来自本人专栏：机器学习面试题汇总与解析（蒋豆芽面试题总结）

欢迎大家围观：https://blog.nowcoder.net/jiangwenbo

牛友面经解答文章被收录于专栏

这个专栏专门用于为牛友解答面经，希望能帮助到大家。

全部评论

推荐最新楼层

05-06 20:34

阿里巴巴_Java开发工程师

从阿里被裁到快手升P6，我花了四年

520那天晚上，公司正在为618忙得热火朝天，我却一个人坐在会议室里哭01 少年心事当拿云我本科是电气工程专业，19年跨考了计算机，靠着小公司实习的跳板，21年面进了阿里的暑期实习。实习入职给我的评级是B，不过做了三个月之后，实习转正答辩也不错，结果当天就给我的评级提到了A，22年正式入职。就这样到了23年上半年，接了个大项目，是对我个人能力提升巨大的一个项目，跟在组里的一个资深的P7后面做，跨了三个事业群去推动一件事情，他负责统筹协调，我负责技术实现，学习到了很多相关技巧，很多横向合作的能力都是在这里练出来的。这个时候我觉得我好像还可以，在大团队的同期里面应该算是比较靠前的，两年升P6应该是...

爱吃香菜的无尾熊服了...：好文共勉了兄弟加油

点赞评论收藏

分享

今天 09:23

北京邮电大学嵌入式工程师

不是现在还能有KPI啊！

经常有面试 20分钟 秒挂？ 能力问题还是KPI？线上沟通啥也不问，直接让面试有些HR线上跟求职者沟通，联系上以后不问教育背景、工作经验、求职意向直接发一个岗位介绍让你去面试。这种铁KPI.毕竟正常公司招人都不会这么草率。一、首先先说几个明显是HR刷KPI的行为1、 你上一秒刚发完简历， 下一秒HR就邀请你去面试的正常的面试邀约步骤如下：HR先仔细阅读下你的简历，觉得有意向然后给业务方。业务方觉得简历也ok,然后反馈给HR内部双方对齐后，才会电话询问你的意向最后才发出正式的邀约邮件，邀请你面试。所以你的简历发给HR，到HR正式向你发出面试邀约。中间肯定需要时间来走内部流程的。这个流程短则1-2...

点赞评论收藏

分享

不愿透露姓名的神秘牛友

03-20 12:46

27届一段大厂现在零面试

是简历有什么问题吗，求大佬指点要玉玉了

瘦嘟嘟右卫门：百度文库网盘的暑期也没约面吗

点赞评论收藏

分享

05-04 08:45

蚌埠坦克学院嵌入式软件开发

嵌入式面试八股文：暑期实习准备指南

想拿到嵌入式暑期实习，单靠项目还不够，基础知识的“八股文”依然是面试的核心考察点。很多同学项目做得不错，但在基础问题上答得不系统、不深入，最终错失机会。下面从常见考点出发，给你一套高效准备思路。一、C语言基础：必须扎实嵌入式岗位对C语言的要求远高于普通开发岗，重点不在语法，而在底层理解。重点内容：指针与数组的本质区别const、volatile、static 的作用内存分区（栈、堆、全局区、常量区）结构体对齐与内存布局函数调用过程（压栈、返回地址）高频问题：volatile 为什么在嵌入式中很重要指针和引用（如果涉及C++）的区别malloc 和 free 的底层机制建议：不要死记，尽量做到“...

点赞评论收藏

分享

评论

14

56

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如果春招能重来，我会___ #

27457次浏览 274人参与

# 机械人还在等华为开奖吗？ #

338839次浏览 1652人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

49016次浏览 603人参与

# 这个offer值得去吗？ #

28360次浏览 206人参与

# 大学最后一个寒假，我想…… #

103073次浏览 846人参与

# 你会因为行情，降低找工作标准吗？ #

42412次浏览 312人参与

# 在爱玛，骑向未来 #

19048次浏览 372人参与

# 机械求职避坑tips #

103499次浏览 589人参与

# 刚入职就____，这样正常吗？ #

147752次浏览 708人参与

# 记录我的毕业季 #

3236次浏览 87人参与

# 去年你投递实习了吗？ #

32743次浏览 339人参与

# 字节开奖 #

158044次浏览 772人参与

# 今年找实习到底有多难？ #

104661次浏览 489人参与

# 秋招盘点:机械人值得去的企业 #

106369次浏览 741人参与

# 有深度的简历长什么样？ #

60613次浏览 771人参与

# 金融财会交流会 #

150927次浏览 498人参与

# 今年春招是金一银二嘛？ #

104856次浏览 566人参与

# 华为池子有多大 #

177368次浏览 926人参与

# 你被哪些公司挂了？ #

194266次浏览 1051人参与

# 字节求职进展汇总 #

1857162次浏览 15497人参与

# 实习怎么做才有更好的产出 #

50743次浏览 465人参与

# 腾讯音乐求职进展汇总 #

174373次浏览 1180人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务