2019-12-05 08:46 已编辑

关注

入坑NLP一——Skip-Gram 模型理解

1 首先介绍一下one-hot编码:)

举个栗子，
“he is a sunshine boy",
我们想把这句话中的每一个单词都用向量表示，一共5个单词，我们就用5-dim的向量来表示。
he => (1,0,0,0,0)
is =>(0,1,0,0,0)
…
boy =>(0,0,0,0,1)
像这样，对应的维度为1，其余的维度都为0，这种表示方式就是one-hot了。

2 Skip-Gram模型

我们可以看到，one-hot仅仅能用来表示一个单词，不能表示单词之间的关系；这里的Skip-Gram模型的最终目的是为每一个单词建立一个d-dim的词向量，词向量能反映单词之间的相似度。

方法

采用的方法非常有意思，构建一个三层的全连接神经网络，
输入层：中心单词的one-hot表示，一个n维向量；（n为词汇表维度）
隐藏层：输入通道为n，输出通道为d；
输出层：输入通道为d，输出通道为n。

所采用的训练数据，input为某个i位置的单词one-hot表示(0<=i<n)，label为上下文单词的one-hot表示（上下文说的是半径r内的单词）。

利用softmax分类器，最终能得到一个单词的上下文在词汇表上的概率分布，跟label对比计算误差，反向传播，让模型就这样训练。

最终所需要的结果

我们知道，输入层到隐藏层，是有一个参数连接的权重矩阵W的，维度为n * d，而这个W就是我们最终需要的。（简直太神奇了，辛辛苦苦做一个分类器，最终要的不是这个分类器，而是里面的权重矩阵）

我们知道，词汇表是n-dim的，而这里n * d的矩阵，正好给每一个单词都能对应上一个d-dim的向量，我们称之为单词的词向量。

好处

d一般不会太大，节省空间；
通过计算不同单词词向量的内积，能得到他们的相似度。

全部评论

推荐最新楼层

02-21 16:28

上海交通大学算法工程师

HTTP 和 HTTPS 区别

面试题简述我们平时开发时经常看到 HTTP 和 HTTPS，那你能说说它们之间的区别吗？为什么我们要用 HTTPS？它到底比 HTTP 多了什么？面试官想听的1、HTTPS 如何在 HTTP 基础上增加安全保障2、是否理解加密、认证、完整性的区别；3、能否举例说明浏览器访问网站时两者的不同面试回答举例HTTP 和 HTTPS 本质上都是应用层协议，用于浏览器与服务器之间传输数据。两者的区别在于：HTTP 是明文传输，而 HTTPS 在传输层加入了 SSL/TLS 加密层，实现了数据的加密、身份认证和完整性校验。举个例子：当我们访问 http://example.com 时，所有请求与响应的数据...

查看6道真题和解析

点赞评论收藏

分享

02-19 10:11

门头沟学院 C++

C++ 编译与链接面试题

1. C++程序的编译过程是什么？答案：四个阶段预处理（Preprocessing）处理#include、#define等指令展开宏条件编译生成.i文件编译（Compilation）将预处理后的代码转换为汇编代码语法检查、语义分析优化生成.s文件汇编（Assembly）将汇编代码转换为机器码生成目标文件.o或.obj链接（Linking）将多个目标文件链接成可执行文件解析符号引用重定位生成可执行文件命令示例 # 预处理 g++ -E main.cpp -o main.i # 编译 g++ -S main.cpp -o main.s # 汇编 g++ -c main.cpp -o main.o ...

查看10道真题和解析

点赞评论收藏

分享

2025-12-28 22:19

门头沟学院 Java

后端简历挂麻了

双非本末2硕，有一个研究所的实习，但也是做的图像算法工作，至今为止投了1000份简历，只有10多次面试，而且大部分都是一面挂，是不是简历项目太差了，求大佬指点

不敢追165女神：简历写得毫无特点，你说你要是大二或者大三找寒假实习到暑期实习这段时间，你的简历还能约到面试。但是你是研究生哥，面试官不会因为你是研究生而降低要求，反而会觉得你是研究生才学了这么一点？为什么我不找个同阶段的本科生？

简历中的项目经历要怎么写

点赞评论收藏

分享

02-06 16:33

门头沟学院 Java

92每个班有实习人是不是很多啊

看牛客都好厉害，想知道92✌🏻班里一般有多少有实习的

Phoenix_Re...：很少最多一两个，大多数保研或者摆烂等着考研

点赞评论收藏

分享

02-21 16:24

上海交通大学算法工程师

SpringBoot 自动配置原理

面试题简述你能讲讲 Spring Boot 的自动配置原理吗？Starter 是怎么起作用的？面试官想听的这是校招高频原理题，主要考察候选人能否从以下三个方面串出完整逻辑：1、自动配置触发点；2、加载机制；3、条件装配；面试示例回答Spring Boot 的自动配置其实是基于 Spring 的条件化装配机制 + SPI 扩展机制实现的。入口是 @SpringBootApplication，它包含了 @EnableAutoConfiguration。这个注解会导入 AutoConfigurationImportSelector，在容器启动时从 META-INF/spring.factories ...

查看2道真题和解析

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# xx岗简历求拷打 #

1718次浏览 22人参与

# 金三银四，你有感觉到吗 #

687332次浏览 6071人参与

# 有转正机会的小厂实习值得去吗？ #

2500次浏览 37人参与

# 携程求职进展汇总 #

874349次浏览 5679人参与

# 你最讨厌面试被问什么 #

3760次浏览 46人参与

# 哪些公司开春招了？ #

28633次浏览 191人参与

# 秋招踩过的“雷”，希望你别再踩 #

187003次浏览 1692人参与

# 机械制造2024笔面经 #

1540257次浏览 13005人参与

# 毕业季等于分手季吗 #

54410次浏览 649人参与

# 牛客租房专区 #

157089次浏览 1765人参与

# 26届的你，投了哪些公司？ #

256320次浏览 1686人参与

# 文科生还参加今年的春招吗 #

13004次浏览 98人参与

# 找实习多的是你不知道的事 #

1805254次浏览 20690人参与

# 反问环节如何提问 #

131998次浏览 2702人参与

# 大家每天通勤多久？ #

86633次浏览 841人参与

# 记录实习开销 #

187719次浏览 976人参与

# 校招笔试 #

417436次浏览 2797人参与

# 找工作中的小确幸 #

81475次浏览 451人参与

# 正在实习的你，几点下班 #

300175次浏览 2215人参与

# 如何缓解入职前的焦虑 #

261219次浏览 1466人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务