2020-05-11 09:56 已编辑中山大学数据分析师

关注

【机器学习】N-gram模型计算举例

本文为自我总结。

N-gram模型是一种简单的统计语言模型。通常n的取值范围为1~3，分别称为unigram、bigram、tirgram。
N-gram模型是通过对语料库中连续词的频数统计，采用条件概率的形式，计算出所给语句的概率，从而判断该语句是否高概率出现的方法。

1.unigram的计算
unigra模型假定所有单词之间相互独立。
那么语句"w1 w2 ... wm"的概率为：
$图片说明$

例，我们有三条语句：
doc1：John read Moby Dick.
doc2：Mary read a different book.
doc3：She read a book by Cher.
采用unigram模型计算语句"John read a book."的概率。

$图片说明$

注：unigram模型不用考虑开头和结尾。

2.bigram的计算
bigram模型开始考虑条件概率，即已知前一个词，后一个词出现的概率。
$图片说明$

接上例，
$图片说明$

注：不要漏掉开头和结尾的部分。

3.trigram的计算

即已知前两个词，后一个词出现的条件概率。
$图片说明$

接上例，
$图片说明$

全部评论

推荐最新楼层

07-14 19:06

广东海洋大学运营

2031 年 32.4 百万美元目标：乙醇腈市场的驱动引擎与阻力破解

一、行业相关概述乙醇腈（Glycolonitrile），分子式为 HOCH₂CN，是一种结构中同时含有羟基（–OH）和腈基（–CN）的有机化合物。它通常是无色或浅黄色透明液体，具有轻微的刺激性气味。乙醇腈是氢氰酸与甲醛加成反应的产物，常以约 50% 的水溶液形式存在，虽然具有一定毒性，但相比氢氰酸，其储运和使用更加安全可靠。该化合物广泛应用于有机合成中，尤其在医药、农药、电镀、染料及精细化工等领域作为关键中间体。二、行业市场发展情况在全球化工原料市场中，乙醇腈虽不属于体量庞大的品类，但近年来市场规模呈现稳步增长态势。数据显示，2024 年全球乙醇腈市场规模大约为 25.6 百万美元，预计 20...

点赞评论收藏

分享

07-15 14:49

广州软件学院前端工程师

不是我说，在广州月薪不到8k真的很难…

hello啊，电子朋友们！ 你有没有也问过自己一个问题👇 “在一线城市打工，到底月薪多少才能活下来？” 作为一个在广州工作三年的普通打工人👩💻 我想说一句掏心窝子的话： 👉 “能活下来不难，但活得舒服，真的不容易。” 今天我就来跟你们聊聊—— 在广州，不同收入水平下的真实生活状态。 🧮【我的基本支出清单】（2024年） 📍城市：广州 🏙️ 区域：天河附近（非最贵，也不是最便宜） 🏢 房型：一室一厅 🧑‍💻 职业：前端开发（中等公司）    项目 费用（月）     房租 ¥1500 - ¥2200   水电网费 ¥150 - ¥200   餐食 ¥800 - ¥1200（偶...

月薪多少能在一线城市生存

点赞评论收藏

分享

06-17 20:05

青岛城市学院平面设计

有没有前辈啊

普通本科，视觉传达设计专业，有没有公司推荐

肖恺：你求职意向，别写自己名字啊

点赞评论收藏

分享

07-15 20:47

已编辑

电子科技大学 Java

庆幸自己真的来了拼多多 | 零大厂实习，在PDD找到了一切想要的

985遥感专业本硕，6年没有一段大厂实习经历，第一段实习来到了拼多多服务端研发实习生岗位。研一狠狠搞算法，研二狠狠学JAVA，研二下开始找后端暑期实习，最终在腾讯、京东、拼多多三家offer中选择了拼多多。说实话，当时最抗拒的就是拼多多。懂的都懂。网上铺天盖地的“血汗工厂”、“11116”、“竞业协议”... 我一个遥感转码、没经历过“社会毒打”的学生，听着就头皮发麻。谁不想去个WLB好点、社会影响力更大的、名字听起来更“光鲜”的地方？但最终，我还是“屈服”了。 屈服的原因很现实，也很功利：我需要快速提升技术，秋招背水一战。 我清楚自己转码的背景，缺的就是实打实的、硬核的、能写在简历上镇场子的...

拼多多集团-PDD公司福利 780人发布

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 第一份工作应该选高薪还是热爱？ #

66777次浏览 593人参与

# 不考虑薪资和职业，你最想做什么工作呢？ #

92069次浏览 679人参与

# 秋招签约后的心态变化 #

82517次浏览 814人参与

# 听劝，这个公司值得去吗 #

486105次浏览 1700人参与

# 你觉得早上几点上班合适？ #

72376次浏览 303人参与

# 学历贬值真的很严重吗？ #

24439次浏览 174人参与

# 机械人与华为的爱恨情仇 #

120154次浏览 957人参与

# 一人推荐一个值得去的通信/硬件公司 #

186481次浏览 1859人参与

# 打工人的工作餐日常 #

53218次浏览 415人参与

# 哪些公司真双非友好？ #

15831次浏览 82人参与

# 26届的你们有几段实习？ #

43996次浏览 487人参与

# 月薪多少能在一线城市生存 #

28014次浏览 305人参与

# 双非能在秋招上岸吗？ #

221720次浏览 1172人参与

# 你以为的实习VS真实的实习 #

29719次浏览 273人参与

# 今年秋招哪家公司给的薪资最良心？ #

252882次浏览 1418人参与

# 你后悔自己读研吗？ #

20569次浏览 240人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

117909次浏览 812人参与

# 追觅科技求职进展汇总 #

18237次浏览 120人参与

# 实习想申请秋招offer，能不能argue薪资 #

149909次浏览 932人参与

# 如何KTV领导 #

62779次浏览 472人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务