球球offerrrrrr

2019-07-25 22:58 已编辑北京科技大学 Java

关注

使用Moses进行英文分词tokenizer、truecasing、lowercasing、clean等

打开MOSES主站http://www.statmt.org/moses/ 安装MOSES并安装其他依赖GIZA++等

tokenizer处理

~/mosesdecoder/scripts/tokenizer/tokenizer.perl -l en < en_yuliao_test.txt > en_yuliao_test_tok.txt

truecasing处理
创建model文件夹，复制一份语料放入model中（不知道这个操作是否合理）

~/mosesdecoder/scripts/recaser/train-truecaser.perl --model ./model/en_yuliao_tok.txt --corpus en_yuliao_tok.txt
~/mosesdecoder/scripts/recaser/truecase.perl --model ./model/en_yuliao_tok.txt < en_yuliao_tok.txt > en_yuliao_tok_true.txt

clean处理：剔除过长或过短的双语语料对
将双语语料统一命名为test-enzh.en和test-enzh.zh，并对长度不在[1, 80]之内的双语语料进行删除

~/mosesdecoder/scripts/training/clean-corpus-n.perl test-enzh en zh test-enzh.clean 1 80

更多工具使用请参考官方文档
英文分词使用工具众多，NLTK也是常用工具之一

全部评论

推荐最新楼层

04-27 14:49

门头沟学院 Java

行情不好，我该不该降低找工作标准

今年求职行情真的是卷到爆炸！！！，投了几百份简历了，要么啥动静没有，要么面试完就没下文，每天都在纠结一个问题：到底是死磕目标不妥协，还是先接个差不多的offer上岸再说？我一开始给自己定的目标很明确：大厂、薪资不低于10k、不加班、有晋升空间，可现实狠狠打了我的脸。身边很多同学都开始降低标准，有的去了小厂，有的接受了薪资倒挂，还有的甚至放弃了专业相关的岗位，只为能先上岸。我也动摇过，尤其是看到身边人陆续拿到offer，只有我还在原地打转，那种焦虑感真的快把我压垮了。有一次面试一家小公司，薪资只有6k，还要经常加班，HR问我能不能接受，我犹豫了很久，最终还是拒绝了，总觉得不甘心，不想刚毕业就将就...

你会因为行情，降低找工作...

点赞评论收藏

分享

04-25 09:11

蚌埠坦克学院嵌入式软件开发

简历上面怎么样体现嵌入式AI的能力

想在简历里体现“嵌入式 AI 能力”，关键不是写你“学过什么”，而是让面试官一眼看出你能在资源受限设备上把模型跑起来并解决实际问题。可以从三个层面去写：1. 技术栈要“嵌入式 + AI”融合不要只写“会 C++ / Python / TensorFlow”，而是写成有场景的组合，比如：C/C++（ARM Cortex-M / Linux）+ 模型部署（TensorFlow Lite / ONNX Runtime）硬件平台（STM32 / 树莓派 / Jetson）+ 推理加速（NEON / GPU / NPU）这样能直接体现你不是只会训练模型，而是能落地。2. 项目描述突出“落地过程”项目一定...

简历上如何体现你的“AI...

点赞评论收藏

分享

03-07 20:50

中国科学技术大学 Java

今年字节实习来了波大的

刚刷到字节跳动官方发的消息，确实被这波阵仗吓了一跳。在大家还在纠结今年行情是不是又“寒冬”的时候，字节直接甩出了史上规模最大的转正实习计划——ByteIntern。咱们直接看几个最硬的数，别被花里胡哨的宣传词绕晕了。首先是“量大”。全球招7000多人是什么概念？这几乎是把很多中型互联网公司的总人数都给招进来了。最关键的是，这次的资源分配非常精准：研发岗给了4800多个Offer，占比直接超过六成。说白了，字节今年还是要死磕技术，尤其是产品和AI领域，这对于咱们写代码的同学来说，绝对是今年最厚的一块肥肉。其次是大家最关心的“转正率”。官方直接白纸黑字写了：整体转正率超过50%。这意味着只要你进去了，不划水、正常干，每两个人里就有一个能直接拿校招Offer。对于2027届（2026年9月到2027年8月毕业）的同学来说，这不仅是实习，这简直就是通往大厂的快捷通道。不过，我也得泼盆冷水。坑位多，不代表门槛低。字节的实习面试出了名的爱考算法和工程实操，尤其是今年重点倾斜AI方向，如果你简历里有和AI相关的项目，优势还是有的。而且，转正率50%也意味着剩下那50%的人是陪跑的，进去之后的考核压力肯定不小。一句话总结： 27届的兄弟们，别犹豫了。今年字节这是铁了心要抢提前批的人才，现在投递就是占坑。与其等到明年秋招去千军万马挤独木桥，不如现在进去先占个工位，把转正名额攥在手里。

喵_coding：别逗了 50%转正率仔细想想就是转正与不转正

字节7000实习来了，你...

点赞评论收藏

分享

04-01 18:30

江苏师范大学科文学院测试工程师

所以26届已经被抛弃了吗？

zaakfung：26届不应该春招吗为啥还实习

点赞评论收藏

分享

04-22 09:15

门头沟学院 Java

心虚是社死的前兆

刷到这个话题，我脚趾已经开始抠地了。作为双非计算机本科，今年杭州春招，我靠一句心虚的「精通Java并发编程，深入理解JVM底层原理」，差点把自己的面试路直接走死，社死到现在想起来都想连夜逃离互联网行业。先说说我为什么敢写这句话。春招最开始，我投出去的简历石沉大海，看着身边同学都拿到了面试邀请，我急得不行。听网上说，简历要敢写，「熟练」改「精通」，「参与」改「主导」，才能被HR捞到。那时候我刚背完JVM和Java并发的八股文，什么synchronized锁升级、volatile原理、JVM内存结构、垃圾回收器，背得滚瓜烂熟。我脑子一热，就在简历的核心技能里，写下了那句让我社死的话：精通Java并...

查看3道真题和解析

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 这个offer值得去吗？ #

2201次浏览 34人参与

# 你实习是赚钱了还是亏钱了？ #

117097次浏览 634人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

42958次浏览 496人参与

# 如果春招能重来，我会___ #

4849次浏览 53人参与

# 机械人晒出你的简历 #

191100次浏览 1098人参与

# 你会因为行情，降低找工作标准吗？ #

10009次浏览 97人参与

# 实习想申请秋招offer，能不能argue薪资 #

254121次浏览 1313人参与

# 招银网络求职进展汇总 #

249683次浏览 1119人参与

# 面试官拷打AI项目都会问什么？ #

1971次浏览 96人参与

# 想做Agent可以做哪些岗位？ #

2475次浏览 28人参与

# 你觉得最好用的AI编程工具是_ #

990次浏览 25人参与

# 除了线上，还能去哪些地方投简历 #

3287次浏览 35人参与

# 实习第一天，你在干什么 #

4094次浏览 29人参与

# 你和你的mentor相处模式是__ #

5956次浏览 47人参与

# 第一次面试 #

1135462次浏览 13934人参与

# 如何排解工作中的焦虑 #

327515次浏览 2807人参与

# 在国企工作的人，躺平了吗？ #

422301次浏览 3990人参与

# mt对你说过最有启发的一句话 #

115197次浏览 872人参与

# 暑假倒计时，你都干了些啥？ #

58870次浏览 313人参与

# 你的mentor是什么样的人？ #

61650次浏览 796人参与

# 美的求职进展汇总 #

374369次浏览 2079人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务