2020-03-07 20:12 已编辑浙江大学算法工程师

关注

视频点击比赛总结2----Lstm+deepfm

原文链接https://www.turingtopia.com/competitionnew/disDetail?discussId=99c5925a9c834fc5bcee8943d6297342&cid=e4880352b6ef4f9f8f28e8f98498dbc4

1. LSTM模型

1.1 时间特征

训练集、测试集的曝光时间戳都提供了。这是一个穿越特征。曝光时间戳之间的gap（后一个ts减去当前ts）很能反映用户是否点击观看了。
对曝光时间戳gap挖掘的还不够深。那可否用LSTM自动挖掘序列特征呢？遂依据曝光时间戳gap开始构造时序数据集，每条特征为gap序列（当前记录的前后12个gap，见图2），并构建LSTM模型（见图3），线上分数为0.76+。

1.2 位置特征

下载官方app使用后发现（图4），app上显示的是有新闻标题或者图片的，曝光时间戳gap不能完全反应用户行为，有可能停留了一段时间看了会新闻标题或者图片。使用app发现点击了新闻后，pos是会变化的，所以结合pos特征能很好的反应用户行为。
把pos embedding（embedding长度为8）和gap进行拼接。

1.3 视频信息

（猜想视频播放的长度与gap是相关的）newsid也是经过embedding的长度为8.

1.4 模型输入

输入是pos+gap+newsid组成的29长度（14+14+1）的序列，shape batchsize2917（8+1+8：pos，newsid的Embedding长度都为8，gap为1）
由于正负样本相差太大（图6），模型中加入了focal loss。线上分数上涨了0.001

focal loss ：(gamma=2., alpha=.25)通过一系列调参，得到 α=0.25, γ=2（在他的模型上）的效果最好。注意在他的任务中，正样本是属于少数样本，也就是说，本来正样本难以“匹敌”负样本，但经过 (1−ŷ )γ 和 ŷγ 的“操控”后，也许形势还逆转了，还要对正样本降权。
Focal Loss理解: https://www.cnblogs.com/king-lps/p/9497836.html
Focal Loss 理解: https://www.cnblogs.com/callyblog/p/11207384.html
模型引入了注意力机制

2. deepfm模型

netmodel，device_vendor，device_version，app_version，deviceid，newsid，pos，这些特征都是sparse features，作为DeepFM的input。
相同特征名共享Embedding。
LSTM的输出直接拼接DeepFm DNN模块的输入
最后把DeepFM的DNN logit输出和FM logit输出相加作为最终输出。

全部评论

推荐最新楼层

05-26 11:28

一文扒透华为 OD！别再被谣言带节奏了，新手求职必看全答疑

哈喽小伙伴们👋 最近后台好多学弟学妹、转行大佬、跳槽老哥都在问华为 OD 到底值不值得冲、是不是纯外包、能不能转正、坑多不多。 网上乱七八糟的说法太多，黑的吹的都有，今天抛开套路，用业内真实视角，我不用官方套话，全程大白话唠嗑，把大家最关心的高频问题挨个解答，纯避坑指南，小白一看就懂！1、关于 “外包毁简历、进了就和大厂无缘” 很多人纠结：都说一进外包深似海，以后再也进不了大厂，OD 会不会也这样？ 客观理性说，凡事都有两面性。站在四年OD招聘 HR 视角，大厂选人逻辑很清晰：先看学历背景，再看大厂履历，最后看项目经验和技术匹配度。 本身学历、能力、履历都很能打的人，就算不投 OD，也能拿到...

华为HUAWEI工作强度 1383人发布

点赞评论收藏

分享

今天 21:14

复旦大学 C++

求职最心累的，从来不是行情差

去年秋招行情有多烂，相信经历过的人都懂。我当时投了一堆简历，大多石沉大海，面试也是屡屡碰壁，心态崩了一次又一次。还好我爸妈特别通透，从来不会催我，一直安慰我、理解我。但比起残酷的求职行情，某些亲戚的“虚假关心”，才是真的让人窒息、内耗拉满。真的很反感一类亲戚，表面装作很关心你的样子，实际上就是到处打探底细，专门看你过得好不好，过得不好就暗地嘲讽。每次见面必盘问：找着工作没？薪资多少？在哪上班？上次家庭聚餐，有个亲戚当着好多人的面阴阳我：“念了十几年书，花那么多钱读书，到头来找工作还不如人家早早打工的，读书有啥用啊？”说实话，听完心里瞬间堵得慌。他们根本不管现在就业有多卷、应届生有多难，也不在乎...

我的求职进度条

点赞评论收藏

分享

05-26 15:01

已编辑

门头沟学院 Java

28届简历求拷打

28届后端鼠鼠，最近结束一段小厂实习，准备6月去投中大厂试试水，简历还有什么优化的嘛简历第一个项目地址:https://github.com/OWWZO/ai-agent 友友们感兴趣可以点点star 项目思路参考了openmanus等等开源项目

我的求职进度条

点赞评论收藏

分享

04-16 23:52

武汉大学 Python

agent真的能干吗

bg双九硕电子信息，0实习ai coding了两个项目，投了10多家都没有面试，只有小米给面还挂了。前后端相关的完全不会，本来以为agent难度应该不大，但可能还是技术不够，找不到实习。秋招更不知道该不该继续入局agent了，孩子真没招了牛友们有没有什么建议😇😇

悲惨春招人：经典Agent项目模板，虽然我的也是这样……一起加油吧

点赞评论收藏

分享

05-24 22:42

山东大学嵌入式软件工程师

“应该没问题”就是在给自己挖坑

开会的时候，你负责的一个数据还没有完全获取到，这时候有人问了一句：“这个确认稳定吗？”你不想把场面弄得太紧张，于是随口回答：“应该没问题。”当时觉得，自己在前面加上了“应该”两个字，属于给自己留了余地了，真聪明但实际上不是这样，别人记住的，以及留在会议纪要材料里的，应该不是“应该”，而是“没问题”等后面数据跑出来，或者项目真的出了问题了，会议纪要里的这句话就会被标黄截图发出来“你当时不是说没问题吗？”本来是不确定的，反而成了一句承诺那，这题怎么解？假如领导在场，不管这个问题是不是他提的，既然被人抛出来，就不能不接不能说“没有把握”，也不能直接说死“能”或者“不能”可以先给一个基准时间，比如：“...

SAGIMA牛马咖啡

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 实习生的蛐蛐区 #

1012749次浏览 5157人参与

# 体制内上岸心路历程 #

39344次浏览 226人参与

# 发面经攒人品 #

8924119次浏览 98925人参与

# 担心入职之后被发现很菜怎么办 #

307932次浏览 1226人参与

# 27届实习投递记录 #

168369次浏览 1690人参与

# 求职遇到的搞笑事件 #

198544次浏览 1003人参与

# 你收到了团子的OC了吗 #

1640338次浏览 11869人参与

# 万物皆可发面经 #

6163次浏览 80人参与

# 扒一扒那些奇葩实习经历 #

161130次浏览 1184人参与

# 现在还是0offer，延毕还是备考 #

1434632次浏览 7969人参与

# 查收我的offer竞争力报告 #

303897次浏览 1763人参与

# 招聘要求与实际实习内容不符怎么办 #

227223次浏览 1078人参与

# 实习，不懂就问 #

233182次浏览 1773人参与

# HR问：你期望的薪资是多少？如何回答 #

103455次浏览 841人参与

# AI了，我在打一种很新的工 #

212905次浏览 2386人参与

# 父母对你找工作是助力还是阻力？ #

54272次浏览 480人参与

# 地方国企笔面经互助 #

43492次浏览 113人参与

# 秋招盘点:机械人值得去的企业 #

109055次浏览 746人参与

# 美团秋招笔试 #

222252次浏览 1203人参与

# 实习最想跑路的瞬间 #

148034次浏览 787人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务