2024-06-09 09:29 浙江大学算法工程师

关注

如何进行多源数据融合？

# 1. 多源数据说明：

- 数据是一张表格，字段如下： User_id, S_model1, S_model2, S_model3, feature1, feature2, feature3, Y, dt

- 其中User_id是用户编号，dt是时间分区，Y是目标，feature是特征，S_model表示其它的模型分

- 不同的S_model来自不同数据源，feature1、feature2和feature3来同一个数据源

- 不同分区内，数据源有不同程度的缺失和断流

数据示例如图：

# 2. 目前的融合方案是：

将所有字段均视为特征，输入xgb进行训练。

该方案存在如下问题：

- 训练集上，xgb模型的性能较低。

- 模型上线后，用户的Y标的预测很不稳定（用户某个特征的缺失导致其Y标大幅变动，这是很不合理的）。

# 3. 请问有好的多源数据融合方法吗？能克服各数据源的缺失/断流问题，有效利用各个数据源的带来的增益，最终：

- 提高训练集上xgb模型的性能

- 提高模型对用户Y标预测的稳定性

全部评论

推荐最新楼层

05-26 09:27

北京邮电大学嵌入式工程师

宇树机器人面经（嵌入式/机器人方向）

一面（基础技术面）自我介绍，然后开始问基础，偏嵌入式底层和RTOS：设计一个带看门狗（Watchdog）的嵌入式系统，描述故障恢复流程UART、SPI、I2C 协议的核心差异及典型应用场景推挽输出与开漏输出的区别？举例说明在 GPIO 控制中的应用如何通过 DMA 减少 CPU 在数据传输中的负载系统时钟配置对低功耗设计的意义是什么嵌入式操作系统（如 FreeRTOS）中任务的状态有哪些？状态切换条件实时操作系统（RTOS）的“硬实时”与“软实时”区别RTOS 的任务调度策略有哪些？如何保证实时性任务间通信方式（信号量、消息队列、管道）的适用场景及优缺点如何避免中断服务程序（ISR）中的竞争条...

点赞评论收藏

分享

05-25 11:28

已编辑

华为OD机考考点分析与高效备考策略

一、 考试目标量化明确目标：总分400（100+100+200），150分即可通过。这意味着无需追求满分，策略性地获取分数更为关键。常见组合：前两题分别拿到80%和70%的用例通过率，第三题即使0分，也可通过。建议将主要精力投入前两道一星题。二、 核心考点分布与权重根据真题统计分析，考点分布如下：1.一星题（100分x2）：占比约70%的分数字符串处理（30%）： 最高频考点。包括IP地址分类、协议解析、日志过滤、键盘输入模拟等。核心是掌握split()、正则表达式、字符遍历与状态机。哈希表与统计（20%）： 用于计数、去重、建立映射。典型题目如“生日礼物统计”、“文档特征提取”。栈与队列（1...

点赞评论收藏

分享

05-19 01:41

已编辑

有大佬知道这个是什么情况吗，hr面试完这个状态豆一周了，这是挂了还是要再等等😱😱😱

点赞评论收藏

分享

05-23 13:02

电子科技大学 Java

fw本科生找不到暑假实习😭

4月底陆陆续续开始投递，面试寥寥，pdd、美团笔试被筛腾子WXG周二面的，面试官全程不开摄像头，问的无关紧要的问题，面了1h40min，现在官网流程还卡着；腾讯音乐，昨下午面的，问题都答上来了，和面试官聊得很好，晚上回去看秒挂；快手一面挂，卡在了很简单的一个手撕，用的dp但是双指针就可以解决；嵌入式一家约面的都没有，现在高通投晚了没回，英伟达约面的还是做研发套件的，大疆、mmt没有嵌软岗位，其他自驾车厂和手机厂投了没有消息。已经对暑假实习和秋招没有念想了，现在保研也拿不到正保，考研的话也太晚了，前途一片完犊子

我的求职进度条

点赞评论收藏

分享

05-28 11:42

金山WPS_质量保障部_测试实习生(实习员工)

27届学院本简历求拷打

27届学院本,目前一段中厂实习，一个ai项目一个后端项目,ai项目是vibecoding的,leetcode hot100现在刷了快1/3，想问下大厂测开日常实习难不难进,这个简历能不能冲大厂...

听劝，我这个简历该怎么改...

点赞评论收藏

分享

评论

2

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 实习生的蛐蛐区 #

1007395次浏览 5133人参与

# 扒一扒那些奇葩实习经历 #

160659次浏览 1182人参与

# 发面经攒人品 #

8901000次浏览 98751人参与

# 应届生第一份工资要多少合适 #

28227次浏览 107人参与

# 27届实习投递记录 #

166347次浏览 1680人参与

# 应届生，你找到工作了吗 #

180936次浏览 914人参与

# 招聘要求与实际实习内容不符怎么办 #

226784次浏览 1077人参与

# 机械人值得去的小众企业 #

38375次浏览 68人参与

# 现在入门AI首先要做什么？ #

18304次浏览 145人参与

# 互联网行业现在还值得去吗 #

65692次浏览 380人参与

# 实习最想跑路的瞬间 #

147653次浏览 787人参与

# 面试反问你会问什么 #

213567次浏览 1962人参与

# 机械人，秋招第一次笔试的企业是哪家？ #

106946次浏览 715人参与

# 万物皆可发面经 #

5561次浏览 67人参与

# AI了，我在打一种很新的工 #

211511次浏览 2340人参与

# 实习，不懂就问 #

231700次浏览 1771人参与

# 实习教会我的事 #

82240次浏览 521人参与

# 网易求职进展汇总 #

218793次浏览 1542人参与

# 春招前还要继续实习吗？ #

72095次浏览 353人参与

# 校招求职有谈薪空间吗 #

234444次浏览 2400人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务