小白数据挖掘demo项目思路求助

本人9本海硕计算生态学应届毕业生(主要是Linux和R语言跑数据分析),无实习经历,目前想转行互联网大数据挖掘但是缺乏垂直项目经历,现在打算做一个大数据全栈分析的demo项目作为作品集放到简历中,想模拟实际工作场景的整套数据工作流程(源头数据采集 [电商和招聘平台]→建数仓→数据分析→数据挖掘),边学习边实操大数据相关的所有主流技术栈。

我想先分别独立分析电商和招聘软件中的信息,再融合分析研究工作岗位和收入对用户购买行为的影响(跨软件平台数据是否支持?),想请教一下这样的想法的合适性和实操性如何。

我觉得主要的问题是数据采集,因为云数据平台 (kaggle、阿里云等)上开源的数据集脱敏,难以产生实际性结论,且都是干净的数据,缺乏上下文,有点脱离实际工作场景。请问推荐以什么方式进行大数据采集?还是说应该把重心放在数据挖掘模型和算法的学习上,不建议花过多时间学习数据采集,直接拿现成数据集比较好呢?

另外,目前处于择业迷茫期,有点搞不清努力的方向。本人喜欢钻研技术,不大喜欢和业务问题打交道,因此在想会不会相比于数分来说朝着后端路线学习发展更适合我,但又有些止步于学习后端技术栈需要花费的时间成本和非科班求职的高门槛。希望大佬们牛友们指点迷津。🙏

#数据分析# #数据挖掘# #大数据# #机器学习# #后端#
全部评论
都啥时候了,直接干算法向的数分吧,你这实力可以的
1 回复 分享
发布于 04-02 18:41 江苏

相关推荐

白火同学:先说结论,准大三不是特别好找实习,boss沟通300+没有实习是很正常的情况。一是暑期实习时间太短了,二是在这么多准大四都找不到实习,从实习时间和掌握技术层面,企业会优先看他们。 再说简历,其实985本+准大三到这水平的简历也很优秀了,要说的话,项目经历可以再优化一下,可以基本围绕采取STAR原则,分为项目概述、技术架构、技术亮点、实现结果,再发给AI润色一下。 最后说操作,准大三的话,如果想找实习那就多投,不过现在也7月中旬了,时间上已经略晚了。如果7月底实在找不到,也可以多刷点算法,多学点技术,这实习也不至于一定得有,当然有更好。
点赞 评论 收藏
分享
点赞 评论 收藏
分享
昨天 09:19
门头沟学院 后端
下周有2个待面,自我介绍就是开始紧张,总容易嘴瓢朋友们有啥面试不紧张的办法吗?
mama3925:boss投小厂,使劲练自我介绍和实习介绍,以及相关的场景题和系统设计。八股可以和豆包练
点赞 评论 收藏
分享
评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务