求NLP大佬给点建议

本人本科生,算法菜鸡,更别提啥NLP了。我平时做的都是后端开发。有个问题来这里求问一下各位NLP大佬。

女朋友毕设导师让做一个股票分析的东西。大致如下:想从微博上一些股票大V的博文中分析出股票大盘或者某支股票的涨跌。大致就是想从大V的某一条博文中判断出这个大V表达的是涨还是跌。然后整合这些博文的分析结果和股票市场历史数据进行对比。然后想之后基于分析结果和大V的博文来进行炒股。 对于一个本科生(没有NLP基础)来说,这个做下来是个什么难度。忘各NLP大佬给点建议/思路。
#悬赏#
全部评论
本科就让做这么难的题目??360去年KDD也发了一篇,详情请戳:https://dl.acm.org/citation.cfm?doid=3219819.3219964
点赞 回复 分享
发布于 2019-01-05 23:43
给几个未加雕琢的初步思路: 简单粗暴方案1:标大量数据,有监督学习 方案2:标少量数据,半监督学习 方案3:标少量数据,收集网上其他领域的文本带标签数据,迁移学习
点赞 回复 分享
发布于 2019-01-05 18:29
多谢各位大佬的意见
点赞 回复 分享
发布于 2019-01-06 03:26
话说,大v点评的股票一般都是他鼓吹要涨的吧。一般的股票他也不会说
点赞 回复 分享
发布于 2019-01-05 23:38
你好 我的思路是这样的:(简单版) 1 爬取金融大鳄的blog文本,下载历史股票数据 2 对这些文本进行sentiment analysis 3 给文本贴label  positive为1,negative为0 (意思就是1的时候,如果预测准确,股票应该涨) 4把这些1 0 1 0 1 0数据画折线图(横轴是时间) 与历史股票涨跌图放在一起比对,如果有相关性,可以根据每天对新的文本的sentiment analysis进行预测。  5如果plot出来之后没有相关性,告诉导师别****淡了 ,还是直接用timeseries预测更靠谱。 6 如果有还不错的相关性。(肉眼可见的相关)就做一个ensemble model 整合每日的blog sentiment analysis 结果和timeseries预测结果。 
点赞 回复 分享
发布于 2019-01-05 21:51
判断大V对股票的态度是情感分析比较好做, 但是大V真的能影响股票的涨跌吗?  太扯淡了,这第二个问题算是个相关性分析吧。
点赞 回复 分享
发布于 2019-01-05 21:30
可以难也可以简单,关键是你想要模型准确率多少。数据很烦,没有数据集,首先你就要人肉tag少了还不行。最简单的思路就是做bag of word,然后有多少算多少。复杂起来的,就自己查文献做特征工程啊
点赞 回复 分享
发布于 2019-01-05 17:36
nlp+数据分析+金融学,不如换题……
点赞 回复 分享
发布于 2019-01-05 17:26
这个题目也太天马行空了吧
点赞 回复 分享
发布于 2019-01-05 16:59

相关推荐

04-25 17:10
门头沟学院 Java
先是问了我的一些情况,比如为什么要找实习,后面打不打算读研之类的,然后拷打项目1. 项目是自己做的还是有团队,上线了吗,现在还在用吗2. 项目遇到过什么问题(Redis+Lua脚本预检,乐观锁解决超卖问题)3. 乐观锁怎么解决超卖问题,如果用悲观锁会有什么问题4. 套餐抢购QPS能到多少5. 有测试过用了乐观锁以后性能能到达什么程度吗6. 还遇到过什么问题?(我说了用RabbitMQ优化抢购逻辑,异步下单和数据库扣减库存)7. 我描述这个场景面试官说不理解,让我共享屏幕画一下架构图。但我可没画过这东西,我就画了个顺序图,一开始还画错了。。。8. Lua脚本的流程是什么9. 你这个Redis和Lua脚本预检就相当于避免了超卖问题,为什么还需要在数据库用乐观锁来避免呢?(这个其实我也有点不太明白,我的项目就是黑马点评包装的,有没有佬解释一下)解释了一通之后,面试官说你的系统还没复杂到要用RabbitMQ。。。然后开始拷打下一个10. 项目分工,你的工作?11. 采集股票的数据源?12. 项目里有对这些采集到的数据加入量化分析吗?(好提议,以后看看能不能加上去)13. 有遇到什么问题吗(讲了用线程池来分片采集股票数据入库)14. 线程池怎么处理的15. 最近AI coding很火,你有用过吗?在用的过程中遇到什么问题,怎么解决的?手撕:给一个数组,按从小到大顺序返回其中k个数(这个题太简单了吧,我都怀疑是不是还有其他题,结果没有)
查看16道真题和解析 美团求职进展汇总
点赞 评论 收藏
分享
05-11 15:37
郑州大学 Java
kensame:首先,开源之夏的基础项目难度也很高,想要完成很困难,而且前提还是你申请项目得中标,其次,字节青训你报后端的话估计是推荐走go语言的,当然java也行,不过你可能更难找队友,最后,字节青训的项目虽说难度不一定比开源之夏高,但是考虑暑假的学习氛围更差加上你现在估计没有掌握太多知识,也很难完成,
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务