知识积累

1. python机器学习相关

1.画图:https://www.cnblogs.com/shengyang17/p/9693991.html#_label1

2.keras中文文档:https://keras.io/zh/getting-started/sequential-model-guide/

3.tensorflow文档https://www.tensorflow.org/api_docs/python/tf/keras/layers/Embedding

4.xgboost文档https://xgboost.apachecn.org/#/docs/15

5.深度学习https://zh.gluon.ai/chapter_introduction/deep-learning-intro.html

2. sql基础功能语句

  1. 对一个字段分组,获得分组后的前十条数据:rank() over (PARTITION BY t.user_id order by t.event_timestamp desc)as rank

  2. 对几个字段去重:group by + 字段1,字段2

  3. 将一行拆开成多行:lateral view explode

  4. lateral view explode 可以在hive中使用,不能在presto使用

  5. 选取在a中不在b中的数据:not in

not in 不能在hive中使用,可以在presto使用;

  1. 随机获取数据:order by rand() limit 1000

  2. CAST函数用于将某种数据类型的表达式显式转换为另一种数据类型。https://blog.csdn.net/qq_21101587/article/details/78642423

  3. TRIM 函数是用来移除掉一个字串中的字头或字尾。最常见的用途是移除字首或字尾的空白。

3.推荐系统论文相关

  1. https://www.jianshu.com/p/285978e29458 《Learning and Transferring IDs Representation in E-commerce》

本文介绍了一种ID类特征的表示方法。该方法基于item2vec方式,同时考虑了不同ID类特征之间的连接结构,在盒马鲜生app上取得了不错的应用效果

  1. 序列化推荐https://cloud.tencent.com/developer/article/1612461 https://cloud.tencent.com/developer/article/1557205

3.Transform详解(超详细) Attention is all you needhttps://zhuanlan.zhihu.com/p/88688817

4.时间序列预测

4.1 比赛

kaggle:https://www.kaggle.com/c/demand-forecasting-kernels-only/leaderboard

kaggle:https://www.kaggle.com/c/rossmann-store-sales

天池资金流入流出预测:https://tianchi.aliyun.com/competition/entrance/231573/information

kaggle:Web Traffic Time Series Forecasting

4.2 资料整理

网站流量预测方案https://www.datalearner.com/case/100000 seq2seq方法https://www.jiqizhixin.com/articles/2017-12-05-2

TCN在天池大赛的应用https://zhuanlan.zhihu.com/p/69919158

时间序列方法总结https://zhuanlan.zhihu.com/p/67832773

Facebook 时间序列预测算法 Prophet 的研究https://zhuanlan.zhihu.com/p/52330017

xgboost模型实战案例:预测未来一段时间的路段交通流 https://cloud.tencent.com/developer/article/1528977

4.3 TCN

代码解释https://zhuanlan.zhihu.com/p/41513393

论文源码https://github.com/locuslab/TCN/blob/master/TCN/adding_problem/add_test.py

博客解读https://blog.csdn.net/weiwanshu/article/details/89814467


5. 亟需掌握

  • sql语句,要到leetcode上多练练
  • 大数据工具(上网课)
  • python类及接口
  • git怎么用

    Todo:用github做一个个人网站

全部评论

相关推荐

点赞 收藏 评论
分享
牛客网
牛客企业服务