转载-收集

二、知识储备

接下来我花了大概半年的时间自学机器学习理论基础、各个算法的原理等等。
首先看书,周志华老师的西瓜书《机器学习》和李航老师的蓝皮书《统计学习方法》。
然后看视频,林轩田的《机器学习基石》和《机器学习技法》,还有吴恩达的那套机器学习入门的视频,相信学这个的人都看过的。
最后看书+实践,有一本书叫做《机器学习实战》,里面以案例的形式对常见的算法进行讲解,每个案例都有数据集和python代码,跟着过一遍,代码自己写一遍,我当时用C++把里面的几个案例敲了一遍。
这三部分任务完成之后,知识储备也就完成的差不多了。

三、参加比赛

大概从去年9月份,我开始了我的比赛之路。目前数据竞赛平台有很多,国外的最知名的kaggle,国内的天池、DataFountain、DataCastle等等。
赛圈有一位朋友叫做麻婆豆腐,他的微信公众号叫麻婆豆腐AI,专门发布最新的比赛信息,感兴趣可以关注。
起初没有任何经验,自然是啥也不会,连常用的工具包都用不熟练。因此可以先看看各大比赛的top解决方案的开源和ppt,熟悉一下做比赛的流程、不同业务场景的理解、特征工程常用套路、从特征工程到建模的代码框架等。这里放一个朋友的GitHub链接:https://github.com/Smilexuhc/Data-Competition-TopSolution,里面收集了前些年各大比赛的top解决方案开源,现在他人变懒了,不继续收集了😪。
然后可以参加一些练习赛练练手,等熟悉了比赛流程,有了感觉之后再参加比赛。新手参加比赛建议一开始solo,积累经验,不要在意名次,因为一开始经验不足就组队,有可能会出现害人害己的情况。等有了一些经验之后,就奔着名次去吧,要记住必须有top名次才能往简历上写。
就国内现在的比赛环境来看,新手想solo拿到top名次几乎是不可能的事情,你会发现每个比赛前排总是那群熟悉的面孔。因此先努力提升自己的名次,然后在跟自己名次差不多的人当中选择组队,反正想方设法把自己***前排去,因为你要记住你是为了找工作而打比赛,不是为了奖金也不是兴趣😒。记住你跟别人不一样,一个比赛短则一个月,长则两三个月都有可能,一个比赛失败,你就少一次机会,离秋招也就近了一步。
我运气还算可以,截止今年6月份,成功拿到一些top名次,简历有东西可以写,面试也有东西可以说了。
对了,打比赛之前请先看看GBDT的原理,再看看xgboost和LightGBM的论文。
](https://www.nowcoder.com/discuss/326300?type=all&order=time&pos=&page=2&channel=-2&source_id=search_all)

全部评论

相关推荐

手机爱睡觉:感觉是没hc了,上次双选hr说七月份就开了招了很多人
投递网易等公司10个岗位
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务