GitHub项目,直接来抄作业

无意间刷到这个提问 “211 数据科学与大数据技术专业想做项目,不知道做什么?”

给同bg的同学整理了一些26年至少是上半年值得做的项目方向👇

alt

方向一:AI Agent / RAG(最推荐)

2026 年是 AI Agent 爆发年。企业对"能用大模型做事的人"的需求远超供给。

学习级项目(先跑通理解原理)

1. AI Engineering Hub

2. Production Agentic RAG Course(7 周课程)

进阶级项目(做二次开发)

3. RAGFlow

  • 地址:github.com/infiniflow/ragflow
  • 亮点:端到端 RAG 引擎,含文档解析 + 向量检索 + Agent 能力
  • 怎么用:fork 后做一个垂直领域的 RAG 应用。比如"CS 面试知识库问答"——把面经、LeetCode 题解、八股文喂进去,做成一个能对话的面试助手。面试时直接 demo 给面试官看。

4. Dify

  • 地址:github.com/langgenius/dify
  • 亮点:可视化 LLM 应用平台,拖拽式构建 AI 工作流
  • 怎么用:用 Dify 搭一个有实际使用场景的应用(比如"招聘 JD 智能匹配助手"),重点写清楚你的 Prompt 设计思路和数据处理逻辑。

5. RAG-Anything(新项目)

  • 地址:github.com/HKUDS/RAG-Anything
  • 亮点:多模态 RAG 框架,支持图文混合检索,有学术论文背书
  • 怎么用:适合在简历里体现"前沿性"。可以做一个"论文+代码+图表"的多模态检索系统。

行动路线

第 1-7 周:跟 production-agentic-rag-course 跑完全课程
第 8-10 周:基于 RAGFlow 做一个垂直领域 RAG 应用
第 11-12 周:部署到云上(用免费的 Railway / Render),能给面试官发链接 demo

方向二:推荐系统(数据科学专业最对口)

为什么选这个?

推荐系统是大厂数据科学岗的核心业务之一(字节的推荐、阿里的推荐、快手的推荐...)。做一个完整的推荐系统项目,面试时能直接聊"召回→粗排→精排→重排"的全链路。

具体项目

1. Recommenders(19K+ Stars,微软出品)

  • 地址:github.com/recommenders-team/recommenders
  • 内容:推荐系统最佳实践合集,包含协同过滤、深度学习、知识图谱等多种方法
  • 适合:学原理,有完整 Notebook 可以跟着跑

2. Gorse(9K+ Stars)

  • 地址:github.com/gorse-io/gorse
  • 亮点:Go 写的推荐引擎,开箱即用,导入数据就能跑
  • 怎么用:用公开数据集(MovieLens / 豆瓣电影)搭一个推荐服务,写一份完整的评估报告(离线指标 + 消融实验)

3. Monolith(字节跳动开源)

  • 地址:github.com/bytedance/monolith
  • 亮点:字节内部用的轻量推荐系统框架
  • 怎么用:面字节时简历写"基于字节 Monolith 框架构建的推荐系统",天然加分。重点关注它的实时特征处理和 HashTable 优化。

行动路线

第 1-4 周:用 Recommenders 学完协同过滤 + 深度推荐的核心算法
第 5-8 周:用 Gorse 搭一个能跑的推荐服务,写评估报告
第 9-12 周:尝试 Monolith 的实时特征方案,加入你的项目

方向三:数据工程 Pipeline(数据开发岗必备)

很多同学只会写模型训练脚本,但企业需要的是能跑通"数据采集→清洗→转换→入库→可视化"全链路的人。数据工程是数据科学的地基。

具体项目

1. ETL Pipeline: Airflow + BigQuery + dbt + Soda

2. ELT Pipeline: dbt + Snowflake + Airflow

3. Airflow Tutorial(端到端教程)

行动路线

第 1-3 周:跟 Airflow Tutorial 跑一遍,理解 DAG 和调度概念
第 4-8 周:换成自己的数据源(比如爬取招聘网站数据),做一个求职数据分析大盘
第 9-12 周:加入数据质量监控(Soda)和可视化层(Metabase / Superset)

alt

能 Demo

能打开浏览器演示的项目 >> 只能看代码的项目。部署到免费平台上,面试时直接发链接。

#哪些AI项目值得做?#
全部评论

相关推荐

04-20 22:20
已编辑
门头沟学院 golang
27届,bg为四非本211硕,如题,导师不放实习,且每周至少一次线下组会(工作日),从研一上开始实习,然后我组在研一下引入了打卡机五段大厂分别是:美团到店、美团服务零售、快手电商、字节TikTok、字节CapCut。目前要结束我的第五段实习了(不会再刷第六段,好好搞学校的事,还有秋招)本来一直告诉自己的是“所有委屈到了终点再说”,过去告诉自己的终点自然还没到,但我觉得自己仿佛已经到了另一个终点,有感而发,写了这篇文章也许你会觉得为啥不尝试问问导师能不能实习,或者用其他让自己舒服的手段,我只能说,这很复杂,有导师的人自然会懂,这种一开始就把“利益冲突”摆明面上的招几乎就是不可能成功———————————————————我到底是怎么实习的?骗hr自己满勤,然后没有捷径,就是每周往返,第一段去的是北京美团,而学校在江苏,因此需要一周一次北京江苏往返,因为实习钱少,所以坐的基本是绿皮,难以入睡,下车后就是长达2小时的地铁去公司,地铁站上靠着人睡觉周末做什么?基本在做导师的科研or横向,学习的话很多时候就是尽力在晚上回到出租屋的时候学,这很难维持,但只能不断push自己如何破解打卡机?直接把打卡机偷了,或者使用指纹膜(当然我很早就做好了无法破解的准备,那就是找个长三角实习,每天早起去打卡完坐高铁去实习,从每周高铁往返变成每天)导师会压力吗?非常压力,实习的时候非常害怕微信弹出他的消息,PTSD了,有时候一周要往返两次学校,每次都跟要死了一样,之前真是情绪崩溃好几次,哈哈哈哈平时往返怎么平衡工作?我本来很晕车,为了不耽误公司和导师的进度,从车上一看电脑就头晕、吐,到后面可以随意在高铁、地铁、出租车上Coding,甚至不会再因为往返感到心累了,哈哈哈哈这一路已经淬炼出比较坚强的内心了,已经数不清多少次坐末班高铁从学校回公司,多少次凌晨6点爬起来赶车过去我会把这些当作是我人生的弯路,但现在,这些已经成为我宝贵的经验了。往后,我想我也能真正允许各种不好的情况出现了,因为我会真正把它当作我要解决的问题,而非抱怨,这又何尝不是终点呢?要照顾好身体,我不管怎么往返,一直非常在乎身体,会让自己睡够8小时,最近几星期培养早睡早起到公司健身后去工作的习惯,我觉得好身体很关键
gtgt..:很佩服,但是很恐怖,感觉已经从人类异化到高度运转的机器了
美团工作强度 2452人发布
点赞 评论 收藏
分享
评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务