大模型求教

目前刷到好多搞大模型算法的大佬秋招拿到base35k左右的巨奖offer了,不懂就问,大模型算法这条赛道能速成吗?对卡的需求高吗?估计组里最多也就一张3090,还得偷摸着用
#牛客创作赏金赛#
全部评论
1. 可以速成,3090专注 sft(dpo),rag,量化 2. 速成之后去实习,用组里资源跑实验 3. 实习中后期写一篇论文 4. 刷lc,笔记准备秋招
13 回复 分享
发布于 2024-11-22 16:10 北京
做LLM,paper是必备的,门槛其实很高,你想all in的话必须要很有实力,因为LLM目前落地效果不是很好,你如果没有paper或者工程项目的硬实力的话,工作稳定性十分堪忧,有随时被毕业的风险,并且LLM涉及到的面太广了,花活很多,比如问你深一点的有Cache管理,量化,vLLM,deepspeed,SageAttention等等,这些多多少少都是围绕硬件做的优化和加速,很广的,根本速成不了,建议再考虑考虑应用方向,这个方向好做的多,但是还是涉及到一个稳定性问题。
5 回复 分享
发布于 2024-11-23 16:53 广东
找实习也得发论文 没论文就不要卷大模型赛道了
4 回复 分享
发布于 2024-11-20 11:42 浙江
建议别来,感觉很泡沫
3 回复 分享
发布于 2024-11-30 20:29 北京
我们组里十几张A6000
2 回复 分享
发布于 2024-12-06 15:47 海南
组里一张 3090 还是算了,微调都很难,可以找找 LLM 的实习试试
2 回复 分享
发布于 2024-11-20 11:18 北京
我辣鸡二本组里都有4090
1 回复 分享
发布于 2024-11-24 15:22 广东
cy,同
点赞 回复 分享
发布于 2024-12-09 15:04 陕西
点赞 回复 分享
发布于 2024-12-03 18:01 河南
可以是可以,不过明年大模型还火不火就不一定了
点赞 回复 分享
发布于 2024-12-02 14:42 湖北
明年还会招这么多大模型吗
点赞 回复 分享
发布于 2024-11-28 07:49 安徽
实在不行,如果有实力自己买一张4080,4090摸清楚理论原理,然后去堆实习,在实习过程中和企业一起发论文。
点赞 回复 分享
发布于 2024-11-22 12:19 江苏
没论文别走大模型赛道,卡都没有更别说了
点赞 回复 分享
发布于 2024-11-21 11:53 广东
可以速成的,不过可能得多堆一些实习和比赛去弥补论文
点赞 回复 分享
发布于 2024-11-20 14:29 四川
不如搜推
点赞 回复 分享
发布于 2024-11-20 14:19 北京

相关推荐

11-04 21:58
门头沟学院 Java
总结:40分钟,八股比较深入,没有手撕。八股部分1.面向对象有哪些特点?2.Java对象中访问权限有哪几种?3.追问:枚举类的构造函数是什么访问权限?4.线程池的核心参数有哪些?5.提交任务到线程池后的执行流程是怎样的?6.追问:如何封装一个自己的线程池,要求是:如果核心线程数不够,且线程数没有超过最大线程数,就生成一个临时线程执行(先执行后塞入等待队列的情景)7.你了解Java中的垃圾回收算法吗?8.G1回收算法的特点是什么?9.虚拟机如何确定对象是可回收的?10.GC Roots有哪些类型?11.选择垃圾回收器时的主要评价标准是什么?如何计算垃圾回收的吞吐量?12.为什么选择使用Spring框架?13.Spring框架中的AOP和依赖倒置原则为何设计?14.AOP中的单例对象在多线程环境下是否线程安全?15.AOP(面向切面编程)是如何实现的?16.你能具体讲一下在日志管理中如何使用AOP实现的实现方式吗?17.AOP在哪些场景下可能会失效或出现问题?18.对于服务质量方面的保障措施有哪些?(功能测试,性能测试,兼容性测试)反问环节1.部门业务是什么做大模型的输出内容的安全审查。2.技术栈是什么内容安全相关的技术栈主要包括后端技术栈,如数据库(MySQL、PostgreSQL)、中间件(Kafka、RabbitMQ)、缓存(Redis)等,同时涉及大数据技术如Flink实时计算平台,以及针对大模型输出内容的安全审查和算法校验。
查看18道真题和解析
点赞 评论 收藏
分享
评论
6
26
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务