大模型求教

目前刷到好多搞大模型算法的大佬秋招拿到base35k左右的巨奖offer了,不懂就问,大模型算法这条赛道能速成吗?对卡的需求高吗?估计组里最多也就一张3090,还得偷摸着用
#牛客创作赏金赛#
全部评论
1. 可以速成,3090专注 sft(dpo),rag,量化 2. 速成之后去实习,用组里资源跑实验 3. 实习中后期写一篇论文 4. 刷lc,笔记准备秋招
13 回复 分享
发布于 2024-11-22 16:10 北京
做LLM,paper是必备的,门槛其实很高,你想all in的话必须要很有实力,因为LLM目前落地效果不是很好,你如果没有paper或者工程项目的硬实力的话,工作稳定性十分堪忧,有随时被毕业的风险,并且LLM涉及到的面太广了,花活很多,比如问你深一点的有Cache管理,量化,vLLM,deepspeed,SageAttention等等,这些多多少少都是围绕硬件做的优化和加速,很广的,根本速成不了,建议再考虑考虑应用方向,这个方向好做的多,但是还是涉及到一个稳定性问题。
5 回复 分享
发布于 2024-11-23 16:53 广东
找实习也得发论文 没论文就不要卷大模型赛道了
4 回复 分享
发布于 2024-11-20 11:42 浙江
建议别来,感觉很泡沫
3 回复 分享
发布于 2024-11-30 20:29 北京
我们组里十几张A6000
2 回复 分享
发布于 2024-12-06 15:47 海南
组里一张 3090 还是算了,微调都很难,可以找找 LLM 的实习试试
2 回复 分享
发布于 2024-11-20 11:18 北京
我辣鸡二本组里都有4090
1 回复 分享
发布于 2024-11-24 15:22 广东
cy,同
点赞 回复 分享
发布于 2024-12-09 15:04 陕西
点赞 回复 分享
发布于 2024-12-03 18:01 河南
可以是可以,不过明年大模型还火不火就不一定了
点赞 回复 分享
发布于 2024-12-02 14:42 湖北
明年还会招这么多大模型吗
点赞 回复 分享
发布于 2024-11-28 07:49 安徽
实在不行,如果有实力自己买一张4080,4090摸清楚理论原理,然后去堆实习,在实习过程中和企业一起发论文。
点赞 回复 分享
发布于 2024-11-22 12:19 江苏
没论文别走大模型赛道,卡都没有更别说了
点赞 回复 分享
发布于 2024-11-21 11:53 广东
可以速成的,不过可能得多堆一些实习和比赛去弥补论文
点赞 回复 分享
发布于 2024-11-20 14:29 四川
不如搜推
点赞 回复 分享
发布于 2024-11-20 14:19 北京

相关推荐

2025-12-21 13:10
门头沟学院 Java
1、Java面向对象具有封装、继承、多态三大核心特性。封装通过访问修饰符隐藏对象内部细节,仅暴露必要接口;继承允许子类复用父类属性和方法,实现代码复用和层次化扩展;多态分为编译时重载和运行时重写,使程序能够通过统一接口处理不同对象,提升灵活性和可扩展性。2、重载发生在同一类中,方法名相同但参数列表不同,与返回值和访问修饰符无关,编译时绑定;重写是子类覆盖父类方法,方法名、参数列表和返回类型必须相同,访问权限不能更严格,不能抛出新的检查异常,运行时动态绑定。3、线程池核心参数包括:核心线程数、最大线程数、空闲存活时间、时间单位、阻塞队列、线程工厂、拒绝策略。ThreadLocal底层使用ThreadLocalMap存储数据,其Key是弱引用的ThreadLocal对象,Value是强引用的实际存储值,每个线程独立拥有此Map实现数据隔离,需注意内存泄漏问题。4、使用线程池实现1~100累加时,首先创建固定大小的线程池,然后将累加任务拆分为多个子任务,通过线程池提交实现了Callable接口的每个子任务,收集返回的Future对象后,遍历这些Future并累加其阻塞获取的中间结果,最终关闭线程池并输出总和。整个过程利用线程池并行处理子任务,通过分治策略提升计算效率,同时确保资源合理回收。5、B+树非叶子节点仅存储键,叶子节点包含全部数据且形成有序链表。相比B树:1. 查询更稳定:所有数据都在叶子节点,查询路径长度一致;2. 范围查询高效:叶子节点链表直接遍历,无需回溯;3. 磁盘I/O更低:节点存储更多键,树更矮胖;4. 全表扫描更快:叶子节点链表顺序遍历即可。6、失效场景:1. 违反最左前缀原则;2. 对索引列使用函数或表达式;3. 类型隐式转换;4. 模糊查询以通配符开头;5. OR条件包含非索引列。优化方法:1. 按高频查询顺序建联合索引;2. 避免索引列运算;3. 用覆盖索引减少回表;4. 数据量大时用分区表;5. 定期分析索引使用率并删除冗余索引。7、通过EXPLAIN命令查看SQL执行计划,关注key字段显示使用的索引名,type字段为ref/range表示有效索引扫描;若为ALL则是全表扫描。额外检查Extra字段:Using index、Using filesort
点赞 评论 收藏
分享
评论
6
26
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务