关于人工智能模型的讨论

神经网络正在创造技术奇迹。相信有部分同学已经注意到,上周(2024年9月12日),OpenAI推出了他们最新的人工智能模型 OpenAI o1 ,率先上线的是这一模型的一个早期预览版本 OpenAI o1-preview 和小尺寸版 OpenAI o1-mini 。这一模型代表了 AI 模型在推理能力、编码能力和连续理解能力上的重大飞跃。

引用自OpenAI官网说法

他们可以通过复杂的任务进行推理,并解决比以前的科学、编码和数学模型更难的问题。

对于复杂的推理任务来说,这是一个重大进步,代表了人工智能能力的新水平。鉴于此,我们将计数器重置为 ,并将该系列命名为 OpenAI o1

我们有理由相信,进步还将继续,我们可以期待神经网络在编程竞赛领域取得更大进步。然而,技术的发展导致的滥用也是显而易见的,如果大量用户都借助于 AI 模型的力量来提高自己的 Rating 分数,那么竞技性算法竞赛和由此延伸出的各类竞赛规则将迅速的被击溃。事实上,这一新模型的运用速度远超我们的想象。在 o1 推出后的第二天(2024年9月14日),Codeforces Round 972 (Div. 2) 的编程比赛中,就有用户完全依赖于 o1 取得了相当夸张的成绩;同样的,在上周末(2024年9月15日)进行的牛客周赛 Round 60 中,我们也有注意到 o1 的身影,并且有用户完全依赖于 o1 的解决方案得到了相当靠前的名次;更甚于,在近期进行的多场校招笔试中,我们也有发现人工智能的身影。

选手通过使用 AI 模型解决了复杂问题,并获得了远超其实际编程能力的成绩。这不仅极大地改变了比赛的竞争格局,也使得选手之间的差距变得难以量化、导致比赛的公平性和竞技性受到挑战。对于竞技性算法编程竞赛领域来说,我们迎来了属于自己的 AlphaGO 时刻。

遗憾的是,就目前的技术而言,我们并没有做好完全应对的措施,特别是对于周赛、小白月赛这样的面向新手编程同学的竞赛,题目简单,使用 AI 通过的概率也高;然而,我们依旧需要这些简单的、入门的题目的帮助。

因此,在当下,我们只能够最低程度、但是非常严肃的呼吁,限制使用基于人工智能的系统(包括但不限于如 GPTGeminiGemmaClaude 、文心一言 等各种模型)来解决编程问题。

不过,我们也认识到,人工智能可以成为学习和辅助编码的重要工具,因此我们希望为人工智能的使用设定明确的界限。

【我们积极允许您】

使用 AI 模型翻译问题陈述,但必须确保模型不会对陈述进行解释或总结,而是仅提供最基本的直接翻译。

使用 AI 模型提供的代码,但仅限于语法提示和次要的编码建议,或在复杂问题的边缘部分寻求辅助建议。不允许使用它们生成解决问题的核心逻辑或算法。

【我们强烈反对您】

将问题题干、摘要输入基于人工智能的系统,使用借鉴 AI 模型提供的编码思路或解决方案。

使用 AI 模型诊断或解决代码中的错误、协助理解问题、创建逻辑或决策。

同时,此前的作弊识别系统依旧有效。如果两名参赛者的代码相似,而匹配的代码在比赛前并不公开存在于互联网上,将被判定为作弊。

如何在技术进步与人类能力的培养之间找到平衡,已成为整个圈内亟待解决的问题。我们仍在不断的更新改进我们的策略,以尽可能的降低 AI 模型被不当用于牛客,并尽力维护公平竞赛的完整性。同时,我们也正在积极考虑将 AI 模型引入作弊识别系统,如通过 AI 来识别异常的编程行为、通过分析选手的编程风格和代码规范性来预估选手水平。如果你有更多的想法,欢迎通过各种渠道与我们进行讨论。

全部评论

相关推荐

咦哟,从去年八月份开始长跑,两处实习转正都失败了,风雨飘摇,终于拿到offer了更新一下面试记录:秋招:多部门反复面试然后挂掉然后复活,具体问了啥已经忘了,只是被反复煎炸,直至焦香😋春招:base北京抖音hr打来电话说再次复活,准备面试,gogogo北京抖音一面:六道笔试题:1.promise顺序2.定义域问题3.flat展开4.并发请求5.岛屿数量算法(力扣)深度,广度都写6.忘记了,好像也是算法,难度中等其他问题多是框架底层设计,实习项目重难点~~~秒过😇北京抖音二面:三道笔试题:(为什么只有三道是因为第三道没做出来,卡住了)1.中等难度算法(忘记啥题了,应该是个数组的)2.认识js的继承本质(手写继承模式,深入js的面相对象开发)3.手写vue的响应式(卡在了watch,导致挂掉)---后知后觉是我的注册副作用函数写得有问题,有点紧张了其他题目多是项目拷打,项目亮点,对实习项目的贡献~~~第二天,挂,but立马复活转战深圳客服当天约面深圳客服一面:六道笔试题,由于面过太多次字节,面试官叫我直接写,不用讲,快些写完😋,具体都是些继承,深拷贝(注意对数组对象分开处理,深层次对象,循环引用),加中等难度算法题~~~秒过深圳客服二面:口诉八股大战:大概囊括网络,浏览器渲染原理,动画优化,时间循环,任务队列等等(你能想到的简单八股通通拉出来鞭尸😋)算法题:笔试题6道:1:找出数组内重复的数,arr[0]-arr[n]内的数大小为[1-n],例如[1,2,2,3,3]返回[2,3],要求o(n),且不使用任何额外空间(做到了o(n),空间方面欠佳,给面试官说进入下一题,做不来了)2:原滋原味的继承(所以继承真滴很重要)3:力扣股票购买时机难度中等其他滴也忘记了,因为拿到offer后鼠鼠一下子就落地了,脑子自动过滤掉可能会攻击鼠鼠的记忆😷~~~秒过深圳客服三面:项目大战参与战斗的人员有:成员1:表单封装及其底层原理,使用成本的优化,声明式表单成员2:公司内部库生命周期管理成员3:第三方库和内部库冲突如何源码断点调试并打补丁解决成员4:埋点的艺术成员5:线上项目捷报频传如何查出内鬼成员6:大文件分片的风流趣事成员7:设计模式对对碰成员8:我构建hooks应对经理的新增的小需求的故事可能项目回答的比较流利,笔试题3道,都很简单,相信大家应该都可以手拿把掐😇~~~过过过无hr面后续煎熬等待几天直接hr打电话发offer了,希望大家也可以拿到自己心仪的offer
法力无边年:牛哇,你真是准备得充分,我对你没有嫉妒,都是实打实付出
查看19道真题和解析
点赞 评论 收藏
分享
Beeee0927:正确的建议
点赞 评论 收藏
分享
评论
6
2
分享

创作者周榜

更多
牛客网
牛客企业服务