DeepSeek功能特点与使用场景解析
前言
2025年1月20日,DeepSeek-R1横空出世。
因为优秀的输出表现和远低于其他闭源模型的训练成本迅速进入大家的视野。不管有没有《黑神话悟空》作者冯骥说的那么划时代,但是在这之前确实存在着美国对中国的技术封锁,而deepseek的出现让我们又重新上了牌桌。
正文
关于Deepseek
DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用。DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。
那么Deepseek-R1与之前的大语言模型有哪些不同?
- 性能领先
- 首个展示思维连过程的推理模型
- 价格便宜
- 首个开源的推理模型
- 纯国产、技术创新,训练和推理更加高效
Deepseek能够做什么?
Deepseek直接面向用户也支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景,支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。
文本生成
- 文本创作
- 文章、故事、诗歌写作
- 营销文案、广告语生成
- 社交媒体内容(推文、朋友圈文案等)
- 剧本或者对话设计
- 摘要与改写
- 长文本摘要(论文、报告):Zoom Meeting Summary
- 文本简化(降低复杂度):马斯克用AI简化1547页预算到116页,政治博弈还是科技胜利?
- 多语言翻译与本地化(专业化)
- 结构化生成
- 表格、列表生成
- 代码注释、文档撰写
自然语言理解与分析
- 语义分析
- 情感分析(评论、反馈)
- 意图识别(客服对话、用户查询)
- 实体提取(人名、地点、事件)
- 文本分类
- 主题标签生成(如新闻分类)
- 垃圾内容检测
- 知识推理
- 逻辑问题解答(数学、常识推理)
- 因果分析(事件关联性)
编程与代码相关
- 代码生成
- 根据需求生成代码片段
- 自动补全与注释生成
- 代码调试
- 错误分析与修复建议
- 代码性能优化提示
- 技术文档处理
- API文档生成
- 代码库解释与示例生成
Deepseek与其他语言大模型能力上的主要区别
推理大模型:推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术,比如强化学习、神经符号推理、元学习等,来增强其推理和问题解决能力。
• 例如:DeepSeek-R1,GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。
非推理大模型:适用于大多数任务,非推理大模型一般侧重于语言生成、上下文理解和自然语言处理,而不强调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像推理模型那样复杂的推理和决策能力。
• 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译等任务。
维度 | 推理模型 | 通用模型 |
优势领域 | 数学推导、逻辑分析、代码生成、复杂问题拆解 | 文本生成、创意写作、多轮对话、开放性问答 |
劣势领域 | 发散性任务(如诗歌创作) | 需要严格逻辑链的任务(如数学证明) |
性能本质 | 专精于逻辑密度高的任务 | 擅长多样性高的任务 |
强弱判断 | 并非全面更强,仅在其训练目标领域显著优于通用模型 | 通用场景更灵活,但专项任务需依赖提示语补偿能力 |
对比了模型的特点,那么我们在使用模型时又该如何选择?
概率预测(快速反应模型,如ChatGPT 4o) | 链式推理(慢速思考模型,如OpenAI o1) | |
性能表现 | 响应速度快,算力成本低 | 慢速思考,算力成本高 |
运算原理 | 基于概率预测,通过大量数据训练来快速预测可能的答案 | 基于链式思维(Chain-of-Thought),逐步推理问题的每个步骤来得到答案 |
决策能力 | 依赖预设算法和规则进行决策 | 能够自主分析情况,实时做出决策 |
创造力 | 限于模式识别和优化,缺乏真正的创新能力 | 能够生成新的创意和解决方案,具备创新能力 |
人机互动能力 | 按照预设脚本响应,较难理解人类情感和意图 | 更自然地与人互动,理解复杂情感和意图 |
问题解决能力 | 擅长解决结构化和定义明确的问题 | 能够处理多维度和非结构化问题,提供创造性的解决方案 |
伦理问题 | 作为受控工具,几乎没有伦理问题 | 引发自主性和控制问题的伦理讨论 |
综上,通用的大语言模型更适合处理需要快速反馈的即时任务,推理模型更适合通过推理过程来解决复杂问题。
如何使用提示语?
通用模型:
- 需显式引导推理步骤(如通过CoT提示),否则可能跳过关键逻辑。
- 依赖提示语补偿能力短板(如要求分步思考、提供示例)。
推理模型:
- 提示语更简洁,只需明确任务目标和需求(因其已内化推理逻辑)。
- 无需逐步指导,模型自动生成结构化推理过程(若强行拆解步骤,反而可能限制其能力)。
关键原则
模型选择时:
优先根据任务类型而非模型热度选择(如数学任务选推理模型,创意任务选通用模型)。
提示语设计时:
推理模型:简洁指令,聚焦目标,信任其内化能力。--要什么直接说
通用模型:结构化、补偿性引导。--缺什么补什么
避免误区
不要对通用模型“过度信任”(如直接询问复杂推理问题,需分步验证结果)。
不要对推理模型使用“启发式”提示(如角色扮演),可能干扰其逻辑主线。
从下达指令到表达需求
策略类型 | 定义与目标 | 适用场景 | 示例 | 优势与风险 |
指令驱动 | 直接给出明确步骤或格式要求 | 简单任务、需快速执行 | 用JS编写快排函数,输出需要包含注释 | 结果精准高效 限制模型自主优化空间 |
需求导向 | 描述问题背景与目标,由模型规划解决路径 | 复杂问题,需模型自主推理 | 我需要开发一个APP,需要同时兼容Desktop、IOS、Android三个平台,帮我推荐一下技术栈 | 激发模型深层推理 需要清晰定义需求边界 |
混合模式 | 结合需求描述与关键约束条件 | 平衡灵活性与可控性 | 设计一个苏州三日游计划,需要包含江南古镇和寒山寺,且预算控制在2000以内 | 兼顾目标与细节 避免过度约束 |
启发式提问 | 通过提问引导模型主动思考(如“为什么”“如何”) | 探索性问题、需要模型解释逻辑 | 为什么选择LRU算法解决优化问题?请对比其他算法 | 触发模型自解释能力 可能偏离核心目标 |
任务需求与提示语策略
任务类型 | 使用模型 | 提示语侧重点 | 示例(有效提示) | 需避免的提示策略 |
数学证明 | 推理模型 | 直接提问,无需分步引导 | 证明勾股定理 | 冗余拆解(如“先画图,再列公式”) |
通用模型 | 显示要求分步思考,提供示例 | 请分三步证明勾股定理 1.画一个直角三角形... | 直接提问(易跳过关键步骤) | |
创意写作 | 推理模型 | 鼓励发散性,设定角色、风格 | 以海明威的风格写一个冒险故事 | 过度约束逻辑 |
通用模型 | 需要明确约束目标,避免自由发挥 | 写一个包含“量子”和“沙漠”的短片小说,不超过200字 | 开放式指令,如自由创作 | |
代码生成 | 推理模型 | 简洁需求,信任模型逻辑 | 用JS实现快速排序 | 分步指导,如:先写递归函数。。。 |
通用模型 | 细化步骤,明确输入输出格式 | 先解释快速排序原理,再写出代码并测试示例 | 模糊需求,如写个排序代码 | |
多轮对话 | 推理模型 | 自然交互,无需结构化指令 | 你觉得人工智能的未来会怎样 | 强制逻辑链条,如:分三点回答 |
通用模型 | 需要明确对话目标,避免开放发散 | 从技术、伦理、经济三方面分析AI的未来 | 情感化提问,如:你害怕AI吗 | |
逻辑分析 | 推理模型 | 直接抛出复杂问题 | 分析电车难题中的功利主义与道德主义冲突 | 添加主观引导,如:你认为哪种对? |
通用模型 | 需要拆解问题,逐步追问 | 先解释电车难题的定义,再对比两种伦理观的差异 | 一次性提问复杂逻辑 |
提防AI幻觉
什么是AI幻觉?
AI幻觉是一种现象,即大语言模型(LLM)--通常是生成式聊天机器人或计算机视觉工具--感知人类观察者不存在或者无法感知的模式或对象,从而产生无意义或完全不准确的输出。
AI幻觉的一些值得注意的例子包括:
- 谷歌的“Bard”聊天机器人错误的宣称,James Webb太空望远镜拍摄到了世界上第一张太阳系外星球的图像。
- Microsoft的聊天机器AI“Sydney”承认爱上了用户并监视了Bing员工。
- Meta于2022年撤下了其Galactica LLM演示,因为它向用户提供了不准确信息,有时还带有偏见。
人机共生时代的能力培养体系
关于AI与前端的一些思考
AI的出现,给各个行业都带来了更多的可能,但是同时对各个领域的从业人员也带来了挑战,我想这个问题是每个专业技能领域的人都需要思考的,就是有哪些是我们做的能比AI好的?
对于前端开发来说,虽然AI编程与独立开发者的边界正在变得模糊,但是目前的AI体现出来更多的还是工具属性
以下是目前比较流行的一些前端AI工具:
我想真是以下的AI能力限制暂时保证了我们的不可替代性:
- 还不是AGI,不能一步到位,需要人类的问题拆解能力、信息整合能力和迭代调优能力。
- 有很强的能力,但是也会经常出错;预载了很多知识,但并不知道所有的知识,需要我们利用其能力,判断其结果,不断改进它的知识。
- 目前模型的能力普遍有局限,不能同时处理(输入和输出)多模态数据(图片、视频等)。
- 模型上下文长度有限,事情的前因后果它并不能事无巨细的知道。
但是,人工智能的发展人类展现出了极大的热情,市场表现出了深切的渴望,他的发展速度可以说没有一个人可以真正预料,没人能保证明天另一个DeepSeek会不会横空出世,在现在的工作中,会不会用AI,即将成为一个分水岭,会用的人或者组织,生产效率将远远甩开那些不会用的!
参考资料:
Deepseek从入门到精通-清华大学
湖南大学:我们该如何看待DeepSeek --- what,how,why,and next
深度融合AI的低代码平台---姜天意