2023-08-16 21:32

关注

AI大模型初探

前言

随着ChatGPT的腾空出世，AI已被推到了一个新的历史高度。前几年自己的工作领域就或多或少开始接触到AI，初步了解到AI的应用，那时主要是对AI算法进行封装对外提供能力。随着AI越来越热门，这两年自己开始去学习了《概率论》、《线性代数》、《数理统计》、然后实际操练了一下AI常用的算法，自己开始能够理解AI的一些底层原理，以及算法模型关联的场景。

站在AI应用的角度上来讲，自己算是初步跨入这个行业，但是要理解AI底层的原理和算法，数学功底还差得比较远。伴随着 GPT-3、Stable Diffusion 这样预训练好的大型基础模型的出现，以及这些模型的能力通过开放 API 的形式提供出来，即使没有任何机器学习的理论知识，我们也只需要一两天时间，就能做出一个能解决实际问题的AI应用。

拥抱它还是被它颠覆

这一轮的 AI 浪潮里，对应技术能够应用的范围非常广泛，可以说是包罗万象。AI可以帮我写代码，翻译英文资料，帮我修改文章，为文章配图等等；在工作上，可以让AI来优化商品文案、优化商品搜索，并进一步开始尝试让AI承接更多原本需要由人来进行的工作。

我不知道 AI 会不会让你失业，但是善用 AI 的团队和公司接下来一定会有更高的效率和产出。无论你是产品经理还是工程师，是产品运营还是美术设计，在这一轮 AI 浪潮下，你的工作性质都会产生根本性的改变。AI 会像一个助手一样随时陪伴在我们身边，随时帮我们解决简单的知识性工作，甚至在很多时候给我们创意性的启发。

整个 AI 基于基础大模型发展出来的能力，堪比一次工业革命。固然，这个改变对很多人的职业生涯来说，也是一场危机。但是就像丘吉尔所说的，“不要浪费一场危机”，尽早去拥抱这个变化，你就有机会像在 2008 年 App Store 发布的时候去学习移动 App 开发一样，把握住未来的机会。

大语言模型应用

大型语言模型的接口其实非常简单，像OpenAI就只提供了Complete和Embedding两个接口，其中，Complete可以让模型根据你的输入进行自动续写，Embedding可以将你输入的文本转化成向量。

Complete接口的应用例子如下：

import openai
import os

openai.api_key = os.environ.get("OPENAI_API_KEY")
COMPLETION_MODEL = "text-davinci-003"

prompt = """
请给我写一段关于AIGC的演讲稿，按照如下说明分成3段。

1. 先介绍一下当前AIGC的现状，要求少于50个字。
2. 再说明一下当前AIGC几个热门的应用，要求小于100个字。
3. 最后展望一下AIGC未来的发展前景，要求小于50个字。

"""


def get_response(prompt123):
    completions = openai.Completion.create(
        engine=COMPLETION_MODEL,
        prompt=prompt123,
        max_tokens=512,
        n=1,
        stop=None,
        temperature=0.0,
    )
    message = completions.choices[0].text
    return message


print(get_response(prompt))

响应结果如下：

1. AIGC（Artificial Intelligence and Game Computing）是一种新兴的计算机技术，它将人工智能技术与游戏计算机技术结合在一起。

2. AIGC在当今的应用领域非常广泛，包括自然语言处理、机器视觉、智能客服、智能安全、智能推荐系统等。

3. AIGC未来的发展前景非常广阔，它将在更多的领域发挥作用，为人类带来更多的便利。

Embedding接口的应用例子如下：

import openai
import os
from openai.embeddings_utils import cosine_similarity, get_embedding

# 获取访问open ai的密钥
openai.api_key = os.environ.get("OPENAI_API_KEY")
# 选择使用最小的ada模型
EMBEDDING_MODEL = "text-embedding-ada-002"

# 获取"好评"和"差评"的
positive_review = get_embedding("好评")
negative_review = get_embedding("差评")


def get_score(sample_embedding):
    return cosine_similarity(sample_embedding, positive_review)-cosine_similarity(sample_embedding, negative_review)


good_restaurant = get_embedding("这家餐馆太好吃了，一点都不糟糕")
bad_restaurant = get_embedding("这家餐馆太糟糕了，一点都不好吃")

good_score = get_score(good_restaurant)
bad_score = get_score(bad_restaurant)
print("好评餐馆的评分 : %f" % good_score)
print("差评餐馆的评分 : %f" % bad_score)

响应结果如下：

好评餐馆的评分 : 0.062719
差评餐馆的评分 : -0.074591

Embedding使用说明

Embedding这个API可以把任何你指定的一段文本，变成一个大语言模型下的向量，也就是用一组固定长度的参数来代表任何一段文本。

先计算好“好评”和“差评”这两个特征的Embedding。
对于我们要区分的任何一段文本评论，再通过API获取它的Embedding。
通过计算文本评论的Embedding和两个特征的Embedding之间的余弦距离，得到它的相似度。
分数大于0，说明评论和“好评”的距离更近，判定为好评。否则，判定它为差评。

总结

在 ChatGPT、Whisper 和 Stable Diffusion 这样强大的 AI 技术出现之后，我们去学习任何新技术和新知识的方式也都应该更加高效。利用AI工具来改造你学习和工作的流程，把AI嵌入你生活和工作的方方面面，不断通过AI工具来提升自己的效率。

全部评论

推荐最新楼层

03-04 20:05

百度_高级研发工程师

AI面试相关之RAG与Doris（JAVA）

最仅段段开始复习并面试了，但是市场行情还是差点意思，段段把最近学的和面试的，以及段段做的AIGC项目做个小总结，希望能对大家带来帮助。 不得不感叹AI进步速度之快，我们这帮研发天天研究用AI革自己的命，属于是没有办法的办法了，在这个巨大变革的时代，我们也不得不跟进潮流，防止淘汰了，闲话少说，上干货。 本文主要讲解RAG架构，RAG定义，Doris数据仓湖，Doris分区分桶，贪多嚼不烂，先讲这几个。一、RAG架构 什么是RAG架构，很多同学其实有思想误区，任务RAG是个向量库，RAG是个什么什么服务，其实都不准确。严格来说，RAG代表一种架构思想。 定义：RAG全名增强检索生成（Retriev...

AI求职实录

点赞评论收藏

03-03 10:00

江南大学算法工程师

AI时代，人还能做些什么呢?

前些天看了 Clawdbot 创始人的采访——这哥们单日提交 1.3k commits，一个月 6600+ 次提交，有的代码自己一句都没看过，非常恐怖。所以在不久的将来，当 AI 已经完全具备写代码的能力，人类程序员的操作空间还能剩多少？最近在实习，做大模型微调，新鲜期过了，发现不过是机械劳动，造数据 → 训模型 → 看 badcase → 然后再造数据，循环往复...这不就是Agent的ReAct范式么? (坏了，我成智能体了) 需求明确的情况下，Claude-3.5/3.6 也完全可以独立完成造数据 pipeline 的开发，偶尔会留下一些语法错误，在两三轮尝试之内也能自己修正过来......这里非要人来完成的环节并不多，只能用人来完成的理由，好像只剩人比较便宜了...？ 但 AI infra、推理加速也在飞速发展，这种相对的便宜，又能持续多久呢？Clawdbot已经火到到处都在讨论，尽管目前在国内的适配有限，(门槛高是一方面，还很重要的一点是比较烧钱...)不过它对人类劳动力的节省是没办法忽视的。目前同事们普遍认为这玩意儿现在只能接入飞书写写文档，但你也知道，“目前”而已。GPT-4 推出的那年或许看上去还有点呆，但短短几年，拥有 skills 和 function call 的大模型已经可以帮你完成打开应用、查看消息、撰写文档这种复合任务——写代码又能比写飞书文档复杂多少呢？不过是接入不同的软件，阅读不同的文本，调用不同的修改命令，底层是一样的，现在 Copilot 已经做得有模有样，更别说 Clawdbot 这种具有自我进化能力的 Agent，只要 token 多，Clawdbot 完全可以给自己装一堆功能，能量超乎你想象。有人说了，我做的项目大着呢，全是屎山代码，我不信 AI 能看完，这说的其实是长上下文问题，我个人不认为是一个无法解决的问题，随着上下文窗口的扩展和长期记忆管理的研究工作不断发展，AI 总能找到方法把你的超长文本压缩成一个一个的小块，然后逐个击破（虽然目前 GPT-5.2 Codex 改我的代码还是会改着改着一片红...）有句话说得好，你怕被 AI 替代，是因为你太像 AI。你的工作流程高度标准化、可预测、可复现——接需求、看文档、查 API、写代码、测试、提交。每一步都有明确的输入输出，每一步都能被拆解成清晰的指令。这种工作方式，恰好是 AI 最擅长的。如果你的价值体现在“把业务逻辑翻译成代码”，那 AI 确实可以做得更快、更稳定、更便宜。它不会写错大小写，不会忘记边界条件，不会因为昨晚没睡好就漏掉一个判断。要想不被替代，就得做那些 AI 做不了的事，比如和产品经理撕逼，解释为什么这个需求做不了；看着三个技术方案，权衡性能、成本、开发周期，最后拍板选一个；跨部门开会，听运营讲了半天业务痛点，翻译成技术语言，还得判断她说的是真需求还是伪需求。这些事情需要判断、需要博弈、需要对人的理解， AI 暂时还做不来。但问题是，这些事情需要多少人来干？以前一个项目可能需要十个程序员，现在有了 AI，也许三个人就够了,剩下那七个人上哪去？......也许他们会转型，在行业找到新位置，也许是去卖炒粉了，说不好。但有一点感觉很明显：AI 在拉高门槛。以前你会写代码就能找到工作，现在得会“用 AI 写代码 + 理解业务 + 做技术决策”。这个组合技能，不是每个人都能凑齐的。工具会进化，但人怎么不被工具定义，可能是我们未来一段时间需要长期思考的问题。

李橙子：有句话说得好，你怕被 AI 替代，是因为你太像 AI。这句话说的很对

AI求职实录

点赞评论收藏

03-03 22:25

鲁东大学 PHP

27届双非硕简历求锐评

现在想去找一段实习，各位佬简历给指导一下。

点赞评论收藏

03-06 21:04

井冈山大学数据库工程师

求一个大模型应用开发的学习路线

本人双非硕，科班研一在读，感觉网上全在唱衰前后端开发，又全在吹捧ai方向，但是可能因为ai兴起没几年，网上根本没有成熟的ai方向教学路线，有没有已经从事该岗位或者已经在学的uu给个建议，或者给个具体的学习路线，感觉b站上面黑马的学习路线太多理论知识了，平时感觉看一整天课，一点学习的成就感都没有

双非本科求职如何逆袭

点赞评论收藏

02-28 18:31

周口师范学院 Web前端

双非二本计算机女生

各位大佬们，目前感到很迷茫，我是双非二本的软工移动应用开发专业的女生。我今天在dy上看到很多参差不齐的说法，有的说java竞争压力大，饱和了，不要去学；又有相反的看法。我现在是大二，大一学了c和c++,但是学的不好，css和html5我自我感觉还可以，大二上学期学的JavaScript也没有学好。我不想考研考公，想问一下各位大佬们，有没有什么建议，建议的方向、语言等。

双非本科求职如何逆袭

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 给工作过的公司写一条大众点评，你会怎么写？ #

# 你觉得专业和学校哪个对薪资影响最大 #

103696次浏览 612人参与