AI大模型初探

前言

随着ChatGPT的腾空出世,AI已被推到了一个新的历史高度。前几年自己的工作领域就或多或少开始接触到AI,初步了解到AI的应用,那时主要是对AI算法进行封装对外提供能力。随着AI越来越热门,这两年自己开始去学习了《概率论》、《线性代数》、《数理统计》、然后实际操练了一下AI常用的算法,自己开始能够理解AI的一些底层原理,以及算法模型关联的场景。

站在AI应用的角度上来讲,自己算是初步跨入这个行业,但是要理解AI底层的原理和算法,数学功底还差得比较远。伴随着 GPT-3、Stable Diffusion 这样预训练好的大型基础模型的出现,以及这些模型的能力通过开放 API 的形式提供出来,即使没有任何机器学习的理论知识,我们也只需要一两天时间,就能做出一个能解决实际问题的AI应用。

拥抱它还是被它颠覆

这一轮的 AI 浪潮里,对应技术能够应用的范围非常广泛,可以说是包罗万象。AI可以帮我写代码,翻译英文资料,帮我修改文章,为文章配图等等;在工作上,可以让AI来优化商品文案、优化商品搜索,并进一步开始尝试让AI承接更多原本需要由人来进行的工作。

我不知道 AI 会不会让你失业,但是善用 AI 的团队和公司接下来一定会有更高的效率和产出。无论你是产品经理还是工程师,是产品运营还是美术设计,在这一轮 AI 浪潮下,你的工作性质都会产生根本性的改变。AI 会像一个助手一样随时陪伴在我们身边,随时帮我们解决简单的知识性工作,甚至在很多时候给我们创意性的启发。

整个 AI 基于基础大模型发展出来的能力,堪比一次工业革命。固然,这个改变对很多人的职业生涯来说,也是一场危机。但是就像丘吉尔所说的,“不要浪费一场危机”,尽早去拥抱这个变化,你就有机会像在 2008 年 App Store 发布的时候去学习移动 App 开发一样,把握住未来的机会。

大语言模型应用

大型语言模型的接口其实非常简单,像OpenAI就只提供了Complete和Embedding两个接口,其中,Complete可以让模型根据你的输入进行自动续写,Embedding可以将你输入的文本转化成向量。

Complete接口的应用例子如下

import openai
import os

openai.api_key = os.environ.get("OPENAI_API_KEY")
COMPLETION_MODEL = "text-davinci-003"

prompt = """
请给我写一段关于AIGC的演讲稿,按照如下说明分成3段。

1. 先介绍一下当前AIGC的现状,要求少于50个字。
2. 再说明一下当前AIGC几个热门的应用,要求小于100个字。
3. 最后展望一下AIGC未来的发展前景,要求小于50个字。

"""


def get_response(prompt123):
    completions = openai.Completion.create(
        engine=COMPLETION_MODEL,
        prompt=prompt123,
        max_tokens=512,
        n=1,
        stop=None,
        temperature=0.0,
    )
    message = completions.choices[0].text
    return message


print(get_response(prompt))

响应结果如下:

1. AIGCArtificial Intelligence and Game Computing)是一种新兴的计算机技术,它将人工智能技术与游戏计算机技术结合在一起。

2. AIGC在当今的应用领域非常广泛,包括自然语言处理、机器视觉、智能客服、智能安全、智能推荐系统等。

3. AIGC未来的发展前景非常广阔,它将在更多的领域发挥作用,为人类带来更多的便利。

Embedding接口的应用例子如下

import openai
import os
from openai.embeddings_utils import cosine_similarity, get_embedding

# 获取访问open ai的密钥
openai.api_key = os.environ.get("OPENAI_API_KEY")
# 选择使用最小的ada模型
EMBEDDING_MODEL = "text-embedding-ada-002"

# 获取"好评"和"差评"的
positive_review = get_embedding("好评")
negative_review = get_embedding("差评")


def get_score(sample_embedding):
    return cosine_similarity(sample_embedding, positive_review)-cosine_similarity(sample_embedding, negative_review)


good_restaurant = get_embedding("这家餐馆太好吃了,一点都不糟糕")
bad_restaurant = get_embedding("这家餐馆太糟糕了,一点都不好吃")

good_score = get_score(good_restaurant)
bad_score = get_score(bad_restaurant)
print("好评餐馆的评分 : %f" % good_score)
print("差评餐馆的评分 : %f" % bad_score)

响应结果如下:

好评餐馆的评分 : 0.062719
差评餐馆的评分 : -0.074591

Embedding使用说明

Embedding这个API可以把任何你指定的一段文本,变成一个大语言模型下的向量,也就是用一组固定长度的参数来代表任何一段文本。

  1. 先计算好“好评”和“差评”这两个特征的Embedding。
  2. 对于我们要区分的任何一段文本评论,再通过API获取它的Embedding。
  3. 通过计算文本评论的Embedding和两个特征的Embedding之间的余弦距离,得到它的相似度。
  4. 分数大于0,说明评论和“好评”的距离更近,判定为好评。否则,判定它为差评。

总结

在 ChatGPT、Whisper 和 Stable Diffusion 这样强大的 AI 技术出现之后,我们去学习任何新技术和新知识的方式也都应该更加高效。利用AI工具来改造你学习和工作的流程,把AI嵌入你生活和工作的方方面面,不断通过AI工具来提升自己的效率。

全部评论

相关推荐

前些天看了 Clawdbot 创始人的采访——这哥们单日提交 1.3k commits,一个月 6600+ 次提交,有的代码自己一句都没看过,非常恐怖。所以在不久的将来,当 AI 已经完全具备写代码的能力,人类程序员的操作空间还能剩多少?最近在实习,做大模型微调,新鲜期过了,发现不过是机械劳动,造数据 → 训模型 → 看 badcase → 然后再造数据,循环往复...这不就是Agent的ReAct范式么? (坏了,我成智能体了) 需求明确的情况下,Claude-3.5/3.6 也完全可以独立完成造数据 pipeline 的开发,偶尔会留下一些语法错误,在两三轮尝试之内也能自己修正过来......这里非要人来完成的环节并不多,只能用人来完成的理由,好像只剩人比较便宜了...? 但 AI infra、推理加速也在飞速发展,这种相对的便宜,又能持续多久呢?Clawdbot已经火到到处都在讨论,尽管目前在国内的适配有限,(门槛高是一方面,还很重要的一点是比较烧钱...)不过它对人类劳动力的节省是没办法忽视的。目前同事们普遍认为这玩意儿现在只能接入飞书写写文档,但你也知道,“目前”而已。GPT-4 推出的那年或许看上去还有点呆,但短短几年,拥有 skills 和 function call 的大模型已经可以帮你完成打开应用、查看消息、撰写文档这种复合任务——写代码又能比写飞书文档复杂多少呢?不过是接入不同的软件,阅读不同的文本,调用不同的修改命令,底层是一样的,现在 Copilot 已经做得有模有样,更别说 Clawdbot 这种具有自我进化能力的 Agent,只要 token 多,Clawdbot 完全可以给自己装一堆功能,能量超乎你想象。有人说了,我做的项目大着呢,全是屎山代码,我不信 AI 能看完,这说的其实是长上下文问题,我个人不认为是一个无法解决的问题,随着上下文窗口的扩展和长期记忆管理的研究工作不断发展,AI 总能找到方法把你的超长文本压缩成一个一个的小块,然后逐个击破(虽然目前 GPT-5.2 Codex 改我的代码还是会改着改着一片红...)有句话说得好,你怕被 AI 替代,是因为你太像 AI。你的工作流程高度标准化、可预测、可复现——接需求、看文档、查 API、写代码、测试、提交。每一步都有明确的输入输出,每一步都能被拆解成清晰的指令。这种工作方式,恰好是 AI 最擅长的。如果你的价值体现在“把业务逻辑翻译成代码”,那 AI 确实可以做得更快、更稳定、更便宜。它不会写错大小写,不会忘记边界条件,不会因为昨晚没睡好就漏掉一个判断。要想不被替代,就得做那些 AI 做不了的事,比如和产品经理撕逼,解释为什么这个需求做不了;看着三个技术方案,权衡性能、成本、开发周期,最后拍板选一个;跨部门开会,听运营讲了半天业务痛点,翻译成技术语言,还得判断她说的是真需求还是伪需求。这些事情需要判断、需要博弈、需要对人的理解, AI 暂时还做不来。但问题是,这些事情需要多少人来干?以前一个项目可能需要十个程序员,现在有了 AI,也许三个人就够了,剩下那七个人上哪去?......也许他们会转型,在行业找到新位置,也许是去卖炒粉了,说不好。但有一点感觉很明显:AI 在拉高门槛。以前你会写代码就能找到工作,现在得会“用 AI 写代码 + 理解业务 + 做技术决策”。这个组合技能,不是每个人都能凑齐的。工具会进化,但人怎么不被工具定义,可能是我们未来一段时间需要长期思考的问题。
李橙子:有句话说得好,你怕被 AI 替代,是因为你太像 AI。这句话说的很对
AI求职实录
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务