2023-08-16 21:02

关注

AI大模型初探

前言

随着ChatGPT的腾空出世，AI已被推到了一个新的历史高度。前几年自己的工作领域就或多或少开始接触到AI，初步了解到AI的应用，那时主要是对AI算法进行封装对外提供能力。随着AI越来越热门，这两年自己开始去学习了《概率论》、《线性代数》、《数理统计》、然后实际操练了一下AI常用的算法，自己开始能够理解AI的一些底层原理，以及算法模型关联的场景。

站在AI应用的角度上来讲，自己算是初步跨入这个行业，但是要理解AI底层的原理和算法，数学功底还差得比较远。伴随着 GPT-3、Stable Diffusion 这样预训练好的大型基础模型的出现，以及这些模型的能力通过开放 API 的形式提供出来，即使没有任何机器学习的理论知识，我们也只需要一两天时间，就能做出一个能解决实际问题的AI应用。

拥抱它还是被它颠覆

这一轮的 AI 浪潮里，对应技术能够应用的范围非常广泛，可以说是包罗万象。AI可以帮我写代码，翻译英文资料，帮我修改文章，为文章配图等等；在工作上，可以让AI来优化商品文案、优化商品搜索，并进一步开始尝试让AI承接更多原本需要由人来进行的工作。

我不知道 AI 会不会让你失业，但是善用 AI 的团队和公司接下来一定会有更高的效率和产出。无论你是产品经理还是工程师，是产品运营还是美术设计，在这一轮 AI 浪潮下，你的工作性质都会产生根本性的改变。AI 会像一个助手一样随时陪伴在我们身边，随时帮我们解决简单的知识性工作，甚至在很多时候给我们创意性的启发。

整个 AI 基于基础大模型发展出来的能力，堪比一次工业革命。固然，这个改变对很多人的职业生涯来说，也是一场危机。但是就像丘吉尔所说的，“不要浪费一场危机”，尽早去拥抱这个变化，你就有机会像在 2008 年 App Store 发布的时候去学习移动 App 开发一样，把握住未来的机会。

大语言模型应用

大型语言模型的接口其实非常简单，像OpenAI就只提供了Complete和Embedding两个接口，其中，Complete可以让模型根据你的输入进行自动续写，Embedding可以将你输入的文本转化成向量。

Complete接口的应用例子如下：

import openai
import os

openai.api_key = os.environ.get("OPENAI_API_KEY")
COMPLETION_MODEL = "text-davinci-003"

prompt = """
请给我写一段关于AIGC的演讲稿，按照如下说明分成3段。

1. 先介绍一下当前AIGC的现状，要求少于50个字。
2. 再说明一下当前AIGC几个热门的应用，要求小于100个字。
3. 最后展望一下AIGC未来的发展前景，要求小于50个字。

"""


def get_response(prompt123):
    completions = openai.Completion.create(
        engine=COMPLETION_MODEL,
        prompt=prompt123,
        max_tokens=512,
        n=1,
        stop=None,
        temperature=0.0,
    )
    message = completions.choices[0].text
    return message


print(get_response(prompt))

响应结果如下：

1. AIGC（Artificial Intelligence and Game Computing）是一种新兴的计算机技术，它将人工智能技术与游戏计算机技术结合在一起。

2. AIGC在当今的应用领域非常广泛，包括自然语言处理、机器视觉、智能客服、智能安全、智能推荐系统等。

3. AIGC未来的发展前景非常广阔，它将在更多的领域发挥作用，为人类带来更多的便利。

Embedding接口的应用例子如下：

import openai
import os
from openai.embeddings_utils import cosine_similarity, get_embedding

# 获取访问open ai的密钥
openai.api_key = os.environ.get("OPENAI_API_KEY")
# 选择使用最小的ada模型
EMBEDDING_MODEL = "text-embedding-ada-002"

# 获取"好评"和"差评"的
positive_review = get_embedding("好评")
negative_review = get_embedding("差评")


def get_score(sample_embedding):
    return cosine_similarity(sample_embedding, positive_review)-cosine_similarity(sample_embedding, negative_review)


good_restaurant = get_embedding("这家餐馆太好吃了，一点都不糟糕")
bad_restaurant = get_embedding("这家餐馆太糟糕了，一点都不好吃")

good_score = get_score(good_restaurant)
bad_score = get_score(bad_restaurant)
print("好评餐馆的评分 : %f" % good_score)
print("差评餐馆的评分 : %f" % bad_score)

响应结果如下：

好评餐馆的评分 : 0.062719
差评餐馆的评分 : -0.074591

Embedding使用说明

Embedding这个API可以把任何你指定的一段文本，变成一个大语言模型下的向量，也就是用一组固定长度的参数来代表任何一段文本。

先计算好“好评”和“差评”这两个特征的Embedding。
对于我们要区分的任何一段文本评论，再通过API获取它的Embedding。
通过计算文本评论的Embedding和两个特征的Embedding之间的余弦距离，得到它的相似度。
分数大于0，说明评论和“好评”的距离更近，判定为好评。否则，判定它为差评。

总结

在 ChatGPT、Whisper 和 Stable Diffusion 这样强大的 AI 技术出现之后，我们去学习任何新技术和新知识的方式也都应该更加高效。利用AI工具来改造你学习和工作的流程，把AI嵌入你生活和工作的方方面面，不断通过AI工具来提升自己的效率。

全部评论

推荐最新楼层

11-03 10:03

已编辑

中南大学 Java

26届双非本拿下美团SSP的真实感受

虽然有点标题党了，但是双非的本科让我暑期和秋招确实比别人少了很多机会，包括腾讯、阿里系、携程、虾皮等暑期+秋招均没有一次面试啊。不说了，说多了都是泪啊 。幸苦大家点赞、收藏、送花花，我尽快出下期讲讲暑期实习要怎么做才能拿到SSP，谢谢啦！咱们进入正题，首先我是双非本+末九硕，美团实习之前只有一段小厂实习，然后暑期去了美团从5月到8月实习了3个月，8月20多发的意向，9月下旬mt保温了一次，10月下旬hr打电话问期望薪资和手上的offer情况，10月底开的奖。开奖前我看了一圈普遍都是白菜，好一点的也只开到小sp。我觉得原因有几个：互联网本身普遍招聘就会超发一些offer的，觉得你oq或者意向不大...

黑皮白袜臭脚体育生：你开ssp了那我缺的转正开白菜怒化身团黑子这块谁给我补啊

美团求职进展汇总

点赞评论收藏

10-30 22:32

门头沟学院 Java

秋招先下手为强

如果秋招能重来，我会把“整理实习项目、改简历”当成头等大事，绝对不懒和“等准备好”拖延，早投早面早占坑！1. 实习期间“见缝插针”总结，绝不等结束后“一片空白”不用每天花几小时，哪怕午休抽10分钟、睡前翻5分钟手机备忘录，把当天做的关键事记下来，比如“用XX工具整理了300条用户数据，帮团队定位了2个问题”。别想着“等实习闲了再整”，实习哪有真的闲的时候？越拖越容易忘细节，最后写简历只能凑字数，根本没亮点。没事和mt以及其他同事多交流，早点搞明白项目，并整理好项目细节，或者“偷”他们的项目产出，搞明白了就是你的了2. 简历先出“能用版”就投，别死磕“完美版”只要实习核心项目捋顺了，哪怕简历还有...

后端转测开第一人：事实上也是靠运气找工作3分实力7分运

如果秋招能重来，我会__...

点赞评论收藏

09-28 23:07

襄阳职业技术学院网络安全

大概懂事长也有烦恼吧！！！

我以为我只有我找不到工作，没想到董事长也招不到人

站队站对牛：你别不懂事

秋招感动瞬间

点赞评论收藏

10-22 19:59

大连交通大学前端工程师

曝光学校逆天且不负责任的教学态度

这就是辽宁大连某公办本科，大四实训课讲的东西，vuejs是哪家公司开发的，是™的阿里巴巴，老师的思路是因为尤玉溪去过阿里，所以vue是阿里开发的，就这点专业水准是吧。哥们，人家尤玉溪是谷歌出来的，去阿里已经是成名后了，去做的啥？做的阿里weex（亖了）vue和阿里有锤子关系。更别提这个搞笑的学校计划三个星期零基础学完前后端，课程内容极度不负责任，对校外实习的同学也是不开绿灯，我忍了你四年，你可以讲的水，可以刁难我，你不能是非不分黑白颠倒得上课吧，这题我反驳你不对，你就只会问ai，然后嘴犟。六小龄童还说过改编不是乱编，细说不是胡说呢，你们这样上课是要谢罪的！

yuyuyudlc：这个题意义何在考这个不如靠vue的音标因为好歹证明读过文档

你找实习最大的坎坷是什么

点赞评论收藏

11-03 16:48

已编辑

百度_高级研发工程师

摸爬滚打，我也一定要离开华为

事实是检验真理的唯一标准。 无论我们怎么去说，去讲述，去证明，都抵不过一个offer来得实在，无论我们怎么去复现求职中的摸爬滚打、扒皮抽筋、狼狈不堪，都抵不过你在简历写上大厂的名字（外包不算）。 所以在我求职期间，我什么话都不说，什么话都不讲，因为没有意义，虽然我总讲过程才是意义，但只有当你上岸的那一刻，你才有资格回想在水里的挣扎，只有等你出了山，你才知道山的全貌。 我为什么一定要离开华为OD，难道它不稳定吗，不能赚钱吗。为了证明自己，那肯定有的。其实更多的是印证我的认知是否真的正确。 （给不了解我的人交代一下背景，在下双非一本，gap一年，华为OD外包，摸爬滚打4个月，艰难上岸百度正编）一、...

先锋战士：说得很真诚。鄙视链自古有之，学历，家庭背景，财富，权利。从小有之，小学羡慕那些当班委的，中学羡慕那些学生会的，高中羡慕尖子班拿教学金的，大学羡慕高绩点，毕业了羡慕进大厂的。工作了，又羡慕高职级的，再后来又羡慕别人早早结婚的。我想表达的观点很简单，无论是华为od还是百度，都是经历，没有孰高孰低，为了抵达下一个风景，总会付出更多东西，但不就是人生吗？正如登山，每个阶段的山，都要想办法攀登，在博主的文字中，见到了坚持和积极寻找问题解决办法的心态