JavaBoy们不知道AI项目学什么?来看看智能问数

前言

首先要明确一个概念,市面上招聘的AI开发工程师、大模型应用开发工程师、大模型集成工程师,基本上跟底层大模型训练没啥关系,都是基于大模型做一些落地项目。

大部分同学对AI项目开发都是一片茫然,仅仅只是听到各大厂商在不断迭代自己的模型能力,仿佛大模型只能做个聊天工具。市面上真正结合AI并有业务价值的项目少之又少,大部分都是些简单的RAG项目等等。其实对于大部分程序员而言,向AI方向靠拢肯定是一个正确的规划。

AI的能力发展到现在主要的落地方向有很多,但能让JavaBoy接触到的也不多,根据当下最流行的项目。总结下来大体可以分成这几类:

1、智能助手 & 智能客服,这类项目入门最简单,含金量也最低,本质上还是基于大模型的语言处理做问答

2、AIGC人工智能生成内容,像最近比较火的sora2根据prompt生成视频、数字人、生成音乐等等

3、Text2SQL,自然语言处理,依托于大模型的能力将自然语言转换成对应数据库SQL

其他的跟我们这种非科班出身的JavaBoy关系也不大了,像什么机器人、智能代码编译器等等,感兴趣可以接触着搭个demo,想要做到有一定业务意义并能真正落地使用那基本是不可能。你写到简历上谁敢信

在上面几个技术领域里,智能助手已经有点像当年的xx学院、xx商城一样了,恨不得人手一个,AIGC相关的项目比较割裂,因为底层模型的迭代会解决大部分,真正留给业务层发挥的也不多,所以text2sql方向是一个不错的方向。

智能问数

text2sql只能当落地项目中的技术方案,大厂中一个项目必须要具备合理的业务含义才能被落地开发,我们试想,一个集团除了技术人员,谁还会写SQL,如果不写SQL怎么获取自己想看到的数据指标呢?

比如说你在某大厂的智能营销事业部里做一个年轻的JavaBoy,某天你的组长喊你跟产品去开一个需求评审会,要求你针对每日产品销售额表做一个报表页面,销售同事希望能够直观的看到月销售额、年销售额、日销售额。你一想太简单了,不就是画个页面写几个SQL的事嘛,做完okr上又能狠狠地吹一波了维护xxx报表系统。

但事情并没有那么简单,销售同事们今天突然想看近七天的销售走势了,明天想看今年的同比环比了,酷酷一顿需求单子提到你这,本来想着这么多需求那今年绩效一定很高吧,年底发现被组长评价为瞎忙活。

所以为了解决非技术人员也能写出符合需求的SQL并用图表展现出来,智能问数应运而生。核心业务价值在于让用户通过自然语言获取符合预期的数据指标并渲染为图表。可以简单的理解为AI + BI。

技术架构

依赖

版本

描述

JDK

21

Java版本

SpringBoot

3.3.4

Web项目脚手架

spring-boot-starter-webflux

3.3.4

SSE流式技术

MySQL

8.0

DB数据库 | 支持数据集类型

MyBatis Plus

3.5.7

持久化框架

ElasticSearch

7.9.3

知识库

Clickhouse

0.2.4

支持数据集类型

LangChain4J

1.0.1

大模型框架

ant-design-x-vue

1.1.2

前端ui

Vue.js

3.0

前端框架

整体看起来没啥复杂的地方吧,学完之后你就对AI开发祛魅了,核心无非就是怎么让模型稳定的输出符合预期的回答。

架构图

DataCopilotX使用前后端分离架构,前端使用Vue3 + AntDesignXVue,在学习过程中,通过前端系统直接调试后端服务,可以避免纯通过接口测试的繁琐,使得学习过程更加流畅高效。要去深入学习一个服务,最快的方式就是先把项目运行起来,然后结合服务的业务逻辑慢慢调试代码,所以大家不要因为没有接触过大模型、langchain4j等等相关组件就望而却步。只要基于SpringBoot的开发能力即可学习DataCopilotX服务。

项目地址

DataCopilotX【Gitee】

DataCopilotX【Github】

学习datacopilotx能获得什么

  1. 搭建生产级大模型应用工作流
  2. 掌握如何设计合理的COT思维链
  3. Prompt工程搭建
  4. 深入理解RAG优化与应用
  5. 掌握知识库使用与召回原理
  6. 熟练掌握LangChain4j的使用
  7. 掌握SSE协议 + webflux 流式交互技术
  8. 极致的架构设计与代码封装
  9. 企业级开发规范

DataCopilotX【Gitee】

DataCopilotX【Github】

#我的失利项目复盘##简历中的项目经历要怎么写##项目#
全部评论

相关推荐

岗位:蚂蚁数字科技-智能研发工程一面(11.24 90min):1、自我介绍2、深入讲一下你第一个项目,这个项目里面你设计的智能体的工作流程是怎么样子的?3、详细说一下里面的技术细节?跟模型的交互有哪些提示词,你是怎么设计的?这个过程中有哪些调优?4、你提到了会让模型结合提示词输出类似于json的结构,实际在和模型对接的过程中,有没有遇到模型幻觉问题,模型如果没有按照这层结构输出怎么解决?5、即使使用了few-shot也只是降低了幻觉概率,如果还是发生了,比如先输出了一段总结的话再输出json,有什么方法去兜住这种异常情况?6、有听说过上下文工程吗?你的项目里面有做一些上下文工程的优化吗?7、如果内容超出模型支持的token上限你会怎么解决?8、假如内容里面有不太友好的结构或者语句你会怎么转换变得对模型友好?9、在调用模型那些对话接口的时候,你有没有一些常用的超参数分享一下?10、温度有配置过吗?温度的高低对于模型输出会有怎么样的影响?11、详细介绍一下你的第二个项目12、有看过或者用过spring ai alibaba吗?13、看到你项目里支持对接mcp,讲一下你对mcp协议的了解14、有没有用过另外一个技术function call?讲讲mcp和function call的区别是什么?15、有了解过标准的rag请求分为哪几步吗?16、embedding之后有一个rerank步骤有了解过吗?17、讲一下你embedding所使用的模型18、展开讲一下你写的责任链与规则树的通用流程编排框架?是通过yaml或者json这种配置文件写还是java代码的形式?19、有用过langchain和langgraph吗?20、平时是怎么结合ai编程的,有用到哪些ai相关的产品?21、有用过gpt5的深度研究模式吗?这个深度研究模式跟平时的这种对话模式最大的区别是什么?22、讲一下spring框架的aop机制的原理是怎么样的,用来做一些什么功能23、多线程操作hashmap时会用到怎么样的一个类24、手撕:LRU25、反问二面(12.10 30min):1、自我介绍2、聊背景以及学校合作相关的问题3、选一个项目介绍一下,中间遇到了什么问题?你是怎么解决的?4、为什么想要做agent开发?为什么选择spring ai?5、设计一个双向链表,描述数据结构6、头指针和尾指针有什么作用?如果现在只知道一个node节点,但是不知道头尾指针,怎么把这个节点从链表里面删除?7、我现在手里有100张卡片,上面写了1-1000的整数,设计一个数据结构记录100张卡片的数字。然后随机拿走两张剩下98张卡片,用一个最快的方式找到拿走的两个卡片上的数字是什么?8、问了些个人情况(实习时间、广州人为什么来杭州之类的...)9、反问,无手撕
发面经攒人品
点赞 评论 收藏
分享
评论
2
10
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务