举几个栗子哈,比如大模型调用的聊天记录会有个变化过程,新发一条就会新增聊天记录,同时每次提问时都应该把之前的聊天记录附加上去,那么聊天记录是不是会有上限,超过上限的话怎么处理,不同用户和大模型的聊天记录如何做隔离,然后图片传输的话图片数据类型的处理,上传图片时中断了,图片过大,图片不符合格式这些情况怎么处理,返回图片时做一下优化比如图片压缩或者把图片做成文件流搞那种流式渲染,一点点的加载出图片而不是等一段时间后再直接加载出一张完整图片,然后调用大模型api的权限粒度划分和授权鉴权是如何做的,api的额度不够了加提示预警,高并发情况下如何保证大模型接口不挂掉,等等
1 5

相关推荐

点赞 评论 收藏
分享
牛客网
牛客企业服务