极光-aigc算法-一面

很短,半个小时,没手撕和八股

自我介绍,问了一下毕业时间和学校情况

主要是围着项目问的
项目1:
你们用的开源数据集,数据可信度有没有考虑过?
项目2:
数据集是经过什么处理存到向量数据库的?
介绍一下rag一些rerank算法
rag效果怎么评估的?最终输出效果怎么评估的?
(猜测提问逻辑是根据rag的链路来的。即“数据清洗 -> Chunking(分片策略)-> Embedding -> 向量检索 -> Rerank(重排序)-> 生成”)
项目3:
现在近似最近邻算法都比较成熟的吧,你们是从算法还是应用上做优化?为什么还要做呢,这些技术不都很好了吗?(翻译:项目背景是什么,优化点在哪里)
你是搜索做了加速,那有没有考虑过预处理成本,有没有去衡量评估过?

反问
问了一下业务,toB的,有一些知识图谱和一些ai方法的应用(?)听起来主要是在探索和迁移新技术
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务