面试时间: 5.21技术栈: Agent、Java、Python、Node、SQL、前端面试题目1.自我介绍2.新闻数据来源、数量规模如何存储,数据库表如何设计的,存哪些字段数据来源:RSS 订阅、爬虫抓取、第三方 API(如 NewsAPI)。存储规模达百万级时采用分库分表或时序分区。表设计核心字段:id、title、content、source、publish_time、category、embedding_vector(外链向量库)、create_time。按发布时间做范围分区,热数据放近期分区加速查询。3.新闻向量数据库如何分区?文本编码方式,新闻词嵌入,如何召回,编码方式和召回方式如...