小红书 大模型开发 一面
1、自我介绍
2、项目拷打
3、讲一下 OpenClaw 的记忆本地存储怎么设计
如果做本地记忆存储,我不会把它设计成简单的对话历史追加,而会把它拆成短期记忆、长期记忆和检索索引三层。短期记忆主要服务当前会话,用来保存最近几轮对话、当前任务状态、工具调用结果和待执行动作;长期记忆主要保存用户偏好、历史事实、任务总结和可复用经验;检索索引层则负责把长期记忆做结构化检索和语义召回。
本地存储设计时,数据模型最好不要只存一段纯文本,而是存结构化记录。比如:
memory_iduser_idsession_idmemory_typecontentsummarytagscreated_atupdated_atimportance_scoreembedding
其中短期记忆可以直接放 SQLite 或者本地 KV 存储里,便于快速读写;长期记忆除了原文和摘要,还需要保存 embedding,方便后续做向量检索。如果是单机本地场景,完全可以用 SQLite + FAISS 这种组合:SQLite 存结构化元数据,FAISS 存向量索引。
真正关键的不是“存下来”,而是“什么时候写、什么时候读、什么时候压缩”。我一般会这样设计:
- 当前轮对话先进短期记忆
- 当会话结束或者达到一定轮数后,做一次摘要压缩
- 从摘要里提取稳定事实、偏好和长期价值信息,写入长期记忆
- 检索时优先取当前会话的短期记忆,再补充长期相关记忆
- 对低价值、重复、过期的记忆做清理或降权
如果从工程上实现,一个简化版结构可以是这样:
import sqlite3
import json
import time
class LocalMemoryStore:
def __init__(self, db_path="memory.db"):
self.conn = sqlite3.connect(db_path)
self._init_table()
def _init_table(self):
cursor = self.conn.cursor()
cursor.execute("""
CREATE TABLE IF NOT EXISTS memories (
memory_id INTEGER PRIMARY KEY AUTOINCREMENT,
user_id TEXT,
session_id TEXT,
memory_type TEXT,
content TEXT,
summary TEXT,
tags TEXT,
importance_score REAL,
created_at INTEGER,
updated_at INTEGER
)
""")
self.conn.commit()
def add_memory(self, user_id, session_id, memory_type, content, summary="", tags=None, importance_score=0.5):
now = int(time.time())
cursor = self.conn.cursor()
cursor.execute("""
INSERT INTO memories (user_id, session_id, memory_type, content, summary, tags, importance_score, created_at, updated_at)
VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?)
""", (
user_id, session_id, memory_type, content, summary,
json.dumps(tags or [], ensure_ascii=False),
importance_score, now, now
))
self.conn.commit()
def get_recent_memories(self, user_id, session_id, limit=5):
cursor = self.conn.cursor()
cursor.execute("""
SELECT content, summary, tags, importance_score, created_at
FROM memories
WHERE user_id=? AND session_id=?
ORDER BY created_at DESC
LIMIT ?
""", (user_id, session_id, limit))
return cursor.fetchall()
def get_long_term_memories(self, user_id, limit=10):
cursor = self.conn.cursor()
cursor.execute("""
SELECT content, summary, tags, importance_score, created_at
FROM memories
WHERE user_id=? AND memory_type='long_term'
ORDER BY importance_score DESC, created_at DESC
LIMIT ?
""", (user_id, limit))
return cursor.fetchall()
如果再往后做,会增加记忆打分机制、摘要压缩、embedding 检索、去重与冲突合并、隐私和敏感信息过滤,这样设计出来的记忆系统才更像一个可用的 Agent Memory,而不是聊天记录堆积。
4、SDD 是什么
SDD 一般指的是 Spec-Driven Development,也就是规格驱动开发。它的核心思想不是先上来写代码,而是先把需求、输入输出、约束条件、边界行为和验收标准写清楚,再围绕这些规格去开发实现。对于大模型应用来说,SDD 很适合用在 Prompt、工具调用、结构化输出和 Agent 工作流这种容易产
剩余60%内容,订阅专栏后可继续查看/也可单篇购买
本专栏聚焦 AI-Agent 面试高频考点,内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线,提供高频题解析、标准答题思路与工程落地方法,帮助你高效查漏补缺.
查看15道真题和解析