小红书 大模型开发 一面

1、自我介绍

2、项目拷打

3、讲一下 OpenClaw 的记忆本地存储怎么设计

如果做本地记忆存储,我不会把它设计成简单的对话历史追加,而会把它拆成短期记忆、长期记忆和检索索引三层。短期记忆主要服务当前会话,用来保存最近几轮对话、当前任务状态、工具调用结果和待执行动作;长期记忆主要保存用户偏好、历史事实、任务总结和可复用经验;检索索引层则负责把长期记忆做结构化检索和语义召回。

本地存储设计时,数据模型最好不要只存一段纯文本,而是存结构化记录。比如:

  • memory_id
  • user_id
  • session_id
  • memory_type
  • content
  • summary
  • tags
  • created_at
  • updated_at
  • importance_score
  • embedding

其中短期记忆可以直接放 SQLite 或者本地 KV 存储里,便于快速读写;长期记忆除了原文和摘要,还需要保存 embedding,方便后续做向量检索。如果是单机本地场景,完全可以用 SQLite + FAISS 这种组合:SQLite 存结构化元数据,FAISS 存向量索引。

真正关键的不是“存下来”,而是“什么时候写、什么时候读、什么时候压缩”。我一般会这样设计:

  • 当前轮对话先进短期记忆
  • 当会话结束或者达到一定轮数后,做一次摘要压缩
  • 从摘要里提取稳定事实、偏好和长期价值信息,写入长期记忆
  • 检索时优先取当前会话的短期记忆,再补充长期相关记忆
  • 对低价值、重复、过期的记忆做清理或降权

如果从工程上实现,一个简化版结构可以是这样:

import sqlite3
import json
import time

class LocalMemoryStore:
    def __init__(self, db_path="memory.db"):
        self.conn = sqlite3.connect(db_path)
        self._init_table()

    def _init_table(self):
        cursor = self.conn.cursor()
        cursor.execute("""
        CREATE TABLE IF NOT EXISTS memories (
            memory_id INTEGER PRIMARY KEY AUTOINCREMENT,
            user_id TEXT,
            session_id TEXT,
            memory_type TEXT,
            content TEXT,
            summary TEXT,
            tags TEXT,
            importance_score REAL,
            created_at INTEGER,
            updated_at INTEGER
        )
        """)
        self.conn.commit()

    def add_memory(self, user_id, session_id, memory_type, content, summary="", tags=None, importance_score=0.5):
        now = int(time.time())
        cursor = self.conn.cursor()
        cursor.execute("""
        INSERT INTO memories (user_id, session_id, memory_type, content, summary, tags, importance_score, created_at, updated_at)
        VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?)
        """, (
            user_id, session_id, memory_type, content, summary,
            json.dumps(tags or [], ensure_ascii=False),
            importance_score, now, now
        ))
        self.conn.commit()

    def get_recent_memories(self, user_id, session_id, limit=5):
        cursor = self.conn.cursor()
        cursor.execute("""
        SELECT content, summary, tags, importance_score, created_at
        FROM memories
        WHERE user_id=? AND session_id=?
        ORDER BY created_at DESC
        LIMIT ?
        """, (user_id, session_id, limit))
        return cursor.fetchall()

    def get_long_term_memories(self, user_id, limit=10):
        cursor = self.conn.cursor()
        cursor.execute("""
        SELECT content, summary, tags, importance_score, created_at
        FROM memories
        WHERE user_id=? AND memory_type='long_term'
        ORDER BY importance_score DESC, created_at DESC
        LIMIT ?
        """, (user_id, limit))
        return cursor.fetchall()

如果再往后做,会增加记忆打分机制、摘要压缩、embedding 检索、去重与冲突合并、隐私和敏感信息过滤,这样设计出来的记忆系统才更像一个可用的 Agent Memory,而不是聊天记录堆积。

4、SDD 是什么

SDD 一般指的是 Spec-Driven Development,也就是规格驱动开发。它的核心思想不是先上来写代码,而是先把需求、输入输出、约束条件、边界行为和验收标准写清楚,再围绕这些规格去开发实现。对于大模型应用来说,SDD 很适合用在 Prompt、工具调用、结构化输出和 Agent 工作流这种容易产

剩余60%内容,订阅专栏后可继续查看/也可单篇购买

AI-Agent面试实战专栏 文章被收录于专栏

本专栏聚焦 AI-Agent 面试高频考点,内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线,提供高频题解析、标准答题思路与工程落地方法,帮助你高效查漏补缺.

全部评论

相关推荐

03-17 23:54
黑龙江大学 Java
来个白菜也好啊qaq:可以的,大厂有的缺打手
点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
今天 10:38
实力求职者:真的绷不住了,第一张霸总人设,第二张求生欲拉满
点赞 评论 收藏
分享
评论
点赞
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务