小红书大模型开发一面

1、自我介绍

2、项目拷打

3、讲一下 OpenClaw 的记忆本地存储怎么设计

如果做本地记忆存储，我不会把它设计成简单的对话历史追加，而会把它拆成短期记忆、长期记忆和检索索引三层。短期记忆主要服务当前会话，用来保存最近几轮对话、当前任务状态、工具调用结果和待执行动作；长期记忆主要保存用户偏好、历史事实、任务总结和可复用经验；检索索引层则负责把长期记忆做结构化检索和语义召回。

本地存储设计时，数据模型最好不要只存一段纯文本，而是存结构化记录。比如：

memory_id
user_id
session_id
memory_type
content
summary
tags
created_at
updated_at
importance_score
embedding

其中短期记忆可以直接放 SQLite 或者本地 KV 存储里，便于快速读写；长期记忆除了原文和摘要，还需要保存 embedding，方便后续做向量检索。如果是单机本地场景，完全可以用 SQLite + FAISS 这种组合：SQLite 存结构化元数据，FAISS 存向量索引。

真正关键的不是“存下来”，而是“什么时候写、什么时候读、什么时候压缩”。我一般会这样设计：

当前轮对话先进短期记忆
当会话结束或者达到一定轮数后，做一次摘要压缩
从摘要里提取稳定事实、偏好和长期价值信息，写入长期记忆
检索时优先取当前会话的短期记忆，再补充长期相关记忆
对低价值、重复、过期的记忆做清理或降权

如果从工程上实现，一个简化版结构可以是这样：

import sqlite3
import json
import time

class LocalMemoryStore:
    def __init__(self, db_path="memory.db"):
        self.conn = sqlite3.connect(db_path)
        self._init_table()

    def _init_table(self):
        cursor = self.conn.cursor()
        cursor.execute("""
        CREATE TABLE IF NOT EXISTS memories (
            memory_id INTEGER PRIMARY KEY AUTOINCREMENT,
            user_id TEXT,
            session_id TEXT,
            memory_type TEXT,
            content TEXT,
            summary TEXT,
            tags TEXT,
            importance_score REAL,
            created_at INTEGER,
            updated_at INTEGER
        )
        """)
        self.conn.commit()

    def add_memory(self, user_id, session_id, memory_type, content, summary="", tags=None, importance_score=0.5):
        now = int(time.time())
        cursor = self.conn.cursor()
        cursor.execute("""
        INSERT INTO memories (user_id, session_id, memory_type, content, summary, tags, importance_score, created_at, updated_at)
        VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?)
        """, (
            user_id, session_id, memory_type, content, summary,
            json.dumps(tags or [], ensure_ascii=False),
            importance_score, now, now
        ))
        self.conn.commit()

    def get_recent_memories(self, user_id, session_id, limit=5):
        cursor = self.conn.cursor()
        cursor.execute("""
        SELECT content, summary, tags, importance_score, created_at
        FROM memories
        WHERE user_id=? AND session_id=?
        ORDER BY created_at DESC
        LIMIT ?
        """, (user_id, session_id, limit))
        return cursor.fetchall()

    def get_long_term_memories(self, user_id, limit=10):
        cursor = self.conn.cursor()
        cursor.execute("""
        SELECT content, summary, tags, importance_score, created_at
        FROM memories
        WHERE user_id=? AND memory_type='long_term'
        ORDER BY importance_score DESC, created_at DESC
        LIMIT ?
        """, (user_id, limit))
        return cursor.fetchall()

如果再往后做，会增加记忆打分机制、摘要压缩、embedding 检索、去重与冲突合并、隐私和敏感信息过滤，这样设计出来的记忆系统才更像一个可用的 Agent Memory，而不是聊天记录堆积。

4、SDD 是什么

SDD 一般指的是 Spec-Driven Development，也就是规格驱动开发。它的核心思想不是先上来写代码，而是先把需求、输入输出、约束条件、边界行为和验收标准写清楚，再围绕这些规格去开发实现。对于大模型应用来说，SDD 很适合用在 Prompt、工具调用、结构化输出和 Agent 工作流这种容易产

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

AI-Agent面试实战专栏文章被收录于专栏

本专栏聚焦 AI-Agent 面试高频考点，内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线，提供高频题解析、标准答题思路与工程落地方法，帮助你高效查漏补缺.