1. 什么是 AI 知识库?

AI 知识库通常指 RAG(Retrieval-Augmented Generation,检索增强生成) 系统。它让你把自己的文档(PDF、TXT、Markdown 等)存入向量数据库,当用户提问时:

  • 系统先检索最相关的知识片段;
  • 再让本地大模型(LLM)基于这些知识生成回答,避免“幻觉”。

优点:完全本地运行、隐私安全、无 API 费用、可自定义知识。

2. 最简单推荐方案:AnythingLLM + Ollama

(推荐新手,5-10 分钟上手)

这是目前最方便的零代码本地知识库方案,有漂亮的 Web UI,支持拖拽上传文档、聊天交互。

Ollama

Ollama 是目前最受欢迎的本地大模型运行工具,可以让你在自己的电脑上轻松下载、运行和管理开源大语言模型(LLM),完全离线使用。简单理解就是下载和管理开源大模型以及本地运行这些模型(提供聊天、API 服务)

  • 简单易用:一行命令就能运行大模型,像 Docker 一样方便。
  • 完全本地:所有模型和数据都在本地运行,隐私安全,无需联网(下载模型后)。
  • 支持多种模型:Llama 3/3.1/3.2、Qwen2/Qwen2.5、Gemma2、Mistral、Phi-3、DeepSeek、CodeLlama 等数百种开源模型。
  • 跨平台:Windows、macOS、Linux 均原生支持(Apple Silicon 优化极好)。
  • 资源占用可控:支持量化版本(4bit、8bit),可在消费级电脑(甚至无独显)上运行。
  • 开放生态:支持 Modelfile 自定义模型、工具调用(Tool Calling)、多模态(视觉模型如 Llava)。

使用场景

  • 本地 ChatGPT:直接终端聊天或通过 Web UI 使用。
  • AI 知识库 / RAG:配合 AnythingLLM、LangChain、LlamaIndex、Dify 等构建私人知识库(这是你当前最相关的应用)。
  • 开发集成:提供 OpenAI 兼容 API,可无缝替换 ChatGPT 用于本地开发、自动化脚本、Agent 等。
  • 模型微调与定制:用自己的数据创建专属模型。

AnythingLLM

AnythingLLM 是目前最受欢迎的开源本地 AI 知识库应用之一,由 Mintplex Labs 开发。它可以让你快速把自己的文档变成 AI 可以理解和回答的私人知识库。

  • 拖拽上传文档 → 自动向量化 → 构建知识库(支持 PDF、Word、TXT、Markdown、Excel 等)。
  • 基于 RAG 的智能对话:AI 回答时只会基于你上传的文档,不会乱编(大幅减少幻觉)。
  • 完全本地化:支持 Ollama、LM Studio 等本地模型,无需 OpenAI API。
  • 多工作区(Workspace):可以为不同主题创建独立的知识库(如工作、学习、项目等)。
  • Web 聊天界面:类似 ChatGPT 的对话体验。
  • 支持嵌入模型:文档向量化。
  • Agent 功能:可以调用工具、联网搜索(可选)、生成图像等。
  • 用户管理:支持多用户、权限控制。

使用场景

  • 个人知识管理(笔记、论文、书籍)
  • 公司内部文档助手
  • 学习辅助(把教材、讲义上传)
  • 代码库问答
  • 私人数据分析

步骤 1: 安装 Ollama(本地大模型运行器)

  1. 访问 Ollama 官网 下载并安装(支持 Windows / macOS / Linux)。
  2. 打开终端,执行以下命令拉取模型(推荐中小模型,适合本地):
ollama pull qwen2.5:7b          # 或 llama3.2:3b / gemma2:2b(根据你的显存选择)
ollama pull nomic-embed-text    # 嵌入模型,用于文档向量化

MacOS 版本还自带一个 chat 对话框,可以选择已安装的模型直接对话

或者输入命令行测试

ollama run qwen2.5:7b 然后输入问题试试

硬件建议:至少 8GB 内存(推荐 16GB+ + NVIDIA GPU)。CPU 也能跑,但慢一些。

步骤 2: 安装 AnythingLLM

最简单方式使用 Docker(推荐):

# 1. 安装 Docker(如果没有):官网下载或系统包管理器
# 2. 拉取并运行
docker run -d -p 3001:3001 --name anythingllm \
  -v anythingllm-data:/app/server/storage \
  mintplexlabs/anythingllm
  • 打开浏览器访问 http://localhost:3001
  • 首次进入会引导你设置管理员账号。

非 Docker 方式:从 GitHub 下载 AnythingLLM 桌面版或源码运行。

步骤 3: 配置并使用

  1. 在 AnythingLLM 设置中:
    • LLM Provider → 选择 Ollama → 模型选 qwen2.5:7b(或你下载的)。
    • Embedding Provider → 选择 Ollama → 模型选 nomic-embed-text。
  2. 创建一个 Workspace(工作区)
  3. 上传文档:拖拽你的 PDF/TXT/MD 文件(支持文件夹批量)。
  4. 等待文档向量化完成(进度条)。
  5. 切换到 Chat 界面,向 AI 提问关于你上传文档的内容。

示例:上传公司手册或学习笔记,然后问“这个文档里关于 XX 的内容是什么?”

然后就可以在当前工作区询问有关文档里面的内容了