1.1 LightRAG基础概念 本节导读:掌握LightRAG的核心定义、技术特点与架构优势,理解其与传RAG的关键区别,为后续章节学习奠定基础 学习目标 理解LightRAG的基本概念和技术定位 掌握LightRAG的核心架构设计理念 了解LightRAG与其他RAG框架的主要区别 明确LightRAG的适用场景和局限性 核心概念 LightRAG的定义 LightRAG(Light Retrieval-Augmented Generation)是由香港大学数据科学实验室(HKUDS)开发的轻量级检索增强生成框架,发表于EMNLP 2025。其核心创新在于图+向量双层检索架构,通过结合知识图谱的语义丰富性和向量检索的语义相似性,实现更精准、高效的问答系统。
本节导读:掌握LightRAG的核心定义、技术特点与架构优势,理解其与传RAG的关键区别,为后续章节学习奠定基础
LightRAG(Light Retrieval-Augmented Generation)是由香港大学数据科学实验室(HKUDS)开发的轻量级检索增强生成框架,发表于EMNLP 2025。其核心创新在于图+向量双层检索架构,通过结合知识图谱的语义丰富性和向量检索的语义相似性,实现更精准、高效的问答系统。
# 克隆官方仓库 git clone https://github.com/HKUDS/LightRAG.git cd LightRAG # 安装依赖 pip install -e . # 创建项目目录 mkdir my_lightrag_project cd my_lightrag_project
# config.yaml lightrag_config: chunk_token_size: 512 chunk_overlap_token_size: 50 retrieve_k: 4 top_k: 5 llm_config: model_name: "gpt-3.5-turbo" temperature: 0.7 embeddings: model_name: "text-embedding-ada-002" storage: type: "chroma" path: "./chroma_db"
from lightrag import LightRAG from lightrag.llm import gpt_4o_complete from lightrag.utils import EmbeddingFunc # 初始化RAG系统 rag = LightRAG( llm_model_func=gpt_4o_complete, embedding_func=EmbeddingFunc, chunk_token_size=512, retrieve_k=4, top_k=5 ) # 导入文档 with open("your_document.txt", "r", encoding="utf-8") as f: docs = [f.read()] # 构建知识库 await rag.ainsert(docs) # 执行查询 result = await rag.aquery("What is LightRAG?") print(result)
import asyncio from lightrag import LightRAG from lightrag.llm import gpt_4o_complete from lightrag.utils import EmbeddingFunc async def main(): # 初始化LightRAG rag = LightRAG( llm_model_func=gpt_4o_complete, embedding_func=EmbeddingFunc, chunk_token_size=512, retrieve_k=4, top_k=5 ) # 模拟文档数据 documents = [ "LightRAG是一种轻量级检索增强生成框架,结合了图检索和向量检索两种方式。", "知识图谱是LightRAG的核心组件,能够表示实体之间的语义关系。", "向量检索通过文本向量化实现语义相似度的快速计算。" ] # 构建知识库 await rag.ainsert(documents) # 执行查询 query = "LightRAG有什么特点?" result = await rag.aquery(query) print(f"查询: {query}") print(f"答案: {result}") if __name__ == "__main__": asyncio.run(main())
A:LightRAG的主要区别在于其双层检索架构:
A:LightRAG采用轻量级设计,具有以下成本优势:
A:LightRAG支持多种数据类型:
本节系统介绍了LightRAG的基础概念,包括其定义、核心架构和技术特点。与传统RAG系统相比,LightRAG通过图+向量双层检索架构实现了更精准的知识问答,同时保持了轻量级的设计理念。掌握这些基础概念有助于后续章节对LightRAG深入理解。
下一节将详细介绍检索技术的对比分析,帮助读者更好地理解LightRAG的技术优势。
关键词:LightRAG, 检索增强生成, 图检索, 向量检索, 知识图谱, 轻量级框架
难度:入门
预计阅读:30分钟