工作坊快速入门指南

文档摘要

工作坊快速入门指南前置条件安装 Foundry Local 请参考官方安装指南： https://github.com/microsoft/Foundry-Local 安装 Python 依赖项在工作坊目录中运行：运行工作坊示例会话 01：基础聊天环境变量：会话 02：RAG 管道环境变量：会话 02：RAG 评估 (Ragas) 注意：需要通过安装额外的依赖项会话 03：基准测试环境变量：输出：包含延迟、吞吐量和首个 token 指标的 JSON 会话 04：模型比较环境变量：会话 05：多代理编排环境变量：会话 06：模型路由器测试路由逻辑，支持多种意图（代码、摘要、分类）会话 06：管道复杂的多步骤管道，包括规划、执行和优化脚本

工作坊快速入门指南

前置条件

1. 安装 Foundry Local

请参考官方安装指南：
https://github.com/microsoft/Foundry-Local


# Start Foundry Local service
foundry service start

# Load a model (phi-4-mini recommended for workshop)
foundry model run phi-4-mini

# Verify service is running
foundry service status

2. 安装 Python 依赖项

在工作坊目录中运行：


# Create virtual environment (recommended)
python -m venv .venv

# Activate virtual environment
# Windows:
.venv\Scripts\activate
# macOS/Linux:
source .venv/bin/activate

# Install requirements
pip install -r requirements.txt

运行工作坊示例

会话 01：基础聊天


cd Workshop/samples
python -m session01.chat_bootstrap "What are the benefits of local AI?"

环境变量：


set FOUNDRY_LOCAL_ALIAS=phi-4-mini
set SHOW_USAGE=1

会话 02：RAG 管道


cd Workshop/samples
python -m session02.rag_pipeline

环境变量：


set FOUNDRY_LOCAL_ALIAS=phi-4-mini
set RAG_QUESTION="Why use RAG with local inference?"
set EMBED_MODEL=sentence-transformers/all-MiniLM-L6-v2

会话 02：RAG 评估 (Ragas)


cd Workshop/samples
python -m session02.rag_eval_ragas

注意：需要通过 requirements.txt 安装额外的依赖项

会话 03：基准测试


cd Workshop/samples
python -m session03.benchmark_oss_models

环境变量：


set BENCH_MODELS=phi-4-mini,qwen2.5-0.5b
set BENCH_ROUNDS=5
set BENCH_PROMPT="Explain RAG briefly"
set BENCH_STREAM=1

输出： 包含延迟、吞吐量和首个 token 指标的 JSON

会话 04：模型比较


cd Workshop/samples
python -m session04.model_compare

环境变量：


set SLM_ALIAS=phi-4-mini
set LLM_ALIAS=qwen2.5-7b
set COMPARE_PROMPT="List 5 benefits of local AI inference"

会话 05：多代理编排


cd Workshop/samples
python -m session05.agents_orchestrator

环境变量：


set AGENT_MODEL_PRIMARY=phi-4-mini
set AGENT_MODEL_EDITOR=phi-4-mini
set AGENT_QUESTION="Explain why edge AI matters for compliance"

会话 06：模型路由器


cd Workshop/samples
python -m session06.models_router

测试路由逻辑，支持多种意图（代码、摘要、分类）

会话 06：管道


python -m session06.models_pipeline

复杂的多步骤管道，包括规划、执行和优化

脚本

导出基准测试报告


cd Workshop/scripts
python export_benchmark_markdown.py \
    --models "phi-4-mini,qwen2.5-0.5b" \
    --prompt "Explain RAG briefly" \
    --rounds 3 \
    --output benchmark_report.md

输出： Markdown 表格 + JSON 指标

检查 Markdown CLI 模式


python lint_markdown_cli.py --verbose

目的： 检测文档中已弃用的 CLI 模式

测试

烟雾测试


cd Workshop
python -m tests.smoke

测试： 核心示例的基本功能

故障排除

服务未运行


# Check status
foundry service status

# Start if not running
foundry service start

# Load a model
foundry model run phi-4-mini

模块导入错误


# Ensure virtual environment is activated
.venv\Scripts\activate  # Windows
source .venv/bin/activate  # macOS/Linux

# Reinstall dependencies
pip install -r requirements.txt

连接错误


# Check endpoint
foundry service status

# Set explicit endpoint if needed
set FOUNDRY_LOCAL_ENDPOINT=http://localhost:8000

模型未找到


# List available models
foundry model list

# Download and run a model
foundry model run phi-4-mini

环境变量参考

核心配置

变量	默认值	描述
`FOUNDRY_LOCAL_ALIAS`	可变	使用的模型别名
`FOUNDRY_LOCAL_ENDPOINT`	自动	覆盖服务端点
`SHOW_USAGE`	`0`	显示 token 使用统计
`RETRY_ON_FAIL`	`1`	启用重试逻辑
`RETRY_BACKOFF`	`1.0`	初始重试延迟（秒）

会话专用

变量	默认值	描述
`EMBED_MODEL`	`sentence-transformers/all-MiniLM-L6-v2`	嵌入模型
`RAG_QUESTION`	见示例	RAG 测试问题
`BENCH_MODELS`	可变	逗号分隔的模型
`BENCH_ROUNDS`	`3`	基准测试迭代次数
`BENCH_PROMPT`	见示例	基准测试提示
`BENCH_STREAM`	`0`	测量首个 token 延迟
`AGENT_MODEL_PRIMARY`	`phi-4-mini`	主代理模型
`AGENT_MODEL_EDITOR`	主代理	编辑代理模型
`SLM_ALIAS`	`phi-4-mini`	小型语言模型
`LLM_ALIAS`	`qwen2.5-7b`	大型语言模型
`COMPARE_PROMPT`	见示例	比较提示

SDK 文档

Foundry Local: https://github.com/microsoft/Foundry-Local
Python SDK: https://github.com/microsoft/Foundry-Local/tree/main/sdk/python/foundry_local

获取帮助

检查服务状态：foundry service status
查看日志：检查 Foundry Local 服务日志
查看 SDK 文档：https://github.com/microsoft/Foundry-Local
查看示例代码：所有示例均包含详细的文档字符串

下一步

按顺序完成所有工作坊会话
试验不同的模型
根据您的使用场景修改示例

最后更新日期：2025-01-08
工作坊版本：最新
SDK：Foundry Local Python SDK

免责声明：
本文档使用AI翻译服务Co-op Translator进行翻译。尽管我们努力确保翻译的准确性，但请注意，自动翻译可能包含错误或不准确之处。原始语言的文档应被视为权威来源。对于重要信息，建议使用专业人工翻译。我们不对因使用此翻译而产生的任何误解或误读承担责任。

工作坊快速入门指南

文档摘要

工作坊快速入门指南

前置条件

1. 安装 Foundry Local

2. 安装 Python 依赖项

运行工作坊示例

会话 01：基础聊天

会话 02：RAG 管道

会话 02：RAG 评估 (Ragas)

会话 03：基准测试

会话 04：模型比较

会话 05：多代理编排

会话 06：模型路由器

会话 06：管道

脚本

导出基准测试报告

检查 Markdown CLI 模式

测试

烟雾测试

故障排除

服务未运行

模块导入错误

连接错误

模型未找到

环境变量参考

核心配置

会话专用

推荐模型

开发与测试

生产场景

SDK 文档

获取帮助

下一步