工作坊快速入门指南 前置条件 安装 Foundry Local 请参考官方安装指南: https://github.com/microsoft/Foundry-Local 安装 Python 依赖项 在工作坊目录中运行: 运行工作坊示例 会话 01:基础聊天 环境变量: 会话 02:RAG 管道 环境变量: 会话 02:RAG 评估 (Ragas) 注意:需要通过 安装额外的依赖项 会话 03:基准测试 环境变量: 输出: 包含延迟、吞吐量和首个 token 指标的 JSON 会话 04:模型比较 环境变量: 会话 05:多代理编排 环境变量: 会话 06:模型路由器 测试路由逻辑,支持多种意图(代码、摘要、分类) 会话 06:管道 复杂的多步骤管道,包括规划、执行和优化 脚本
请参考官方安装指南:
https://github.com/microsoft/Foundry-Local
# Start Foundry Local service foundry service start # Load a model (phi-4-mini recommended for workshop) foundry model run phi-4-mini # Verify service is running foundry service status
在工作坊目录中运行:
# Create virtual environment (recommended) python -m venv .venv # Activate virtual environment # Windows: .venv\Scripts\activate # macOS/Linux: source .venv/bin/activate # Install requirements pip install -r requirements.txt
cd Workshop/samples python -m session01.chat_bootstrap "What are the benefits of local AI?"
环境变量:
set FOUNDRY_LOCAL_ALIAS=phi-4-mini set SHOW_USAGE=1
cd Workshop/samples python -m session02.rag_pipeline
环境变量:
set FOUNDRY_LOCAL_ALIAS=phi-4-mini set RAG_QUESTION="Why use RAG with local inference?" set EMBED_MODEL=sentence-transformers/all-MiniLM-L6-v2
cd Workshop/samples python -m session02.rag_eval_ragas
注意:需要通过 requirements.txt 安装额外的依赖项
cd Workshop/samples python -m session03.benchmark_oss_models
环境变量:
set BENCH_MODELS=phi-4-mini,qwen2.5-0.5b set BENCH_ROUNDS=5 set BENCH_PROMPT="Explain RAG briefly" set BENCH_STREAM=1
输出: 包含延迟、吞吐量和首个 token 指标的 JSON
cd Workshop/samples python -m session04.model_compare
环境变量:
set SLM_ALIAS=phi-4-mini set LLM_ALIAS=qwen2.5-7b set COMPARE_PROMPT="List 5 benefits of local AI inference"
cd Workshop/samples python -m session05.agents_orchestrator
环境变量:
set AGENT_MODEL_PRIMARY=phi-4-mini set AGENT_MODEL_EDITOR=phi-4-mini set AGENT_QUESTION="Explain why edge AI matters for compliance"
cd Workshop/samples python -m session06.models_router
测试路由逻辑,支持多种意图(代码、摘要、分类)
python -m session06.models_pipeline
复杂的多步骤管道,包括规划、执行和优化
cd Workshop/scripts python export_benchmark_markdown.py \ --models "phi-4-mini,qwen2.5-0.5b" \ --prompt "Explain RAG briefly" \ --rounds 3 \ --output benchmark_report.md
输出: Markdown 表格 + JSON 指标
python lint_markdown_cli.py --verbose
目的: 检测文档中已弃用的 CLI 模式
cd Workshop python -m tests.smoke
测试: 核心示例的基本功能
# Check status foundry service status # Start if not running foundry service start # Load a model foundry model run phi-4-mini
# Ensure virtual environment is activated .venv\Scripts\activate # Windows source .venv/bin/activate # macOS/Linux # Reinstall dependencies pip install -r requirements.txt
# Check endpoint foundry service status # Set explicit endpoint if needed set FOUNDRY_LOCAL_ENDPOINT=http://localhost:8000
# List available models foundry model list # Download and run a model foundry model run phi-4-mini
| 变量 | 默认值 | 描述 |
|---|---|---|
FOUNDRY_LOCAL_ALIAS |
可变 | 使用的模型别名 |
FOUNDRY_LOCAL_ENDPOINT |
自动 | 覆盖服务端点 |
SHOW_USAGE |
0 |
显示 token 使用统计 |
RETRY_ON_FAIL |
1 |
启用重试逻辑 |
RETRY_BACKOFF |
1.0 |
初始重试延迟(秒) |
| 变量 | 默认值 | 描述 |
|---|---|---|
EMBED_MODEL |
sentence-transformers/all-MiniLM-L6-v2 |
嵌入模型 |
RAG_QUESTION |
见示例 | RAG 测试问题 |
BENCH_MODELS |
可变 | 逗号分隔的模型 |
BENCH_ROUNDS |
3 |
基准测试迭代次数 |
BENCH_PROMPT |
见示例 | 基准测试提示 |
BENCH_STREAM |
0 |
测量首个 token 延迟 |
AGENT_MODEL_PRIMARY |
phi-4-mini |
主代理模型 |
AGENT_MODEL_EDITOR |
主代理 | 编辑代理模型 |
SLM_ALIAS |
phi-4-mini |
小型语言模型 |
LLM_ALIAS |
qwen2.5-7b |
大型语言模型 |
COMPARE_PROMPT |
见示例 | 比较提示 |
foundry service status最后更新日期:2025-01-08
工作坊版本:最新
SDK:Foundry Local Python SDK
免责声明:
本文档使用AI翻译服务Co-op Translator进行翻译。尽管我们努力确保翻译的准确性,但请注意,自动翻译可能包含错误或不准确之处。原始语言的文档应被视为权威来源。对于重要信息,建议使用专业人工翻译。我们不对因使用此翻译而产生的任何误解或误读承担责任。