Foundry Local SDK - 快速参考 安装 服务管理 基本使用模式 流式响应 Workshop工具(简化版) 环境变量 常见模型别名 别名 | 大小 | 最适用途 | 4B | 通用,摘要 | 3.5B | 代码,重构 | 0.5B | 快速分类 | 0.5B | 代码生成 | 2B | 创意写作 错误处理 故障排除 连接错误 模型未找到 导入错误 高级:多模型 性能优化建议 缓存客户端:重复使用 实例 批量请求:顺序处理多个提示 调整maxtokens:值越低,响应越快 预加载模型:在生产使用前下载 监控使用情况:使用 跟踪令牌 资源 GitHub: https://github.