文档摘要
人工智能发展史:从图灵测试到大模型时代 第一阶段:符号主义AI(1950-1980s) 诞生 1950年:图灵提出图灵测试 机器能否表现出人类无法区分的智能 1956年:达特茅斯会议 AI正式成为学科 参与者:麦卡锡、明斯基、罗切斯特、香农 早期成就 逻辑理论家(1956) 证明数学定理 第一个AI程序 ELIZA(1966) 自然语言对话 模拟心理治疗师 专家系统(1970s) MYCIN:诊断血液感染 DENDRAL:分析化学结构 局限 规则手工设计,扩展性差 缺乏学习能力 "莫拉维克悖论":高级推理容易,感知运动难 第二阶段:连接主义复兴(1980s-1990s) 神经网络 感知机(1958) 单层神经网络 证明无法解决XOR问题 反向传播(1986)
人工智能发展史:从图灵测试到大模型时代
第一阶段:符号主义AI(1950-1980s)
诞生
1950年:图灵提出图灵测试
1956年:达特茅斯会议
- AI正式成为学科
- 参与者:麦卡锡、明斯基、罗切斯特、香农
早期成就
逻辑理论家(1956)
ELIZA(1966)
专家系统(1970s)
- MYCIN:诊断血液感染
- DENDRAL:分析化学结构
局限
- 规则手工设计,扩展性差
- 缺乏学习能力
- "莫拉维克悖论":高级推理容易,感知运动难
第二阶段:连接主义复兴(1980s-1990s)
神经网络
感知机(1958)
反向传播(1986)
- Rumelhart、Hinton、Williams
- 多层神经网络训练方法
LeNet-5(1998)
支持向量机(SVM)
- Vapnik提出
- 统计学习理论
- 在分类任务上表现出色
局限
第三阶段:机器学习繁荣(2000s-2010)
深度学习突破
2006年:Hinton提出深度置信网络
2012年:AlexNet
- ImageNet竞赛冠军
- GPU加速训练
- CNN主流地位确立
2014年:GAN
- 生成对抗网络
- Goodfellow提出
- 图像生成新范式
关键技术
- ReLU激活函数:解决梯度消失
- Dropout:防止过拟合
- Batch Normalization:加速收敛
- 残差连接:ResNet架构
第四阶段:大模型时代(2017-至今)
2017年:Attention is All You Need
- Google提出Transformer
- Self-Attention机制
- 并行化训练
2018年:BERT、GPT-1
2020年:GPT-3
- 1750亿参数
- Few-shot学习能力
- API服务模式
多模态发展
2021年:CLIP、DALL-E
2022年:ChatGPT发布
2023年:GPT-4、Gemini
2024年:开源模型追赶
- Llama 3、Mistral、Qwen
- 性能接近闭源
- 成本大幅降低
中国AI发展
学术界
- 中科院自动化所:模式识别
- 清华大学:姚班、智班
- 北京大学:前沿计算研究中心
产业界
- 百度:文心大模型
- 阿里:通义千问
- 腾讯:混元大模型
- 字节:豆包、云雀
开源贡献
- 智谱AI:ChatGLM系列
- 01.AI:Yi系列
- 深度求索:DeepSeek系列
- 月之暗面:Kimi智能助手
技术趋势
模型架构
- 混合专家:MoE提升效率
- 长上下文:1M+ token窗口
- 多模态融合:原生多模态架构
训练技术
- RLHF:人类反馈强化学习
- DPO:直接偏好优化
- 课程学习:从简单到复杂
应用范式
- Agent:自主任务执行
- RAG:检索增强生成
- CoT:思维链推理
未来展望
短期(1-2年)
中期(3-5年)
- 通用人工智能(AGI)雏形
- 科学发现加速
- 人机协作新范式
长期(10年+)
挑战与风险
技术挑战
社会风险
治理需求