置顶

勘误反馈
如果对本博客文章有任何问题(如探讨、建议、文字或逻辑错误等)都可以给我发邮件:

  • 邮件标题:[wds博客问题反馈] - 希望在XXX文章增加一些细节的补充
  • 邮件地址:8851970@qq.com

Read More

1956年人工智能诞生的那个夏天!

系列文章见: 《回忆AI时代-从图灵机到Agent》

达特茅斯会议

1956年夏天,在美国达特茅斯学院,一群科学家首次提出“Artificial Intelligence(人工智能)”这一名称,开启了AI时代的序幕。会议由 John McCarthy、Marvin Minsky、Claude Shannon 和 Nathaniel Rochester 发起,被视为人工智能学科的起点。2006年,在达特茅斯会议50周年纪念活动上,AI先驱们再次相聚。

照片拍摄于美国达特茅斯学院草坪(1956年) ,2006年达特茅斯AI会议50周年纪念合影(2026)。
达特茅斯50年再聚首

1956年达特茅斯会议照片,这7为科学家从上到下依次是:

  • 1.奥利弗・塞尔弗里奇 (Oliver Selfridge): 模式识别、机器感知领域先驱,被称作 “机器感知之父”,早期视觉 AI研究者。
  • 2.纳撒尼尔・罗切斯特 (Nathaniel Rochester) IBM资深研究员,达特茅斯会议四位发起人之一,最早研究人工神经网络的学者。
  • 3.马文・明斯基( Marvin Minsky ) AI 奠基人,MIT人工智能实验室联合创始人,1969 年图灵奖得主,框架理论创立者。
  • 4.约翰・麦卡锡( John McCarthy ) “人工智能(Artificial Intelligence)” 术语的创造者Lisp编程语言发明者,1971年图灵奖得主。
  • 5.雷・所罗门诺夫( Ray Solomonoff ) 通用人工智能、算法信息论先驱,提出所罗门诺夫归纳推理,奠定概率机器学习理论基础。
  • 6.赫伯特・西蒙 ( Herbert A. Simon ) 双料诺奖(诺贝尔经济学奖 + 图灵奖)得主,认知科学、符号主义 AI 核心奠基人,研究人类决策与机器逻辑推理。
  • 7.克劳德・香农 (Claude Elwood Shannon) 信息论之父,数字电路理论开创者,现代计算机、通信、信息科学的基石人物。

会议背景

20世纪50年代,计算机、逻辑学、神经科学、控制论初步发展:

  • 图灵1950年发表《计算机器与智能》并提出图灵测试;
  • 香农创立信息论;
  • 神经网络、博弈程序、逻辑推理程序已有雏形;

一批学者认为:机器可以模拟人类智能,于是组织本次研讨。

会议的结论

在会议最后他们并没有解决什么问题,而是定义了问题的边界与方向:

  • 计算机模拟人类思考、逻辑推理
  • 机器使用语言、自然语言理解
  • 神经网络(神经元网络模型)
  • 机器自我学习、自适应
  • 博弈、规划、决策
  • 抽象概念、人类创造力模拟

人工智能进入了人工智能第一阶段“规则时代”。

什么是大模型?它是如何工作的,应用场景又是什么?

系列文章见: 《回忆AI时代-从图灵机到Agent》

什么是大模型

大模型(Large Model)通常指参数量非常庞大的人工智能模型,它就像一个经过海量知识训练的“数字大脑”,能够理解、推理、生成内容,并完成各种复杂任务。而LLM(Large Language Model,大语言模型) 是大模型中的一种。那大模型中什么叫“大”

  • 参数量大
  • 训练数据大
  • 计算规模大

参数量

模型/阶段 参数量
早期神经网络 几万 ~ 几百万
BERT 3.4 亿(340M)
GPT-3 1750 亿(175B)
现代大模型 数百亿 ~ 数万亿

训练数据大
大模型训练时会阅读海量数据,例如:

  • 书籍
  • 论文
  • 网站
  • 代码
  • 新闻
  • 对话数据

训练数据规模通常达到TB甚至PB级别。

计算规模大
训练一次先进大模型可能需要:

  • 数千张 GPU
  • 数周甚至数月训练时间
  • 数百万美元成本

大模型是怎么工作的

目前主流大模型基本基于:Transformer 架构(2017年提出)

1
2
3
4
5
6
7
8
9
10
11
12
13
海量数据

预训练(Pretraining)

获得语言能力

指令微调(SFT)

学会听懂人类指令

强化学习(RLHF)

更符合人类需求

大模型应用场景

大模型应用场景:

  • 文本能力
  • 推理能力
  • 多模态能力
文本能力 推理能力 多模态能力
* 写文章
* 写代码
* 翻译
* 总结
* 问答
* 鸡兔同笼
* 数学题
* 逻辑题
* 图片
* 语音
* 视频

MCP在Agent的作用是什么?

系列文章见: 《回忆AI时代-从图灵机到Agent》

什么是MCP

MCP(Model Context Protocol,模型上下文协议),这是由Anthropic在2024年11月推出的一个开放协议,用来让 AI 模型能够以统一方式连接外部工具、类似AI Agent世界里的USB-C接口,它可以统一连接:

  • 数据库
  • 文件系统
  • GitHub
  • Slack
  • Notion
  • 浏览器
  • 企业内部系统
  • 各种 API

在MCP未出现之前:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
Claude
├── GitHub Tool
├── Notion Tool
├── Slack Tool

GPT
├── GitHub Tool
├── Notion Tool
├── Slack Tool

Gemini
├── GitHub Tool
├── Notion Tool
├── Slack Tool

有了MCP之后

1
2
3
4
5
6
7
8
9
   MCP Server
/ | \
GitHub Notion Slack
\ | /
MCP
|
----------------
| | |
Claude GPT Gemini

Read More

Skill在Agent中的作用是什么?

系列文章见: 《回忆AI时代-从图灵机到Agent》

什么是Skill

2025年10月16日(October 16, 2025),Anthropic当天发布了技术文章《Equipping agents for the real world with Agent Skills》首次公开介绍 Agent Skills、SKILL.md 结构以及动态加载机制。

Skill是一种把知识、流程、代码和资源打包成可复用能力模块的机制,让Agent遇到特定任务时能够直接加载并执行,而不是每次都重新推理。

以下是传统Agent工作方式与有了skill工作方式:

传统 Agent 工作方式 Skill 工作方式
用户任务

LLM 思考

调用工具

继续思考

完成任务
用户任务

发现 SEO Skill

加载 Skill

执行预定义流程

完成任务

Skill在Agent中位置

1
2
3
4
5
6
7
8
9
               Agent

┌───────────┼───────────┐
│ │ │
▼ ▼ ▼
SEO Skill Coding Skill Research Skill
│ │ │
▼ ▼ ▼
Tools Tools Tools
  • Agent 负责选 Skill
  • Skill 负责完成任务
  • Tool 负责执行动作

Read More

机器可以思考吗?图灵用一篇论文开启AI时代

系列文章见: 《回忆AI时代-从图灵机到Agent》

图灵简介

阿兰·麦席森·图灵(Alan Mathison Turing)1912年6月23日-1954年6月7日, 英国数学家、计算机科学家、逻辑学家和密码分析学家,被誉为计算机科学与人工智能之父。

阿兰图灵

重要论文

计算机的鼻祖-图灵机

1935年,发表了《On Computable Numbers》(中文译 “论可计算数”)这是图灵最著名的论文,被许多人认为是计算机科学的开山之作。图灵在剑桥大学国王学院(King’s College Cambridge)时思考一个非常简单的问题,当一个人在纸上进行计算时,他究竟在做什么?图灵没有从数学公式出发,而是从人的行为出发,他观察到计算员(Computer,当时指人工计算员)实际上是在:

1
2
3
4
读取一个符号
根据规则决定下一步
写入一个符号
移动到下一格

于是图灵想到,如果把这种行为抽象出来,会得到一种最简单的计算机器,这就是后来著名的图灵机(Turing Machine)。
注:它并不是一台真实存在的机器,而是一种用于研究“什么问题能够被计算”的数学模型。

图灵机结构示意图
图灵机结构示意图

之所以说图灵机重要,今天所有的计算机,本质上都是图灵机思想的工程实现。

图灵机 现代计算机
状态机 CPU
纸袋 内存
读写头 CPU访问内存
状态转移表 程序

开启AI时代的论文-计算机器与智能

1950年,发标了经典论文《Computing Machinery and Intelligence》(中文译 “计算机器与智能”),提出著名问题:

1
2
3
Can machines think?

(机器能够思考吗?)

论文脑图
计算机器与智能论文脑图

论文内容:首先需要界定 “机器” 与 “思考” 这两个词汇的含义。我们固然可以按照日常用语习惯来拟定定义,但这种做法存在隐患。倘若单纯依据大众的惯用方式解读词义,那么想要解答 “机器能否思考”,最终恐怕只能依靠盖洛普民意调查这类统计手段,而这显然是荒谬的。于是他设计了Turing Test ,如果一个人与机器对话时“无法区分对方是人还是机器”,则认为机器具备类似人类的智能。

图灵绝不会想到,当年那个关于“机器能否思考”的大胆设问,如今不仅被证明是可能的,而且人工智能展现出的能力,已经远远超出了他那个时代对于机器智能的想象边界。

重要贡献

挽救了数千万人
1939年,第二次世界大战期间,图灵加入了英国密码破译中心Bletchley Park,德国军方使用Enigma(恩尼格玛密码机)进行通信加密,图灵设计改进了Bombe(炸弹机)用于快速破解密码获取德军的实时情报信息。图灵团队大幅缩短了战争时间,间接挽救了数千万人的生命。

图灵设计的炸弹机。
炸弹机

后记

1952年,英国法律仍将同性恋定为犯罪。图灵因同性恋身份被起诉。法院给出两个选择:

  • 入狱
  • 激素治疗(化学阉割)

图灵选择后者。1954年6月7日,图灵在家中去世,年仅42岁。官方结论为氰化物中毒导致死亡,通常被认定为自杀,但也有学者提出其他可能解释。

1966年,图灵奖(Turing Award)设立。它由 Association for Computing Machinery(ACM,美国计算机协会)设立,以纪念英国数学家和计算机科学先驱 Alan Turing。自 1966 年创立以来,图灵奖一直授予对计算机科学领域做出持久且重大技术贡献的科学家,被誉为“计算机界的诺贝尔奖”

2009年,时任英国首相 Gordon Brown 代表英国政府正式向图灵及其他因同性恋身份而遭受不公待遇的人士道歉;

2013年, 英国女皇伊丽莎白二世追授Alan Turing皇家特赦(Royal Pardon),撤销其历史定罪;

2017年,英国正式实施被广泛称为“Turing Law”(图灵法案)的法律,为数以万计因历史同性恋法律而被定罪的人平反。

2021年,英格兰银行(Bank of England)将图灵正式印在50英镑的纸币上。这张50英镑钞票的设计还包含了图灵的签名、公式与计算图纸和图灵机等。

50英镑钞票

扩展阅读 & 参考

  • 《模仿游戏》是一部2014年英美合拍的历史剧情片。讲述英国数学家、逻辑学家、密码分析学家和计算机科学家艾伦·图灵在二战中帮助盟军破译纳粹德国的军事密码的真实故事。
  • AI之父,二战中拯救1400万人:https://www.youtube.com/watch?v=IPA2bfLGmMM

回忆AI时代-从图灵到Agent

当下人工智能的发展日新月异,哪怕提笔撰文的片刻间,AI也在飞速迭代。本文回望我们正身处的AI时代,站在未来视角,梳理并审视人工智能一路以来的演变与发展,所以我为这篇文章起的标题是《回忆AI时代-从图灵机到Agent》。

世间常有两种态度:有人因相信而看见,有人因看见而相信,于AI领域,我属于后者。尤其是今年,人工智能的发展速度堪称日新月异,直观感受尤为强烈。

回溯我的工作经历,早在2016年我便接触并落地智能运维相关工作。彼时行业多以 “智能” 为统称如智能运维、智能监控,究其内核和如今的人工智能并无本质区别,只是叫法不同。直到ChatGPT掀起浪潮“AI” 才成为行业主流词汇。

技术飞速迭代的同时,智能体、Skill 等专业概念层出不穷。我虽大致知晓其用途,却对细节一知半解,为此,我计划通过本文分三大板块,系统梳理、学习 AI 知识:

  • 第一,梳理AI的发展脉络,回顾行业关键节点、代表人物与重大事件;
  • 第二,拆解AI产业链上下游,研判行业发展趋势,探索如何用好、驾驭 AI;
  • 第三,深入解析当下主流 AI 架构与运行模式,尝试动手搭建模型,吃透底层工作原理。

一 AI的发展脉络

1.1 AI时代重要人物、事件与里程碑
1.2 机器可以思考吗?图灵用一篇论文开启 AI 时代
1.3 1956年人工智能诞生的那个夏天!

二 拆解AI产业链上下游,研判行业发展趋势

2.1 未来AI时代,什么是变化的什么又是不变的?

三 深入解析当下主流 AI 架构与运行模式

3.1 什么是大模型?它是如何工作的,应用场景又是什么?
3.2 什么是智能体Agent、Agent工作模式、以及Agent框架
3.3 Skill在Agent中的作用是什么?
3.4 MCP在Agent中的作用是什么?