勘误反馈
如果对本博客文章有任何问题(如探讨、建议、文字或逻辑错误等)都可以给我发邮件:
- 邮件标题:[wds博客问题反馈] - 希望在XXX文章增加一些细节的补充
- 邮件地址:8851970@qq.com
勘误反馈
如果对本博客文章有任何问题(如探讨、建议、文字或逻辑错误等)都可以给我发邮件:
当下人工智能的发展日新月异,哪怕提笔撰文的片刻间,AI也在飞速迭代。本文回望我们正身处的AI时代,站在未来视角,梳理并审视人工智能一路以来的演变与发展,所以我为这篇文章起的标题是《回忆AI时代》。
世间常有两种态度:有人因相信而看见,有人因看见而相信。于 AI 领域,我属于后者。尤其是今年,人工智能的发展速度堪称日新月异,直观感受尤为强烈。
回溯我的工作经历,早在 2016 年,我便接触并落地智能运维相关工作。彼时行业多以 “智能” 为统称,究其内核,和如今的人工智能并无本质区别,只是叫法不同。直到 ChatGPT 掀起浪潮,“AI” 才成为行业主流词汇。
技术飞速迭代的同时,智能体、Skill 等专业概念层出不穷。我虽大致知晓其用途,却对细节一知半解。为此,我计划通过本文分三大板块,系统梳理、学习 AI 知识:
1.1 AI时代重要人物、事件与里程碑
1.2 什么是智能体Agent、Agent工作模式、以及Agent框架
系列文章见: 《回忆AI时代》
智能体(Agent,也常被称为 AI Agent)是指能够自主感知环境、进行推理和规划,并采取行动以实现特定目标的计算机系统。
| Agent 核心能力 | AI Agent 工作流程示例(找一台 5000 元以内的笔记本电脑) |
|---|---|
| 🎯 Goal(目标) ↓ 👀 Perception(感知) ↓ 🧠 Reasoning(推理) ↓ ⚡ Action(行动) ↓ 💾 Memory(记忆) ↓ 📄 Output(输出) |
用户提出需求 ↓ 分析预算与需求 ↓ 搜索电商网站与评测信息 ↓ 筛选符合条件的机型 ↓ 比较配置、价格与优缺点 ↓ 生成推荐报告 ↓ 输出最终结果 |
| 大模型(LLM) | Agent |
|---|---|
| 主要负责思考和生成文本 | 负责思考 + 行动 |
| 回答问题 | 完成任务 |
| 一次性响应 | 可连续执行多个步骤 |
| 通常不能主动使用工具 | 可以调用工具和 API |
| 像顾问 | 像员工/助理 |
https://chatgpt.com/c/6a2d7d85-1128-83ec-961e-94fbd431fb7b
1 | Agent |
ReAct来源于2022年发表的论文( https://react-lm.github.io/ ),它的构建思想思考 → 行动 → 观察 → 再思考, 以下为执行过程与案例。
| ReAct流程 | 案例 |
|---|---|
| Question ↓ Thought ↓ Action ↓ Observation ↓ Thought ↓ Answer |
用户:新加坡今天会下雨吗? ↓ 思考:需要查询天气信息 ↓ 行动:调用天气 API ↓ 观察:返回降雨概率 80% ↓ 思考:降雨概率较高,今天可能下雨 ↓ 回答:今天大概率有雨,建议带伞出门 |
但它有缺点:
ReAct升级版Plan & Excute,发布与2023年。
| Plan & Excute流程 | 案例 |
|---|---|
| Goal ↓ Plan ↓ Task1 / Task2 / Task3 ↓ Execute |
* 写一篇Transformer教程 * Plan: 1. 收集资料 2. 整理结构 3. 编写内容 4. 审核 * Execute: 逐步完成 |
2023-2024,一个Agent不够,多个Agent协作方式,每个Agent专注一件事。Agent流程与案例:
| 流程 | 案例 |
|---|---|
| CEO Agent │ ├── Research Agent ├── Coding Agent │ └── Review Agent |
PM Agent ↓ Architect Agent ↓ Developer Agent ↓ Tester Agent |
2024-至今,它不需要让Agent自由思考,而是把流程固定下来,以下流程与案例:
| 流程 | 案例 |
|---|---|
| Trigger ↓ Step1 ↓ Step2 ↓ Step3 ↓ Result |
用户提问 ↓ RAG检索 ↓ 知识库 ↓ LLM总结 ↓ 返回结果 |
| 范式 | 核心思想 | 代表论文 | 作者 | 机构 |
|---|---|---|---|---|
| ReAct | 一个 Agent 思考 + 行动交替进行 | ReAct: Synergizing Reasoning and Acting in Language Models (2022) | Shunyu Yao, Jeffrey Zhao, Dian Yu, Nan Du, Izhak Shafran, Karthik Narasimhan, Yuan Cao | Princeton University / Google Research |
| Plan & Execute | 先规划,再逐步执行 | Plan-and-Solve Prompting (2023) / Plan-and-Execute 系列 | Lei Wang, Jiacheng Liu, Xiang Ren(代表论文) | University of Southern California (USC) 等 |
| Multi-Agent | 多个 Agent 分工协作 | AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation Framework (2023) | Qingyun Wu, Chi Wang, et al. | Microsoft Research |
| Multi-Agent | 多 Agent 协作模拟组织结构 | MetaGPT: Meta Programming for Multi-Agent Collaborative Framework (2023) | Hongbo Zhang, et al. | Independent / Open-source community |
| Multi-Agent | 对话式智能体社会模拟 | CAMEL: Communicative Agents for “Mind” Exploration (2023) | Guohao Li, et al. | 多机构合作 |
| AI Workflow | 用流程编排 Agent,而非自由推理 | (工程范式,无单一论文)但基础来自 Tool Use / Agent Systems | —— | 工业界(LangChain / Dify / Microsoft / n8n) |
| AI Workflow(基础研究) | 工具调用与任务分解基础 | Toolformer (2023) | Timo Schick, et al. | Meta AI |
2026主流框架地图。
1 | Agent |
以下是一些开源的框架拿来就用。
| 框架 | 工作方式 | 项目地址 | Agent特点 | 适合场景 |
|---|---|---|---|---|
| LangChain | ReAct + Tool Calling + Chain 组合执行 | https://github.com/langchain-ai/langchain | 生态最大、组件最全、支持 Tool / Memory / RAG / Agent | 快速构建通用 AI Agent、原型开发、RAG + Agent 应用 |
| LlamaIndex | 数据索引 + RAG + Query Engine + Agent | https://github.com/run-llama/llama_index | 强数据层能力,文档/数据库连接能力极强 | 企业知识库问答、数据检索型 Agent |
| Haystack | Pipeline(流水线)+ Retrieval + QA + Agent扩展 | https://github.com/deepset-ai/haystack | 工程化强、搜索系统成熟、模块清晰 | 企业搜索、问答系统、生产级 NLP Pipeline |
| AutoGen | 多Agent对话协作(Role-based conversation) | https://github.com/microsoft/autogen | 支持多角色 Agent 自动协作、自动拆解任务 | 多智能体系统、自动编程、研究型任务 |
| CrewAI | Role-based Multi-Agent Workflow(角色驱动) | https://github.com/crewAIInc/crewAI | 简单易用、结构清晰(CEO/Writer/Analyst) | 内容生产、自动化任务流、业务流程 Agent |
当然也可以自己开发一个基于ReAct的框架,以下是整理资料时看到一个网友分享的手搓基于ReAct框架。
1 | https://github.com/MarkTechStation/VideoCode/tree/main/Agent%E7%9A%84%E6%A6%82%E5%BF%B5%E3%80%81%E5%8E%9F%E7%90%86%E4%B8%8E%E6%9E%84%E5%BB%BA%E6%A8%A1%E5%BC%8F |
系列文章见: 《回忆AI时代》
| 时间 | 人物 | 重要事件 | 时代背景 | 相关论文 |
|---|---|---|---|---|
| 1943 | * 沃伦·麦卡洛克(Warren McCulloch) * 沃尔特·皮茨(Walter Pitts) |
提出人工神经元模型,被视为神经网络的起点。 | 二战期间,信号处理、自动控制、数理逻辑快速发展,学界开始尝试用数学模型模拟人脑神经活动。 | A logical calculus of the ideas immanent in nervous activity |
| 1950 | 艾伦·图灵(Alan Turing) | 发表《计算机器与智能》,提出“图灵测试”。 | 第一台通用电子计算机问世不久,计算机能力初步显现,学界开始探讨机器是否具备“智能”。 | Computing Machinery and Intelligence |
| 1956 | * 约翰·麦卡锡(John McCarthy) * 马文·明斯基(Marvin Minsky) |
达特茅斯会议正式提出“Artificial Intelligence(人工智能)”这一名称。 | 计算机、逻辑学、神经科学交叉发展,一众学者希望合力打造具备人类思维能力的机器,AI 学科正式诞生。 | (会议论文集,无单一标题) |
| 1957 | 弗兰克·罗森布拉特(Frank Rosenblatt) | 发明感知机(Perceptron),推动早期神经网络研究。 | 人工智能处于发展初期,受MP神经元模型启发,研究者尝试搭建可自主学习的简易人工神经网络。 | The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain(1958正式发表) |
| 1966 | 约瑟夫·魏泽鲍姆(Joseph Weizenbaum) | 开发聊天程序 ELIZA,展示了人机对话的潜力。 | 早期AI聚焦自然语言交互,受限于技术,仅能依靠关键词匹配实现简单对话,是人机交互的初步探索。 | ELIZA — A Computer Program For the Study of Natural Language Communication Between Man and Machine |
| 1974–1980 | —— | 第一次“AI 寒冬”,由于算力和数据不足,研究热度下降。 | 硬件算力薄弱、算法局限性凸显,早期AI无法落地复杂场景,政府与资本削减科研经费,研究陷入停滞。 | —— |
| 1980年代 | 爱德华·费根鲍姆(Edward Feigenbaum) | 专家系统兴起,AI 开始在商业领域应用。 | 学界转向实用化方向,依托行业知识库打造专用AI系统,在医疗、工业、金融等领域落地,迎来短期复苏。 | The Fifth Generation: Artificial Intelligence and Japan’s Computer Challenge to the World(1983) |
| 1986 | * 杰弗里·辛顿(Geoffrey Hinton) * 大卫·鲁梅尔哈特(David Rumelhart) |
推广反向传播算法,使多层神经网络训练成为可能。 | 单层感知机缺陷明显,多层网络难以训练,反向传播算法突破这一瓶颈,为深度网络发展打下算法基础。 | Learning representations by back-propagating errors |
| 1997 | IBM Deep Blue 团队 | “深蓝”击败国际象棋世界冠军卡斯帕罗夫,AI 首次在复杂博弈中战胜人类顶尖选手。 | 计算机硬件性能大幅提升,算力足以支撑大规模穷举搜索,AI 在规则明确的博弈领域实现重大突破。 | Deep Blue: An Artificial Intelligence Chess System |
| 2006 | 杰弗里·辛顿(Geoffrey Hinton) | 提出深度信念网络(DBN)等方法,“深度学习”概念重新兴起。 | 传统浅层机器学习遇到性能天花板,辛顿解决了深度网络训练的梯度消失问题,唤醒沉寂多年的神经网络研究。 | A Fast Learning Algorithm for Deep Belief Nets |
| 2012 | * 亚历克斯·克里热夫斯基(Alex Krizhevsky) * 杰弗里·辛顿(Geoffrey Hinton) |
AlexNet 在 ImageNet 竞赛中大幅领先,深度学习进入主流。 | 互联网积累海量图像数据,GPU 并行计算普及,深度学习在视觉任务上碾压传统算法,行业全面转向深度模型。 | ImageNet Classification with Deep Convolutional Neural Networks |
| 2014 | 伊恩·古德费洛(Ian Goodfellow) | 提出生成对抗网络(GAN),推动生成式 AI 发展。 | 判别式模型日趋成熟,学界开始探索机器“创作”能力,GAN 利用对抗思想大幅提升图像、文本生成效果。 | Generative Adversarial Nets |
| 2016 | DeepMind 团队(Demis Hassabis 等) | AlphaGo 战胜围棋冠军李世石,震动全球。 | 围棋规则复杂、组合无穷,传统搜索算法难以胜任,AlphaGo 结合深度学习与强化学习,打破大众对AI能力的认知。 | Mastering the game of Go with deep neural networks and tree search |
| 2017 | Vaswani 等 Google 研究者 | 发表《Attention Is All You Need》,提出 Transformer 架构,奠定现代大模型基础。 | 循环神经网络处理长文本效率低,注意力机制被提出,Transformer 架构适配并行计算,成为自然语言处理核心框架。 | Attention Is All You Need |
| 2018 | OpenAI 团队 | 发布 GPT,展示大规模语言模型的潜力。 | Transformer 架构成熟,互联网海量文本数据可用于预训练,大参数语言模型开始展现强大的语言理解与生成能力。 | Improving Language Understanding by Generative Pre-Training |
| 2020 | OpenAI 团队 | 发布 GPT-3,参数规模和生成能力大幅提升。 | 算力集群、大数据、预训练技术全面成熟,行业开始走向超大规模参数模型路线,通用人工智能初见雏形。 | *Language Models are Few-Shot Learners |
| 2022 | OpenAI 团队 | ChatGPT 发布,生成式 AI 进入大众视野。 | 对话优化、指令微调技术落地,大模型交互体验大幅提升,AI 从科研、产业走向普通用户。 | Training Language Models to Follow Instructions with Human Feedback(InstructGPT,ChatGPT核心技术) |
| 2023 | OpenAI、Anthropic、Google DeepMind 等 | 大模型竞赛加速,GPT-4、Claude、Gemini 等模型推动 AI 应用爆发。 | 全球科技企业争相布局通用大模型,技术快速迭代,AI 渗透办公、创作、工业、生活等全场景。 | GPT-4 Technical Report(OpenAI) Claude 2 Technical Overview(Anthropic) Gemini: A Family of Highly Capable Multimodal Models(Google) |
新加坡🇸🇬工作与生活指南: 系列文章概览
新加坡建国初期土面积约为581.5平方公里而截至今天,新加坡面积已增加到约735平方公里。新加坡从20世纪60年代开始大规模填海,以下都是通过填海扩展出来的土地:
以下照片是新加坡老巴刹食阁,1970年时与现在(2026年)的对比,远处的海现在已经是叫滨海湾。
新加坡由1个主岛和60多个离岛组成。主要岛屿包括:
全国划分为五个社区(行政区),中区社区(人口120万),东北社区(人口130万),西北社区(人口83万),东南社区(人口84万),西南社区(人口83万),由相应的社区发展理事会(简称社理会)管理。
我用的是hexo管理博客系统,所以需要一个数据统计工具,最近发现这个工具生成的页面还是挺好看的。
GoAccess 是一个轻量级的Web日志分析工具,可以直接分析:
Nginx
Apache
Caddy
HAProxy
日志并生成:
UV(独立访客)
PV(访问量)
热门页面
热门 IP
404 页面
浏览器统计
搜索来源
国家地区(GeoIP)
以我Linux系统为例,工具安装:
1
yum install goaccess
生成报告:
1 | goaccess /www/wwwlogs/blog.puppeter.com.log \ |