万字长文丨论人工智能的前世今生

admin 2025年1月7日15:47:28评论4 views字数 19064阅读63分32秒阅读模式

免责声明:本公众号所使用的图片部分来自网络,版权属于原作者。我们已尽力对图片进行来源标注,如有疏漏,请及时与我们联系。本公众号不对图片的版权问题承担任何责任。

万字长文丨论人工智能的前世今生

图片来源:https://aitntnews.com/newDetail.html?newId=7759

人工智能(AI)是当今科技领域的核心热点之一,事实上,人类对“智能化”的追求并非始于现代。早在几千年前,古代文明便已开始探索如何让机械装置“动起来”、“聪明起来”。从中国古代的自动装置到17世纪的机械哲学,再到现代人工智能的崛起,这是一段跨越千年的智慧追寻之旅。

1

从自动化到智能化:人类对机械智慧的探索

在古希腊和古中国等古代文明中,人类就开始尝试创造各种自动装置,如自动门、自动玩具等。这些机械装置虽然简单,但展现了人类对自动化和智能化的最初追求。

指南车:古代的“自动导航”系统

指南车是中国古代的一种机械装置,用于指示方向。无论车子如何转向,车上的木人手臂始终指向南方。这一功能的实现依赖于车内的齿轮系统。当车子转弯时,齿轮会自动补偿转向的偏差,确保木人始终指向南方。

万字长文丨论人工智能的前世今生

图片来源:http://www.360doc.com/content/16/0117/16/1204156_528624374.shtml

铜壶滴漏:古代的“自动计时器”

铜壶滴漏是中国古代的一种计时装置,通过水滴的流动来测量时间。其设计极为巧妙:上壶滴水至下壶,水位的变化推动浮箭上升,从而显示时间。为了保持水流的稳定,工匠们设计了多级水壶系统,确保水位恒定。

万字长文丨论人工智能的前世今生

图片来源:http://www.360doc.com/content/16/0117/16/1204156_528624374.shtml

这些早期的发明为后来的机器智能研究提供了灵感。

万字长文丨论人工智能的前世今生

17世纪的机械哲学:理性思维的机械化

17世纪,科学家笛卡尔和哲学家霍布斯提出了“机械哲学”的思想。他们认为,自然界和人类行为都可以通过机械原理来解释。如果人类的身体和思维过程可以被理解为一系列机械操作,那么理论上就有可能用机器来模拟这些过程。

万字长文丨论人工智能的前世今生

图片来源:https://www.wikiwand.com/zh/articles/%E8%BF%98%E5%8E%9F%E8%AE%BA

18世纪:自动机

18世纪的欧洲,工匠们制造了许多复杂的自动机,例如能够写字的机械人偶。这些装置虽然没有真正的智能,但它们展示了机械装置模拟人类行为的探索。

万字长文丨论人工智能的前世今生

图片来源:https://commons.wikimedia.org/wiki/File:Euphonia-Joseph-Faber-1870.jpg

19世纪初期:逻辑机器

19世纪,数学家查尔斯·巴贝奇设计了“分析机”,这是第一台具有通用计算能力的机械装置。虽然它并未真正建成,但它的设计理念为现代计算机奠定了基础。

万字长文丨论人工智能的前世今生

图片来源:https://m.baike.com/wikiid/1254251540901377979

这种将世界视为"精密机器"的观点,为后来的人工智能研究提供了重要的哲学基础。这一思想直接影响了后来的计算机科学和人工智能研究。

万字长文丨论人工智能的前世今生

19世纪中期:乔治·布尔与符号逻辑

乔治·布尔(George Boole)在1847年出版的《思维法则》(The Laws of Thought)一书中,第一次用符号语言描述了思维的基本法则,真正使逻辑代数化。

万字长文丨论人工智能的前世今生

图片来源:https://www.ee.cityu.edu.hk/~gchen/pdf/Boole.pdf

布尔的符号逻辑为后来的计算机科学和人工智能研究提供了重要的理论基础。

万字长文丨论人工智能的前世今生

2

人工智能的萌芽:从神经元模型到“图灵测试”(1940s-1950s)

在古代自动装置和机械哲学的基础上,人工智能的思想逐渐萌芽。随着电子计算机的发明,人类终于拥有了模拟思维过程的工具。

1943年:人工神经元模型的诞生

1943年,沃伦·麦卡洛克(Warren McCulloch)和沃尔特·皮茨(Walter Pitts)发表了一篇划时代的论文,提出了第一个人工神经元模型。这一模型试图用数学和逻辑来模拟人脑神经元的工作方式,麦卡洛克和皮茨的模型虽然远不及今天的深度学习网络复杂,但它的核心思想却极具前瞻性:通过简单的“开关”机制(类似于神经元的激活与抑制),可以实现逻辑运算。

这一突破让人们开始畅想,机器是否也能像人类一样“思考”。尽管当时的计算机还处于“婴儿期”,但这项研究无疑点燃了科学家们对人工智能的最初热情。可以说,这一模型是人工智能的“胚胎”,它让科学家们第一次意识到,或许可以用机器来模仿人类的思维。

万字长文丨论人工智能的前世今生

图片来源:https://blog.csdn.net/kebu12345678/article/details/54915719

然而,人工神经元模型的提出仅是理论上的突破,要将这一思想付诸实践,还需要计算机硬件的支持。1945年,冯·诺依曼提出的存储程序计算机架构,为人工智能的实现奠定了技术基础。

1945年:冯·诺依曼结构奠定现代计算机基础

1945年,著名数学家约翰·冯·诺依曼(John von Neumann)在一份名为《第一草案》(First Draft of a Report on the EDVAC)的报告中提出了一种全新的计算机设计理念——冯·诺依曼结构。这一设计奠定了现代计算机的基本框架,被认为是计算机科学史上的里程碑。

万字长文丨论人工智能的前世今生

图片来源:https://cloud.tencent.com/developer/article/1841307

硬件架构逐步完善的同时,科学家们开始探索如何让机器具备学习能力。1949年,赫布学习规则的提出,为人工智能的学习机制提供了重要的生物学启发。

1949年:赫布学习规则——“用进废退”的智慧启示

1949年,加拿大心理学家唐纳德·赫布(Donald Hebb)在他的著作《行为的组织》(The Organization of Behavior)中提出了赫布学习规则(Hebbian Learning)。这条规则简单却深刻:“神经元之间的连接强度会随着它们的共同激活而增强。”换句话说,“用进废退”不仅适用于肌肉训练,也适用于大脑的学习机制。

万字长文丨论人工智能的前世今生

图片来源:https://slideplayer.com/slide/15060066/

赫布的理论为人工神经网络的学习算法提供了生物学启发,这一思想后来被用来设计神经网络的学习机制,即通过“经验”来学习,成为机器学习的早期灵感来源。

随着理论和技术的不断推进,人工智能领域开始面临一个更深刻的哲学问题:机器是否能够真正“思考”?1950年,阿兰·图灵通过“图灵测试”尝试回答这一问题,为人工智能设定了明确的目标。

万字长文丨论人工智能的前世今生

1950年:图灵测试——机器能思考吗?

1950年,计算机科学的先驱阿兰·图灵(Alan Turing)在他的论文《计算机器与智能》(Computing Machinery and Intelligence)中提出了一个大胆的问题:“机器能思考吗?”为了回答这个问题,图灵设计了一项实验,后来被称为“图灵测试”。图灵测试的核心思想是:如果一台机器能够通过文字对话让人类无法分辨它是机器还是人类,那么我们就可以认为这台机器具有智能。

图灵的设想在当时堪称“科幻”。要知道,那时的计算机还只能进行简单的数学运算,距离能够与人类对话的智能系统相去甚远。然而,图灵的思想却为人工智能领域提供了一个明确的目标:让机器能够像人类一样交流、推理和学习。

万字长文丨论人工智能的前世今生

图片来源:https://voi.id/zh/teknologi/393004

今天,图灵测试仍然是人工智能领域的重要哲学问题。尽管像ChatGPT这样的语言模型已经能够通过对话迷惑许多人,但是否真正“思考”仍然是一个悬而未决的问题。图灵的远见卓识让他成为人工智能领域的“预言家”。

1956年:达特茅斯会议——人工智能学科的诞生

1956年夏天,一场改变历史的会议在美国新罕布什尔州的达特茅斯学院召开。这场会议由约翰·麦卡锡(John McCarthy)、马文·明斯基(Marvin Minsky)、克劳德·香农(Claude Shannon)和纳撒尼尔·罗切斯特(Nathaniel Rochester)等科学家组织,旨在探讨如何让机器具备人类的智能。在这次会议上,约翰·麦卡锡首次提出了“人工智能”(Artificial Intelligence, AI)这一术语,并大胆设想,机器可以像人类一样“思考”和“学习”。

万字长文丨论人工智能的前世今生

图片来源:https://www.researchgate.net/figure/Museum-of-Comparative-Zoology-field-party-at-Crystal-Cliffs-Nova-Scotia-August-1956_fig3_275986525

这场会议不仅确立了人工智能作为一个独立学科的地位,也为未来几十年的研究方向奠定了基础。会议期间,科学家们讨论了如何让机器进行推理、学习和解决问题,并提出了许多开创性的想法。例如,如何用逻辑和数学来模拟人类的思维过程,如何让机器通过经验改进自己的能力等。尽管当时的技术水平还不足以实现这些目标,但这次会议无疑是人工智能历史上的一个里程碑。

总结

人工智能的发展并非孤立的事件,而是多学科交叉推动的结果。人工神经元模型为模拟人类思维奠定了数学和逻辑基础,冯·诺依曼结构则为这些理论的实现提供了硬件支持。与此同时,赫布学习规则从生物学角度启发了机器学习的早期算法设计,而图灵测试则为人工智能设定了明确的哲学目标。这些理论、技术和思想的相互作用,共同构成了人工智能萌芽阶段的重要基石,推动了这一领域从设想走向现实的初步探索。

3

第一次AI热潮(1956-1974):人工智能的初次腾飞

1956年:达特茅斯会议

1956年达特茅斯会议的召开,标志着人工智能作为独立学科的诞生。在接下来的近二十年里,科学家们满怀热情,试图让机器具备人类的推理、学习和问题解决能力。这一时期虽然技术尚不成熟,但却是人工智能历史上充满理想主义和探索精神的腾飞时代。

1956年:逻辑理论家——符号推理的首次实践

在第一次AI热潮中,科学家们的一个重要目标是让机器能够像人类一样解决数学和逻辑问题。1956年,艾伦·纽厄尔(Allen Newell)和赫伯特·西蒙(Herbert Simon)开发了逻辑理论家(Logic Theorist),这是世界上第一个被称为“人工智能”的程序。逻辑理论家能够证明数学定理,甚至在某些情况下比人类更高效。

万字长文丨论人工智能的前世今生

图片来源:http://www.comp.hkbu.edu.hk/~jiming/COMP7160-JLIU-4-On-Evolution-of-Research.pdf

随后,纽厄尔和西蒙又开发了通用问题求解器(General Problem Solver, GPS),试图构建一个能够解决任何问题的通用算法。GPS的核心思想是将问题分解为一系列子问题,并通过搜索找到解决方案。尽管GPS的实际能力有限,但它提出的“问题分解”和“搜索”方法成为人工智能领域的重要基础。

1957年感知器的诞生:从赫布法则到感知器模型

赫布的理论点燃了许多科学家的灵感,其中最具突破性的一步来自美国心理学家弗兰克·罗森布拉特。1957年,他在康奈尔大学航天实验室提出了感知器(Perceptron)模型,这是第一个用算法定义神经网络的尝试。

万字长文丨论人工智能的前世今生

图片来源:https://finance.sina.cn/usstock/hlwgs/2016-02-23/tech-ifxprucu3124795.d.html

感知器的设计灵感直接来源于大脑的神经网络。它由两层神经元组成:输入层接收外界信号,输出层则由麦卡洛克-皮茨神经元(阈值逻辑单元)构成,负责处理信号。简单来说,感知器模拟了神经元的“对话”,让机器具备了最初的“学习”能力。尽管感知器的功能在当时还很有限,但它的出现标志着人工智能从理论走向实践的第一步。赫布法则的“用进废退”理念,经过罗森布拉特的巧妙转化,成为了人工智能历史上不可忽视的起点。

万字长文丨论人工智能的前世今生

图片来源:https://cloud.tencent.com/developer/article/1167051

罗森布拉特在一台IBM-704计算机上模拟实现了“感知器”神经网络模型。感知器占据了整个实验室,它包括三层结构,运作机制并不复杂。感知器的一端,400个光传感器模拟视网膜;传感器多次连接一组512个电子触发器,当它通过一个特定的可调节的兴奋阀值时就会像神经元一样激发。这些触发器连接到最后一层,当一个物体与感知器受训见过的对象相互匹配时,它就会发出信号。这个模型可以完成一些简单的视觉处理任务。然而,感知器的功能非常有限,无法解决非线性问题(如XOR问题),这一局限性在1969年被明斯基和帕帕特的研究明确指出,导致神经网络研究一度停滞。

1958年:LISP语言问世,人工智能迎来专属编程语言

1958年,麻省理工学院的约翰·麦卡锡设计了LISP(LISt Processing)语言,这是世界上第一个专为人工智能研究开发的编程语言。LISP以其灵活的列表数据结构、递归函数处理能力以及“代码即数据”的特性,成为符号计算和复杂数学表达的理想工具。LISP还引入了自动垃圾回收机制,这一特性在当时的编程语言中尚属少见。LISP的设计深受λ演算(Lambda Calculus)的启发,并在早期的人工智能项目(如ELIZA和SHRDLU)中得到了广泛应用。

万字长文丨论人工智能的前世今生

图片来源:https://betterprogramming.pub/the-fundamental-theories-behind-artificial-intelligence-b1fa9d75c552

LISP的出现为人工智能研究提供了强大的技术支持,尤其在开发早期的专家系统和符号推理程序时表现卓越。它被广泛应用于诸如ELIZA、SHRDLU和DENDRAL等人工智能项目,奠定了人工智能领域的技术基础。即便在今天,LISP的变种(如Common Lisp和Scheme)仍然在某些研究领域中占据重要地位。

万字长文丨论人工智能的前世今生

图片来源:https://www.shutterstock.com/image-illustration/lisp-programming-language-code-on-dark-1979820623

LISP不仅推动了人工智能的发展,其设计理念还对后来的编程语言(如Python和JavaScript)产生了深远影响。

万字长文丨论人工智能的前世今生

1960年代:模式识别崭露头角,专家系统初露锋芒

全球,1960年代——人工智能研究进入了一个新的探索阶段,模式识别成为该领域的重要研究方向。科学家们致力于开发算法,让计算机能够从复杂数据中识别特定模式或结构。早期的研究成果包括光学字符识别(OCR)系统和语音识别技术的雏形。OCR系统通过分析字符的几何特征实现文本提取,而语音识别则尝试利用声学特征区分语音信号。有趣的是,世界上第一个标准化字符识别OCR-A于1968年由瑞士字体设计师阿德里安·弗鲁提格(Adrian Frutiger)设计开发,据传它至今仍是Veryfi标志的灵感来源。

万字长文丨论人工智能的前世今生

图片来源:https://www.youtube.com/watch?v=9c128WZKMwo

与此同时,专家系统的概念开始萌芽。研究者们尝试构建基于规则推理和知识库的计算机程序,以模拟人类专家解决特定领域问题的能力。尽管这一时期的专家系统尚处于实验阶段,但它们展示了人工智能在实际应用中的巨大潜力。

模式识别和专家系统的早期探索为人工智能从符号主义向数据驱动的学习方法转变提供了桥梁,也为后来的图像识别、语音识别和自然语言处理等领域的发展铺平了道路。

万字长文丨论人工智能的前世今生

1965年:DENDRAL系统

斯坦福大学,1965年——世界上第一个专家系统DENDRAL正式诞生。由计算机科学家爱德华·费根鲍姆(Edward Feigenbaum)和化学家约书亚·莱德伯格(Joshua Lederberg)领导的团队开发,DENDRAL旨在帮助化学家分析复杂的分子结构,特别是通过质谱数据推断有机化合物的分子组成。

万字长文丨论人工智能的前世今生
万字长文丨论人工智能的前世今生

图片来源:https://www.britannica.com/browse/biographies/technology/computer-science

DENDRAL首次将领域专家的知识系统化,并转化为计算机可用的形式。化学家将分子结构和化学反应的知识编码为规则,DENDRAL通过这些规则对输入数据进行分析,并生成可能的分子结构。它的成功不仅展示了人工智能在特定领域的应用潜力,还引入了“知识工程”的概念,即将人类专家的知识系统化并转化为计算机可用的形式。但是DENDRAL的成功依赖于化学领域的专家知识,这一方法难以扩展到其他学科。

万字长文丨论人工智能的前世今生

图片来源:https://www.linkedin.com/posts/aifa-labs-official_at-stanford-university-edward-feigenbaum-activity-7224782155195809793-c3Yh

DENDRAL的问世标志着人工智能从通用推理向特定领域应用的转变。它的成功直接推动了专家系统的发展,催生了诸如医学诊断系统MYCIN和地质勘探系统PROSPECTOR等后续成果。DENDRAL的影响力延续至今,其知识表示和推理方法为现代人工智能技术(如知识图谱和推理系统)奠定了理论基础。

1966年:ELIZA——第一代聊天机器人

1966年,麻省理工学院的约瑟夫·魏泽鲍姆(Joseph Weizenbaum)开发了ELIZA,这是人工智能历史上第一个能够与人类进行对话的程序。ELIZA的设计灵感来自心理治疗师的对话模式,它通过简单的关键词匹配和模板生成技术,模拟了治疗师与患者的交流。

例如,当用户输入“我感到很沮丧”时,ELIZA可能会回应:“为什么你感到沮丧?”这种看似“聪明”的对话实际上是基于预设规则的简单文本处理。然而,尽管ELIZA的能力非常有限,它却引发了人们对计算机与人类互动潜力的广泛讨论。

万字长文丨论人工智能的前世今生

图片来源:https://www.youtube.com/watch?v=zhxNI7V2IxM

魏泽鲍姆后来对ELIZA的影响感到矛盾。他发现,许多人竟然对ELIZA产生了情感依赖,甚至认为它“理解”了他们的感受。这一现象让魏泽鲍姆意识到,人工智能的社会影响可能比技术本身更加深远。魏泽鲍姆认为,ELIZA的成功反映了人类对机器的过度信任,而非机器真正的智能。ELIZA不仅是自然语言处理领域的一个重要里程碑,也揭示了人类与机器互动中的心理复杂性。

1969年:感知机的局限性被揭示,人工智能研究遭遇重大挑战

1969年,人工智能领域迎来了一次重要的理论反思。麻省理工学院的马文·明斯基(Marvin Minsky)和西摩·帕普特(Seymour Papert)在其著作《感知机》(Perceptrons)中揭示了单层感知机(最初由弗兰克·罗森布拉特(Frank Rosenblatt)于1958年提出)的数学局限性。他们指出,这种早期的人工神经网络模型无法解决非线性可分问题,例如著名的XOR问题(异或问题)。由于当时缺乏有效的算法来训练多层神经网络,神经网络研究在接下来的十几年中陷入低谷。

万字长文丨论人工智能的前世今生

图片来源:https://medium.com/@lmpo/a-brief-history-of-ai-with-deep-learning-26f7948bc87b

这一事件对人工智能领域产生了深远影响。研究资金被削减,许多学者转向其他方向,神经网络研究进入低谷。然而,这一理论反思也为后来的突破奠定了基础。1980年代,随着反向传播算法的提出,多层神经网络重新获得关注,最终推动了深度学习的崛起。

1970年:SHRDLU语言理解系统问世,人工智能迈出语义理解新步伐

1970年,麻省理工学院的特里·温诺格拉德(Terry Winograd)开发了SHRDLU,一个能够理解和执行自然语言指令的人工智能系统。SHRDLU运行在一个虚拟的“积木世界”中,用户可以通过自然语言与系统交互,例如“把红色的方块放在蓝色的立方体上”或“有多少个绿色的物体?” 系统能够理解这些指令并在虚拟环境中执行相应操作。

SHRDLU的成功得益于其结合了语法分析、语义理解和逻辑推理的能力。SHRDLU通过语义网络表示积木世界中的对象及其关系,并结合逻辑推理实现了语言理解。这一系统展示了人工智能在自然语言处理领域的潜力。

万字长文丨论人工智能的前世今生

图片来源:https://www.reyesandres.com/2020/12/31/summer-computer-vision-project/

然而,SHRDLU的局限性也显而易见。它的成功仅限于高度受限的“积木世界”,无法扩展到更复杂的现实场景。

万字长文丨论人工智能的前世今生

SHRDLU的局限性反映了人工智能在处理开放领域问题时的不足,推动了后续研究向更通用的语言理解系统发展。

1973年:英国“莱特希尔报告”发布:理想与现实的碰撞

1973年,英国数学家詹姆斯·莱特希尔(James Lighthill)发布了一份关于人工智能研究现状的报告。这份报告由英国政府委托撰写,旨在评估人工智能研究的进展及其实际应用价值。然而,莱特希尔在报告中对人工智能领域提出了严厉批评,认为其未能实现预期目标。

报告指出,人工智能的研究成果主要集中在狭窄领域(如棋类游戏和简单的专家系统),而在通用智能和自然语言理解方面的进展极为有限。此外,莱特希尔认为,人工智能研究的高成本与低回报不成比例,政府应将资源投入到更有前景的领域。

万字长文丨论人工智能的前世今生

图片来源:https://www.sciencecampaign.org.uk/what-we-do/annual-lecture/

这份报告直接导致英国政府大幅削减了对人工智能研究的资助,许多项目被迫中止。这一事件被认为是人工智能领域第一次“寒冬”的重要导火索之一。全球范围内,人工智能研究的资金支持和公众兴趣都显著下降。

4

第一次AI寒冬(1974-1980)

在经历了1956年至1974年的第一次AI热潮后,人工智能领域迎来了第一个“寒冬”。这一时期,研究进展的停滞和外界期望的落空使得AI研究陷入低谷。科学家们曾经充满信心地认为,机器可以在短时间内达到人类智能的水平,但现实却给了他们一记沉重的打击。

万字长文丨论人工智能的前世今生

图片来源:https://www.algotive.ai/blog/the-history-of-artificial-intelligence-machine-learning-and-deep-learning

1970年代中期至1980年代初,人工智能领域陷入了第一次“寒冬”。研究进展停滞、技术瓶颈暴露以及外界期望落空,使得AI研究遭遇信任危机,资金支持大幅削减。

技术瓶颈与符号主义的局限

早期AI系统(如逻辑理论家、GPS和ELIZA)依赖符号主义,通过预定义规则进行逻辑推理,但在处理复杂、动态环境时表现不佳。问题如“组合爆炸”“框架问题”和“知识获取瓶颈”暴露了符号主义方法的局限性,难以实现真正的智能。

硬件限制与计算能力不足

1970年代的计算机硬件性能低下,处理速度慢、存储容量有限,且缺乏并行计算能力。这使得训练多层神经网络几乎不可能,直接导致神经网络研究停滞,AI发展受限。

经费削减与信任危机

1973年的莱特希尔报告批评AI研究高成本低回报,促使英国政府削减资助。美国DARPA因语音理解项目未达预期也减少资金支持。媒体的过度宣传进一步加剧了公众对AI的误解,当技术未能兑现承诺时,AI领域陷入信任危机。

启示与转折

第一次AI寒冬暴露了符号主义和硬件限制的短板,但也推动了数据驱动方法(如神经网络)的探索,并为计算机硬件的发展奠定了基础。这一低谷期为AI的复兴积累了宝贵经验。

5

第二次AI热潮(1980-1986):专家系统与神经网络的崛起

在经历了第一次寒冬的低谷后,人工智能领域在1980年代迎来了第二次热潮。这一时期的AI研究更加务实,科学家们将目光转向了特定领域的应用,尤其是专家系统的开发。同时,神经网络研究的复苏也为AI领域注入了新的活力。

专家系统兴起:AI的实用化尝试

专家系统是基于规则的人工智能系统,能够模拟人类专家在特定领域的决策过程。它们通过知识库(存储领域知识)和推理引擎(应用规则进行推理)来解决问题。这种方法在医疗诊断、金融分析、工程设计等领域取得了显著成功。

1972年,斯坦福大学的计算机科学家Edward Shortliffe开始开发MYCIN,这是一个用于医疗诊断的专家系统,专注于细菌感染和抗生素治疗。到1976年,MYCIN的开发工作基本完成,其诊断准确率达到65%-70%,甚至超过了一些人类医生的表现,成为人工智能领域的里程碑。然而MYCIN的实际应用受到限制,主要因为当时的法律和伦理问题,而非技术上的不足。1980年,美国数字设备公司(DEC)开发了XCON(eXpert CONfigurer),这是一个用于配置计算机系统的专家系统,成功帮助公司自动化复杂的计算机配置流程,显著降低了配置错误和成本,成为专家系统商业化的成功案例。

万字长文丨论人工智能的前世今生

图片来源:https://www.youtube.com/watch?v=ipEOjuV0vns

与此同时,1982年,日本政府启动了“第五代计算机计划”,试图通过专家系统和其他人工智能技术推动国家技术进步,目标是开发能够进行逻辑推理和自然语言处理的计算机。尽管该计划未能完全实现目标,但它推动了全球对人工智能的研究热潮。

万字长文丨论人工智能的前世今生

图片来源:https://www.aikatana.com/p/legacy-japans-fifth-generation-computer-systems-fgcs-project-ai

到1983年,专家系统的商业化应用达到高峰,许多公司开始开发自己的专家系统,用于优化生产流程、改进供应链管理和进行市场预测。例如,金融领域的专家系统被用于信用风险评估和投资组合优化,而制造业中则用于设备维护和流程优化。

然而,1987年开始,专家系统的热潮逐渐衰退。由于其局限性(如知识库构建成本高、缺乏灵活性、无法处理动态环境)以及新兴机器学习方法的崭露头角,企业对专家系统的兴趣开始减弱,许多项目被搁置。

神经网络研究复苏:反向传播算法的崛起与深度学习的黎明

在1950年代和1960年代,神经网络曾是人工智能研究的热点之一。然而,由于硬件性能不足和理论上的局限性(如单层感知机无法解决非线性问题),神经网络研究在1970年代逐渐被冷落。

1974年,剑桥大学的博士生保罗·韦伯斯特(Paul Werbos)在其博士论文中首次提出了反向传播(Backpropagation)算法的基本思想。这一算法旨在通过误差的梯度反向传播,优化多层神经网络的权重。然而,由于当时计算资源的匮乏以及神经网络研究的整体低迷,这一开创性的工作未能引起学术界的广泛关注。

万字长文丨论人工智能的前世今生

图片来源:https://www.sohu.com/a/476060416_129720

12年后,反向传播算法迎来了它的转折点。大卫·鲁梅尔哈特(David Rumelhart)、杰弗里·辛顿(Geoffrey Hinton)和罗纳德·威廉姆斯(Ronald Williams)在论文《Learning Representations by Back-Propagating Errors》中系统性地阐述了这一算法,并展示了其在训练多层神经网络中的有效性。

万字长文丨论人工智能的前世今生

图片来源:https://ni.cmu.edu/~plaut/papers/pdf/PlautNowlanHinton86TR.backprop.pdf

他们的研究表明,通过计算误差的梯度并将其反向传播到网络的每一层,可以显著提高神经网络的训练效率。这一成果解决了多层神经网络的训练难题。

6

第二次AI寒冬与崛起(1987年-2006年)

1989年:卷积神经网络的首次实际应用

1989年,反向传播算法迎来了其首次大规模实际应用。Yann LeCun及其团队利用反向传播算法训练卷积神经网络(Convolutional Neural Network, CNN),成功开发了一套手写数字识别系统。这一系统被美国邮政局采用,用于自动识别信件上的邮政编码,显著提高了邮件处理的效率。LeCun的工作不仅验证了神经网络在实际场景中的潜力,也为计算机视觉领域的进一步发展奠定了基础。这一成果标志着神经网络从理论研究走向实际应用的重要一步。

1990年代初期:神经网络研究的瓶颈期

尽管反向传播算法的潜力得到了验证,但1990年代的神经网络研究却陷入了瓶颈。受限于当时的硬件性能和数据规模,神经网络的规模和复杂度难以进一步提升。此外,深层神经网络在训练过程中频繁遭遇梯度消失问题,导致模型难以有效收敛。这一时期,神经网络研究的热度逐渐下降,许多研究者转向其他领域。

1990年代中后期:AI的低谷与转型

在经历了漫长的寒冬后,1990年代中后期的人工智能领域开始显现转型迹象。随着专家系统的衰退,统计学习方法迅速崛起,支持向量机(SVM)和贝叶斯网络等技术成为新焦点,为AI研究注入了新的活力。与此同时,互联网的普及带来了前所未有的海量数据,推动了数据驱动方法的广泛应用。尽管神经网络整体陷入低潮,但1997年长短期记忆网络(LSTM)的提出为未来深度学习的发展埋下了伏笔。可以说,这一时期是AI从规则驱动向数据驱动转型的关键阶段,为后续的技术突破奠定了坚实基础。

2000年代初期:AI的复苏前夜

进入21世纪初,人工智能领域迎来了复苏的曙光。统计机器翻译(SMT)逐步取代传统规则方法,条件随机场(CRF)等算法推动自然语言处理取得显著进展,而Google等搜索引擎的崛起则展示了AI在信息检索中的巨大潜力。与此同时,AI的商业化应用开始加速,推荐系统、语音识别技术以及家用机器人(如2002年推出的Roomba)逐步进入大众视野。2006年,Geoffrey Hinton提出深度信念网络(DBN),标志着深度学习的重新崛起。这一时期,技术积累与商业化探索齐头并进,为人工智能的全面复兴拉开了序幕。

7

深度学习的复兴与奠基时期(2006年-2012年)

2006年:深度学习的学术复兴

2006年,人工智能领域迎来了划时代的突破。杰弗里·辛顿(Geoffrey Hinton)及其团队提出了逐层预训练(Layer-wise Pretraining)方法,成功解决了深层神经网络训练中的梯度消失问题。这一方法通过逐层优化网络参数,使深层网络的训练变得可行,显著提升了模型性能。辛顿团队的研究表明,深度神经网络不仅能够捕捉复杂的特征表示,还能在大规模数据中展现出强大的学习能力。这一突破重新激活了对神经网络的研究热情,反向传播算法作为深度学习的核心技术再次成为焦点。辛顿在回顾这一成果时表示:“我们终于找到了让深层网络真正发挥潜力的方法,这为人工智能的未来打开了全新的可能性。”这一年被视为深度学习学术复兴的起点。

2006-2012: 硬件与数据的双重驱动:深度学习的加速器

2006年至2012年间,深度学习的快速崛起离不开硬件性能的飞跃和大规模数据的积累。首先,硬件革命为深度学习提供了强大的计算能力。研究者发现,图形处理器(GPU)的并行计算能力在处理矩阵运算时远超传统的中央处理器(CPU)。这一发现使得深层神经网络的训练时间从数周缩短至数天甚至数小时。NVIDIA等公司在这一时期推出的高性能GPU,成为深度学习发展的重要推动力。

万字长文丨论人工智能的前世今生

图片来源:http://hw-museum.cz/article/10/the-ultimate-gpu-benchmark--2006---2010-/1

与此同时,数据爆发为深度学习模型的训练提供了丰富的资源。互联网的普及和数字化进程带来了海量数据,而2009年发布的ImageNet数据集更是深度学习发展的重要里程碑。这个包含超过1000万张标注图像的数据集,为计算机视觉任务提供了标准化的训练和评估平台。

万字长文丨论人工智能的前世今生

图片来源:https://www.youtube.com/watch?v=Q-8ERkLwqDE

硬件与数据的双重驱动,使得深度学习从理论研究逐步走向实际应用,推动了模型性能的持续提升。

万字长文丨论人工智能的前世今生

工业界的初步应用:从实验室走向现实

2010年前后,深度学习开始从学术界走向工业界,展现出巨大的商业潜力。2011年,谷歌启动了由吴恩达(Andrew Ng)领导的“Google Brain”项目,利用深度学习技术训练了一个能够自动识别猫的视频模型。尽管这一实验看似简单,却展示了深度学习在无监督学习和大规模数据处理中的潜力,成为深度学习工业化应用的标志性事件。

万字长文丨论人工智能的前世今生

图片来源:https://venturebeat.com/ai/google-brains-ai-achieves-state-of-the-art-text-summarization-performance/

同样在这一时期,深度学习在语音识别领域也取得了突破性进展。2009年,杰弗里·辛顿团队与微软研究院合作,将深度神经网络(DNN)应用于语音识别任务,显著提升了语音识别的准确率。微软随后将这一技术应用于语音助手和实时翻译系统,为语音识别技术的普及奠定了基础。

万字长文丨论人工智能的前世今生

图片来源:https://blog.csdn.net/u014170843/article/details/142873341

随着谷歌、微软、百度等科技巨头纷纷成立深度学习研究团队,深度学习技术被广泛应用于搜索引擎优化、广告推荐、语音识别等实际场景,推动了这一技术从实验室走向现实世界。

2012年:AlexNet横空出世,震撼世界

2012年,深度学习迎来了历史性时刻。在当年的ImageNet图像识别竞赛中,杰弗里·辛顿团队的学生亚历克斯·克里兹夫斯基(Alex Krizhevsky)和伊利亚·苏茨克维(Ilya Sutskever)开发的AlexNet模型以压倒性优势夺冠,震撼了整个计算机视觉领域。AlexNet首次将卷积神经网络(CNN)与GPU加速相结合,显著提升了图像分类的效率和准确率。该模型将图像分类错误率从26%降至15%,远远领先于传统方法。

AlexNet的成功引发了全球范围内对深度学习的研究热潮,成为深度学习时代的正式开启。

万字长文丨论人工智能的前世今生
万字长文丨论人工智能的前世今生

图片来源:https://www.youtube.com/watch?v=ZUc0Mib5DeI

随后几年,深度学习技术迅速扩展到语音识别、自然语言处理、自动驾驶等多个领域,推动了人工智能的全面爆发

8

2012-2022:人工智能的黄金时代

2012年开启的深度学习时代,堪称人工智能的“黄金时代”。这一时期,得益于计算能力的飞跃、大规模数据的积累以及算法的创新,深度学习在多个领域取得了突破性进展。从图像识别到语音识别,从自然语言处理到生成式AI,深度学习技术正在深刻改变我们的生活。

2013年:Word2Vec的诞生,词嵌入技术的重大突破

2013年,Google Brain团队发表了一篇关于使用神经网络技术进行语言建模的开创性论文,提出了Word2Vec模型。这一模型通过将单词表示为向量,捕捉了单词之间的语义关系。Word2Vec的核心思想是基于上下文预测单词(Skip-gram)或基于单词预测上下文(CBOW),从而学习到单词的分布式表示。这种表示方式使得语义相似的单词在向量空间中彼此接近,例如“国王”(king)与“王后”(queen)之间的关系可以通过简单的向量运算(king - man + woman ≈ queen)体现出来。Word2Vec的提出不仅显著提升了自然语言处理(NLP)任务的性能,也为后续的语言模型(如BERT和GPT)奠定了基础,成为NLP领域的里程碑。

2014年:GANs的诞生与FAIR的成立

2014年,深度学习领域迎来了两项重要事件。首先,Ian Goodfellow及其团队提出了生成对抗网络(GANs),这是一种全新的生成模型架构。GANs由两个网络组成:生成器(Generator)和判别器(Discriminator)。生成器试图生成逼真的数据,而判别器则试图区分生成的数据和真实数据。通过这种对抗性的训练,GANs能够生成高度逼真的图像、音频和其他数据。GANs的提出为生成模型开辟了全新的方向,并在艺术创作、图像生成、数据增强等领域产生了深远影响。

同年,Facebook AI Research(FAIR)正式成立,标志着大型科技公司对人工智能研究的高度重视。FAIR的成立不仅推动了AI技术的快速发展,例如开发了PyTorch,也吸引了大量顶尖研究者加入,为AI领域注入了强大的创新动力。

2015年:TensorFlow与AlphaGo的初露锋芒

2015年,Google发布了其开源深度学习框架TensorFlow,迅速成为最受欢迎的深度学习工具之一。TensorFlow的发布标志着深度学习框架进入开源竞争时代,与Theano、Caffe等框架共同推动了AI技术的普及。

同年,DeepMind的AlphaGo首次在围棋领域展现出非凡的实力,战胜了欧洲围棋冠军樊麾。这一胜利预示着人工智能在复杂博弈中的潜力,也为后续与世界顶级棋手的对决奠定了基础。

2016年:AlphaGo战胜李世石与OpenAI的成立

2016年,人工智能领域迎来了一个历史性时刻。DeepMind的AlphaGo在与围棋世界冠军李世石九段的五局比赛中以4:1获胜,成为首个在围棋比赛中战胜世界冠军的AI程序。这一成就震撼了全球,围棋被认为是人类智慧的象征,而AlphaGo的胜利标志着AI在解决复杂问题上的能力达到了新高度。

同年,OpenAI正式成立。这是一家非营利性人工智能研究机构,旨在推动人工智能的发展,同时确保其安全性和对社会的积极影响。OpenAI的成立不仅推动了AI技术的开放性和透明性,也为后续的AI研究设定了伦理和安全的基准。

2017年:AlphaGo Zero与WaveNet的突破

2017年,DeepMind发布了AlphaGo Zero,一个完全通过自我对弈学习围棋的AI系统。与之前的AlphaGo不同,AlphaGo Zero不依赖人类棋谱,仅通过强化学习从零开始训练,最终达到了前所未有的围棋水平。这一成果展示了AI在自我学习和优化方面的巨大潜力。

同年,DeepMind还发布了WaveNet,一个用于生成高质量语音和自然语言的深度学习模型。WaveNet能够生成接近人类自然语音的音频,显著提升了语音合成技术的质量,并被应用于Google Assistant等产品中。

2018年:OpenAI Five与BERT的崛起

2018年,OpenAI的OpenAI Five在多人在线竞技游戏Dota 2中击败了世界冠军队伍。这一成就展示了AI在复杂多人协作和对抗环境中的能力,标志着AI在实时战略游戏中的突破。

同年,Google发布了BERT模型,这是自然语言处理领域的又一重大进展。BERT通过双向Transformer架构,能够更好地理解上下文语义,在多个NLP任务中取得了显著的性能提升。BERT的发布推动了NLP技术的广泛应用,并成为后续语言模型的基础。

2019年:GPT-2与StyleGAN的惊艳表现

2019年,OpenAI发布了GPT-2,一个强大的预训练语言模型。GPT-2因其生成文本的能力而引起广泛关注,它能够根据输入生成连贯且富有逻辑的长篇文本。这一模型展示了语言生成技术的巨大潜力,同时也引发了关于AI滥用的伦理讨论。

同年,NVIDIA发布了StyleGAN,一种能够生成高度逼真人脸的生成对抗网络模型。StyleGAN通过控制生成图像的风格和细节,进一步提升了图像生成的质量,为虚拟现实、游戏开发和艺术创作提供了强大的工具。

2020年:GPT-3与AlphaFold的双重突破

2020年,OpenAI发布了GPT-3,一个拥有1750亿参数的巨大语言模型。GPT-3展示了前所未有的自然语言理解和生成能力,能够完成从写作到编程的多种任务。其表现引发了全球范围内对大规模语言模型的关注。

同年,DeepMind的AlphaFold在蛋白质折叠问题上取得了突破性进展。AlphaFold能够准确预测蛋白质的三维结构,这一成果解决了生物学领域的长期难题,对药物研发和疾病研究产生了深远影响。

2021年:AI艺术与多模态模型的崛起

2021年,OpenAI发布了CLIPDALL·E模型。CLIP能够将图像和文本联系起来,实现跨模态的理解,而DALL·E则能够根据文本描述生成对应的图像。这些模型展示了AI在多模态任务中的强大能力,为人机交互和创意生成开辟了新方向。

2022年:ChatGPT的发布与公众热潮

2022年,OpenAI发布了ChatGPT,一个基于GPT-3.5的聊天机器人。ChatGPT能够进行自然流畅的对话,回答问题、提供建议甚至参与创意写作。其表现引发了公众对AI对话系统的浓厚兴趣,并迅速成为全球范围内的热门话题。ChatGPT的成功标志着AI技术在自然语言交互中的成熟,也为未来的AI应用铺平了道路。

9

生成式AI时代(2022年至今):人工智能的普及与变革

如果说2012年至2022年是深度学习技术奠定基础、推动人工智能(AI)进入黄金时代的十年,那么2022年至今则是生成式AI全面爆发、推动AI技术普及与社会变革的新时代。这一时期的AI发展以大语言模型(LLMs)、多模态AI和生成式AI的突破为核心,标志着AI从专业工具向大众化、商业化和社会深度融合的转变。

万字长文丨论人工智能的前世今生

图片来源:http://www.wddxxj.com/2024/03/03/《beyond-human-creativity-a-tutorial-on-advancements-in-ai-generated-content》解读/

ChatGPT的成功与后续版本的发布

2022年底,OpenAI推出了基于GPT-3.5的大语言模型ChatGPT,这一产品迅速成为全球范围内的现象级应用。ChatGPT以其自然流畅的对话能力和广泛的适用性,吸引了数百万用户。无论是回答问题、生成创意内容,还是辅助编程,ChatGPT都展现了强大的实用性。它的成功标志着大语言模型从实验室研究走向了大规模商业化应用。

2023年3月,OpenAI发布了GPT-4,这一版本在多个方面实现了显著提升。GPT-4支持更长的上下文输入(超过25,000个单词),并在多模态任务中表现出色,例如处理图像输入。它能够完成复杂的推理任务,例如分析图表、解决数学问题和生成更高质量的文本。GPT-4的发布进一步巩固了OpenAI在大语言模型领域的领先地位。

值得一提的是,ChatGPT和GPT-4的技术被集成到Microsoft的产品中,例如Office 365中的Copilot,为用户提供了智能化的办公体验。这种深度整合不仅提升了生产力,也推动了AI技术的普及。

其他大语言模型的崛起

随着OpenAI的成功,其他科技公司和研究机构也加速了大语言模型的研发。2023年,Google DeepMind推出了Gemini,一个结合语言和视觉能力的多模态模型。Gemini被认为是OpenAI的直接竞争对手,其在多模态任务中的表现尤为突出,并被广泛应用于Google搜索和其他核心产品中。

Anthropic则发布了Claude系列模型,专注于安全性和可控性。Claude被设计为“更安全的AI助手”,在生成内容时更加注重伦理和用户意图,成为企业和教育领域的热门选择。

Meta在2023年发布了LLaMA(Large Language Model Meta AI),并选择了开源的方式。这一决定在AI社区中引发了广泛讨论,LLaMA的开源性使得研究者和开发者能够在其基础上进行创新,进一步推动了AI技术的民主化。

万字长文丨论人工智能的前世今生

图片来源:https://varindia.com/news/meta-unveils-new-ai-model-llama-3-1

此外,新兴公司如Mistral和Cohere也加入了竞争。Mistral推出了高效的开源模型Mistral 7B,展示了在小规模参数下的强大性能,而Cohere则专注于企业级语言模型,提供定制化解决方案,满足不同行业的需求。

万字长文丨论人工智能的前世今生
万字长文丨论人工智能的前世今生

图片来源:https://www.cnbeta.com.tw/articles/tech/1447463.htm

开源模型的兴起

2023年,开源大语言模型的兴起成为AI领域的重要趋势。Meta的LLaMA、Falcon和Mistral等开源模型降低了AI开发的门槛,使更多企业和个人能够利用大语言模型进行创新。

万字长文丨论人工智能的前世今生

图片来源:https://news.qq.com/rain/a/20240616A039J800

Hugging Face等平台成为开源模型的主要集散地,为开发者提供了丰富的工具和资源。这种开放生态的形成,不仅推动了技术的快速迭代,也促进了AI社区的繁荣。

多模态模型的普及多模态AI,即能够同时处理多种数据类型(如文本、图像、音频)的模型,近年来取得了显著进展。2023年,OpenAI推出了GPT-4 Vision,这是GPT-4的多模态版本,支持图像输入。GPT-4 Vision能够完成复杂的视觉任务,例如描述图像内容、分析图表、甚至解决视觉推理问题(如“这张图片中有什么异常?”)。这一技术的发布标志着AI在多模态领域迈出了重要一步。

与此同时,Google DeepMind推出了Imagen,一个基于文本生成高质量图像的模型,与OpenAI的DALL·E 2展开竞争。Imagen在生成图像的细节和语义一致性方面表现出色,被广泛应用于广告设计和创意产业。

生成式AI在图像和视频领域的应用正在迅速扩展。MidJourneyStable Diffusion等生成式图像模型在艺术创作和设计领域广泛应用。例如,MidJourney被用于生成概念艺术,而Stable Diffusion因其开源性被广泛用于研究和商业项目。

在视频生成领域,Runway推出了基于生成式AI的视频工具,能够根据文本描述生成短视频。这一技术为影视制作和内容创作提供了全新工具,例如快速生成广告素材或电影预览。生成式视频的出现,正在改变传统影视制作的流程和成本结构。语音和音频生成技术也在快速发展。ElevenLabs开发了高质量的语音生成技术,能够模仿人类语音的语调和情感,这一技术被广泛应用于有声书、游戏配音和虚拟助手中。

此外,Google推出了MusicLM,一个生成音乐的AI模型。MusicLM能够根据文本描述生成复杂的音乐作品。例如,用户可以输入“欢快的爵士乐,带有钢琴和萨克斯风”,MusicLM会生成符合描述的音乐,这一技术为音乐创作提供了全新的可能性。

万字长文丨论人工智能的前世今生

END

原文始发于微信公众号(GoUpSec):万字长文丨论人工智能的前世今生

免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2025年1月7日15:47:28
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   万字长文丨论人工智能的前世今生https://cn-sec.com/archives/3601078.html
                  免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉.

发表评论

匿名网友 填写信息