从图灵测试到大模型——AI七十年英雄史诗
爸爸从手机屏幕上抬头问我:“AI能超过人类吗?”
我不知道答案,但我知道这是无数个人在问的问题。
1950年,从世界大战的硝烟中走过的图灵,亲眼见证了计算机无与伦比的计算能力以后,他在论文中发出了拷问:“机器能思考吗!” 英雄的睿智穿越时空,断言在2000年左右机器能够实现图灵测试;他想到却没有看到的,在今天变成了现实。
理解图灵之问,回顾人工智能的发展史,尝试思考爸爸的问题,必然能够帮助我更深刻地理解人工智能,用好人工智能。
一、图灵之问和图灵测试——人工智能的终极判断
1950年,图灵在哲学杂志《心灵》上发表了论文《计算机器与智能》,其中提出核心问题:“机器能思考吗?”
图灵是英国数学家,二战时期传奇的密码破译英雄。他没有定义“思考”是什么,而是设计了一个务实的技巧——图灵测试:让一位人类评判者通过文本与隔墙的双方(一方是人,另一方是机器)进行对话;如果评判者无法可靠地区分哪一方是机器,那么这台机器就应当被认为具有智能。
图灵测试的哲学内涵,远比其游戏规则本身来得深刻。它奠定了一种”行为主义”的智能观:智能不必深究其幽暗的内部运作机制或主观体验,其外在表现才是判断的依据。
二、人工智能的诞生和萌芽期的冰冻
1956年,达特茅斯学院,约翰·麦卡锡、马文·明斯基、内森·罗切斯特和克劳德·香农等首次提出了人工智能(Artificial Intelligence)的概念。人工智能时代诞生!年轻的英雄们宣称要造出”会思考的机器”,宣布要在2个月内解决视觉、自然语言、推理等核心问题。
符号主义首先取得应用,人类的知识被总结成事实、概念、规则的符号,传递给机器,以复制智能:
- 1961年,通用问题求解器(GPS)能自动证明数学定理
- 1966年,ELIZA聊天机器人模拟心理治疗师,首次展现”拟人对话”能力
- 美国政府投资机器翻译项目
连接主义初露端倪,通过模拟神经元的工作机制来实现智能:
- 1943年,沃伦·麦卡洛克(Warren McCulloch)和沃尔特·皮茨(Walter Pitts)提出了历史上第一个人工神经元模型
- 1949年,唐纳德·赫布提出”神经可塑性”法则
- 1957年,弗兰克·罗森布拉特发明了感知机(Perceptron),这是第一个具有学习能力的神经网络模型
但第一次危机随即到来。1973年,《莱特希尔报告》严厉批评AI研究”成果远低于承诺”。英国政府随即削减经费,美国DARPA也大幅缩减投入。
如果说通过图灵测试是人工智能的圣杯,达特茅斯学院里的年轻学者们已经把人工智能的战场给画好了;萌芽期的浪漫在现实面前被冰冻,而他们在战场上的遗产,成为后来者们不断锤炼的宝库——直到数据和算力爆炸。
三、符号主义的号角和第二次AI寒冬
1976年,艾伦·纽厄尔和赫伯特·西蒙等人系统阐述”物理符号系统假设“,为符号主义奠基:一个物理符号系统具有产生智能行为的充分和必要手段。根据这一论断,只要先用符号系统定义高级智能,让机器学习后,就能够产生人工智能。
人工智能应用的方向转向务实——在特定领域复制人类专家知识。领域专家与工程师合作,提炼规则并用机器听得懂的语言(IF-THEN)编写,存入知识库;当用户需要建议,推理引擎匹配规则,给出推导和结论。
- 1965年,DENDRAL系统发布,能分析质谱数据,推断有机化合物分子结构
- 1972年,斯坦福大学开发MYCIN系统,用于诊断细菌感染和推荐抗生素,准确率超过初级医生
- 1980年,数字设备公司(DEC)部署XCON系统,用于配置计算机订单,每年节省数千万美元
- 到1980年代末,财富500强中超过一半部署了某种形式的专家系统。
然而,用逻辑规则搭建的智能高塔,很快就显现出致命的脆弱性。符号主义希望穷举人类的知识和经验,但知识获取十分复杂、常识无法被定义、规则维护成本高昂。1987年,AI硬件市场崩溃,专家系统的时代结束,AI进入第二次寒冬。
符号主义成为人工智能四大范式之一,知识图谱、逻辑推理引擎是那一批英雄留下的遗产。30多年后,当人工智能学会了学习,贴身定制的专家系统就遍地开花了。
四、连接主义和机器学习的崛起
连接主义模拟人脑神经元的工作机制:神经元通过调整连接强度来形成记忆,机器也从数据中学习来形成记忆和技能。
- 1969年,马文·明斯基证明单层神经网络无法解决异或问题(XOR)
- 1986年,大卫·鲁梅哈特(David Rumelhart)、杰弗里·辛顿(Geoffrey Hinton)等人提出反向传播算法,解决了多层神经网络的训练问题,为深度学习奠定算法基础
- 1997年,汤姆·米切尔(Tom Mitchell)出版《Machine Learning》,奠定了监督学习、无监督学习、强化学习、决策树、贝叶斯方法等理论框架
- 1998年,杨立昆(Yann LeCun)在AT&T实验室发明LeNet-5卷积神经网络,手写数字识别超过99.05%,最终被用于银行支票识别
- 2006年,辛顿发表里程碑论文,提出了深度学习的核心思路:多层神经网络可以逐层提取特征,从简单线条到复杂概念,逐级向上抽象——这正是大脑视觉皮层的工作方式。这篇论文标志着连接主义范式成为AI的主流,开启了波澜壮阔的大时代。
五、深度学习和大语言模型的远征
机器学习和深度学习的革命性突破,让机器开始自我成长;伴随着互联网数据的爆炸、运算能力的提升,迅速吹响了AI革命的冲锋号。
- 2012年,辛顿团队参加ImageNet竞赛,采用深度卷积神经网络的AlexNet以压倒性优势夺冠,错误率从26%骤降至15%。这一刻成为现代AI时代的开端,人工智能首先在感知智能(”看”和”听”)上达到了甚至超越了人类的水平
- 2017年,Google团队发表论文《Attention is All You Need》,提出Transformer架构,其核心的”自注意力机制”能够动态关注文本中任何位置的关键信息,全局理解上下文关系。自此,GPT-1、BERT等模型相继问世,形成了”预训练+微调”的学习范式
- 2022年11月30日,OpenAI发布ChatGPT。五天,用户破一百万。两个月,一亿。这是人类历史上第一款真正意义上的通用语言AI,又叫大语言模型(LLM), 它能写作、能编程、能分析、能对话——不需要技术背景,只需要说话。
而今,大语言模型开启参数之争、中美Token消耗交替上升、开源与闭源模型交相辉映、通用模型和垂直模型各展风采、多模态能力栩栩如生,智能体席卷全球。伴随着人类有史以来市值最大的公司、人类有史以来成长最快的公司,人工智能迎来一个伟大的时代——恰如中国历史上的春秋时期。
结语
机器能思考吗?对于我的爸爸、对于无数像我一样正在使用大模型帮助学习的人来说,这似乎已经有了答案。
机器能够超越人类吗?人类智能与人工智能的边界,在不断被人类的英雄们重新定义。
而我更愿意相信:能提出问题的人类,永远不会被答案所超越,这就是“品味”。那么,遗传算法会不会成为新的燃料,让AI达到完全自我进化的高度?
参考文献
一、图灵之问
• Turing, A. M. (1950). Computing Machinery and Intelligence. Mind, Vol. 59, 433–460. 🔗 https://www.cs.mcgill.ca/~dprecup/courses/AI/Materials/turing1950.pdf
二、人工智能的诞生和萌芽期
• McCarthy, J., Minsky, M., Rochester, N., Shannon, C. (1955). A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence. 🔗 http://jmc.stanford.edu/articles/dartmouth.html
• Weizenbaum, J. (1966). ELIZA — A Computer Program for the Study of Natural Language Communication Between Man and Machine. Communications of the ACM, 9(1), 36–45. 🔗 https://dl.acm.org/doi/10.1145/365153.365168
• McCulloch, W., Pitts, W. (1943). A Logical Calculus of the Ideas Immanent in Nervous Activity. Bulletin of Mathematical Biophysics, 5, 115–133. 🔗 https://link.springer.com/article/10.1007/BF02478259
• Hebb, D. O. (1949). The Organization of Behavior: A Neuropsychological Theory. Wiley. 🔗 https://archive.org/details/in.ernet.dli.2015.226341
• Rosenblatt, F. (1957). The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain. Psychological Review, 65(6), 386–408. 🔗 https://homepages.math.uic.edu/~lreyzin/papers/rosenblatt58.pdf
• Lighthill, J. (1973). Artificial Intelligence: A General Survey. UK Science and Engineering Research Council. 🔗 https://www.aiai.ed.ac.uk/events/lighthill1973/lighthill.pdf
三、符号主义的号角
• Newell, A., Simon, H. A. (1976). Computer Science as Empirical Inquiry: Symbols and Search. Communications of the ACM, 19(3), 113–126.(图灵奖演讲) 🔗 https://dl.acm.org/doi/10.1145/360018.360022
• Buchanan, B. G., Feigenbaum, E. A., Lederberg, J. (1965). DENDRAL Project. Stanford University. 🔗 https://profiles.nlm.nih.gov/spotlight/bb/catalog/nlm:nlmuid-101584906X1027-doc
• Shortliffe, E. H. (1976). MYCIN: A Computer-Based Consultation System for Antimicrobial Drug Selection. Stanford University.(MYCIN系统1972年启动,1976年发表论文)
四、连接主义和机器学习的崛起
• Minsky, M., Papert, S. (1969). Perceptrons: An Introduction to Computational Geometry. MIT Press. 🔗 https://mitpress.mit.edu/9780262630221/perceptrons/
• Rumelhart, D. E., Hinton, G. E., Williams, R. J. (1986). Learning Representations by Back-propagating Errors. Nature, 323, 533–536. 🔗 https://www.nature.com/articles/323533a0
• Mitchell, T. M. (1997). Machine Learning. McGraw-Hill. 🔗 https://www.cs.cmu.edu/~tom/mlbook.html
• LeCun, Y., Bottou, L., Bengio, Y., Haffner, P. (1998). Gradient-Based Learning Applied to Document Recognition. Proceedings of the IEEE, 86(11), 2278–2324. 🔗 https://ieeexplore.ieee.org/document/726791
• Hinton, G. E., Osindero, S., Teh, Y. W. (2006). A Fast Learning Algorithm for Deep Belief Nets. Neural Computation, 18(7), 1527–1554. 🔗 https://www.cs.toronto.edu/~hinton/absps/fastnc.pdf
五、深度学习和大语言模型的远征
• Krizhevsky, A., Sutskever, I., Hinton, G. E. (2012). ImageNet Classification with Deep Convolutional Neural Networks. Advances in Neural Information Processing Systems (NeurIPS). 🔗 https://proceedings.neurips.cc/paper/2012/file/c399862d3b9d6b76c8436e924a68c45b-Paper.pdf
• Vaswani, A., et al. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems (NeurIPS). 🔗 https://arxiv.org/abs/1706.03762