从图灵测试到大模型——AI七十年英雄史诗

贝叔

最后编辑于 2026年4月14日

爸爸从手机屏幕上抬头问我：“AI能超过人类吗？”

我不知道答案，但我知道这是无数个人在问的问题。

1950年，从世界大战的硝烟中走过的图灵，亲眼见证了计算机无与伦比的计算能力以后，他在论文中发出了拷问：“机器能思考吗！” 英雄的睿智穿越时空，断言在2000年左右机器能够实现图灵测试；他想到却没有看到的，在今天变成了现实。

理解图灵之问，回顾人工智能的发展史，尝试思考爸爸的问题，必然能够帮助我更深刻地理解人工智能，用好人工智能。

一、图灵之问和图灵测试——人工智能的终极判断

1950年，图灵在哲学杂志《心灵》上发表了论文《计算机器与智能》，其中提出核心问题：“机器能思考吗？”

图灵是英国数学家，二战时期传奇的密码破译英雄。他没有定义“思考”是什么，而是设计了一个务实的技巧——图灵测试：让一位人类评判者通过文本与隔墙的双方（一方是人，另一方是机器）进行对话；如果评判者无法可靠地区分哪一方是机器，那么这台机器就应当被认为具有智能。

图灵测试的哲学内涵，远比其游戏规则本身来得深刻。它奠定了一种”行为主义”的智能观：智能不必深究其幽暗的内部运作机制或主观体验，其外在表现才是判断的依据。

二、人工智能的诞生和萌芽期的冰冻

1956年，达特茅斯学院，约翰·麦卡锡、马文·明斯基、内森·罗切斯特和克劳德·香农等首次提出了人工智能（Artificial Intelligence）的概念。人工智能时代诞生！年轻的英雄们宣称要造出”会思考的机器”，宣布要在2个月内解决视觉、自然语言、推理等核心问题。

符号主义首先取得应用，人类的知识被总结成事实、概念、规则的符号，传递给机器，以复制智能：

1961年，通用问题求解器（GPS）能自动证明数学定理
1966年，ELIZA聊天机器人模拟心理治疗师，首次展现”拟人对话”能力
美国政府投资机器翻译项目

连接主义初露端倪，通过模拟神经元的工作机制来实现智能：

1943年，沃伦·麦卡洛克（Warren McCulloch）和沃尔特·皮茨（Walter Pitts）提出了历史上第一个人工神经元模型
1949年，唐纳德·赫布提出”神经可塑性”法则
1957年，弗兰克·罗森布拉特发明了感知机（Perceptron），这是第一个具有学习能力的神经网络模型

但第一次危机随即到来。1973年，《莱特希尔报告》严厉批评AI研究”成果远低于承诺”。英国政府随即削减经费，美国DARPA也大幅缩减投入。

如果说通过图灵测试是人工智能的圣杯，达特茅斯学院里的年轻学者们已经把人工智能的战场给画好了；萌芽期的浪漫在现实面前被冰冻，而他们在战场上的遗产，成为后来者们不断锤炼的宝库——直到数据和算力爆炸。

三、符号主义的号角和第二次AI寒冬

1976年，艾伦·纽厄尔和赫伯特·西蒙等人系统阐述”物理符号系统假设“，为符号主义奠基：一个物理符号系统具有产生智能行为的充分和必要手段。根据这一论断，只要先用符号系统定义高级智能，让机器学习后，就能够产生人工智能。

人工智能应用的方向转向务实——在特定领域复制人类专家知识。领域专家与工程师合作，提炼规则并用机器听得懂的语言（IF-THEN）编写，存入知识库；当用户需要建议，推理引擎匹配规则，给出推导和结论。

1965年，DENDRAL系统发布，能分析质谱数据，推断有机化合物分子结构
1972年，斯坦福大学开发MYCIN系统，用于诊断细菌感染和推荐抗生素，准确率超过初级医生
1980年，数字设备公司（DEC）部署XCON系统，用于配置计算机订单，每年节省数千万美元
到1980年代末，财富500强中超过一半部署了某种形式的专家系统。

然而，用逻辑规则搭建的智能高塔，很快就显现出致命的脆弱性。符号主义希望穷举人类的知识和经验，但知识获取十分复杂、常识无法被定义、规则维护成本高昂。1987年，AI硬件市场崩溃，专家系统的时代结束，AI进入第二次寒冬。

符号主义成为人工智能四大范式之一，知识图谱、逻辑推理引擎是那一批英雄留下的遗产。30多年后，当人工智能学会了学习，贴身定制的专家系统就遍地开花了。

四、连接主义和机器学习的崛起

连接主义模拟人脑神经元的工作机制：神经元通过调整连接强度来形成记忆，机器也从数据中学习来形成记忆和技能。

1969年，马文·明斯基证明单层神经网络无法解决异或问题（XOR）
1986年，大卫·鲁梅哈特（David Rumelhart）、杰弗里·辛顿（Geoffrey Hinton）等人提出反向传播算法，解决了多层神经网络的训练问题，为深度学习奠定算法基础
1997年，汤姆·米切尔（Tom Mitchell）出版《Machine Learning》，奠定了监督学习、无监督学习、强化学习、决策树、贝叶斯方法等理论框架
1998年，杨立昆（Yann LeCun）在AT&T实验室发明LeNet-5卷积神经网络，手写数字识别超过99.05%，最终被用于银行支票识别
2006年，辛顿发表里程碑论文，提出了深度学习的核心思路：多层神经网络可以逐层提取特征，从简单线条到复杂概念，逐级向上抽象——这正是大脑视觉皮层的工作方式。这篇论文标志着连接主义范式成为AI的主流，开启了波澜壮阔的大时代。

五、深度学习和大语言模型的远征

机器学习和深度学习的革命性突破，让机器开始自我成长；伴随着互联网数据的爆炸、运算能力的提升，迅速吹响了AI革命的冲锋号。

2012年，辛顿团队参加ImageNet竞赛，采用深度卷积神经网络的AlexNet以压倒性优势夺冠，错误率从26%骤降至15%。这一刻成为现代AI时代的开端，人工智能首先在感知智能（”看”和”听”）上达到了甚至超越了人类的水平
2017年，Google团队发表论文《Attention is All You Need》，提出Transformer架构，其核心的”自注意力机制”能够动态关注文本中任何位置的关键信息，全局理解上下文关系。自此，GPT-1、BERT等模型相继问世，形成了”预训练+微调”的学习范式
2022年11月30日，OpenAI发布ChatGPT。五天，用户破一百万。两个月，一亿。这是人类历史上第一款真正意义上的通用语言AI，又叫大语言模型（LLM），它能写作、能编程、能分析、能对话——不需要技术背景，只需要说话。

而今，大语言模型开启参数之争、中美Token消耗交替上升、开源与闭源模型交相辉映、通用模型和垂直模型各展风采、多模态能力栩栩如生，智能体席卷全球。伴随着人类有史以来市值最大的公司、人类有史以来成长最快的公司，人工智能迎来一个伟大的时代——恰如中国历史上的春秋时期。

结语

机器能思考吗？对于我的爸爸、对于无数像我一样正在使用大模型帮助学习的人来说，这似乎已经有了答案。

机器能够超越人类吗？人类智能与人工智能的边界，在不断被人类的英雄们重新定义。

而我更愿意相信：能提出问题的人类，永远不会被答案所超越，这就是“品味”。那么，遗传算法会不会成为新的燃料，让AI达到完全自我进化的高度？

参考文献

一、图灵之问

• Turing, A. M. (1950). Computing Machinery and Intelligence. Mind, Vol. 59, 433–460. 🔗 https://www.cs.mcgill.ca/~dprecup/courses/AI/Materials/turing1950.pdf

二、人工智能的诞生和萌芽期

• McCarthy, J., Minsky, M., Rochester, N., Shannon, C. (1955). A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence. 🔗 http://jmc.stanford.edu/articles/dartmouth.html

• Weizenbaum, J. (1966). ELIZA — A Computer Program for the Study of Natural Language Communication Between Man and Machine. Communications of the ACM, 9(1), 36–45. 🔗 https://dl.acm.org/doi/10.1145/365153.365168

• McCulloch, W., Pitts, W. (1943). A Logical Calculus of the Ideas Immanent in Nervous Activity. Bulletin of Mathematical Biophysics, 5, 115–133. 🔗 https://link.springer.com/article/10.1007/BF02478259

• Hebb, D. O. (1949). The Organization of Behavior: A Neuropsychological Theory. Wiley. 🔗 https://archive.org/details/in.ernet.dli.2015.226341

• Rosenblatt, F. (1957). The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain. Psychological Review, 65(6), 386–408. 🔗 https://homepages.math.uic.edu/~lreyzin/papers/rosenblatt58.pdf

• Lighthill, J. (1973). Artificial Intelligence: A General Survey. UK Science and Engineering Research Council. 🔗 https://www.aiai.ed.ac.uk/events/lighthill1973/lighthill.pdf

三、符号主义的号角

• Newell, A., Simon, H. A. (1976). Computer Science as Empirical Inquiry: Symbols and Search. Communications of the ACM, 19(3), 113–126.（图灵奖演讲） 🔗 https://dl.acm.org/doi/10.1145/360018.360022

• Buchanan, B. G., Feigenbaum, E. A., Lederberg, J. (1965). DENDRAL Project. Stanford University. 🔗 https://profiles.nlm.nih.gov/spotlight/bb/catalog/nlm:nlmuid-101584906X1027-doc

• Shortliffe, E. H. (1976). MYCIN: A Computer-Based Consultation System for Antimicrobial Drug Selection. Stanford University.（MYCIN系统1972年启动，1976年发表论文）

四、连接主义和机器学习的崛起

• Minsky, M., Papert, S. (1969). Perceptrons: An Introduction to Computational Geometry. MIT Press. 🔗 https://mitpress.mit.edu/9780262630221/perceptrons/

• Rumelhart, D. E., Hinton, G. E., Williams, R. J. (1986). Learning Representations by Back-propagating Errors. Nature, 323, 533–536. 🔗 https://www.nature.com/articles/323533a0

• Mitchell, T. M. (1997). Machine Learning. McGraw-Hill. 🔗 https://www.cs.cmu.edu/~tom/mlbook.html

• LeCun, Y., Bottou, L., Bengio, Y., Haffner, P. (1998). Gradient-Based Learning Applied to Document Recognition. Proceedings of the IEEE, 86(11), 2278–2324. 🔗 https://ieeexplore.ieee.org/document/726791

• Hinton, G. E., Osindero, S., Teh, Y. W. (2006). A Fast Learning Algorithm for Deep Belief Nets. Neural Computation, 18(7), 1527–1554. 🔗 https://www.cs.toronto.edu/~hinton/absps/fastnc.pdf

五、深度学习和大语言模型的远征

• Krizhevsky, A., Sutskever, I., Hinton, G. E. (2012). ImageNet Classification with Deep Convolutional Neural Networks. Advances in Neural Information Processing Systems (NeurIPS). 🔗 https://proceedings.neurips.cc/paper/2012/file/c399862d3b9d6b76c8436e924a68c45b-Paper.pdf

• Vaswani, A., et al. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems (NeurIPS). 🔗 https://arxiv.org/abs/1706.03762