3月31日,在“2025中关村论坛年会”期间,在由智谱举办的智谱OpenDay上,中国科学院院士张钹发表演讲。
张钹在演讲中指出,当前,我们进入了一个历史大变革时代,这个时代之所以会来临,就是因为大模型的作用。一方面,大模型的出现使得人工智能的技术范式发生了根本性变化;同时,人工智能日新月异的发展也正在重塑各行各业的面貌。
张钹表示,大模型使得机器具备了像人类一样思考的能力,这一突破主要依赖于GPT,即生成式预训练变换器。通过巨大的人工神经网络和庞大数据量的学习,催生了强大的大语言模型。张钹院士强调,语言的掌握为人工智能打开了无限可能性。“维特根斯坦曾说,‘语言界限就是我的世界界限’。换句话讲,机器一旦理解和掌握了人类语言,必然会给机器开辟一条充满一切可能性的道路。”
当前的大模型发展主要依赖于“规模定律”——即神经网络规模和数据规模的扩大。但如何超越这一定律?
张钹指出,首先要进一步提升大模型的性能,同时降低成本。如何提升大模型的性价比?他认为,需要提升大模型的自主思考和推理能力,利用其本身的能力,来提高其性能。当前,这方面的探索包括“思维链”(Chain of Thought,CoT)、深度思考(Deliberate Thinking)以及AI反馈强化学习(RLAI,RLHF)。
同时,张钹表示,当前人工智能正从语言模型迈入“智能体化”时代,也就是说,应该把语言模型扩展到变成智能体。而构成智能体需要符合三个条件:思考能力、执行能力和感知能力。目前,大模型在数字世界中的表现已相对成熟,但若要应用于物理世界,执行能力和感知能力的提升将成为关键挑战。
尽管大模型带来了巨大变革,但在推理能力方面仍存在重大挑战。张钹院士总结了当前AI(人工智能)面临的三大难题。
首先是多层次空间的缺失。张钹认为,目前的语言模型采用token构建空间,虽然数学性质良好,但缺乏层次性,而没有层次的空间难以进行复杂推理。当前图像领域已通过扩散模型(Diffusion Model)解决了这一问题,而语言领域尚在探索如何引入类似的多层次结构,“我认为一旦把扩散模型扩充到语言上去,那语言上的推理就非常准”。
其次是过程与结果的偏差。张钹表示,“我们所有的推理都是以结果作为目标,有的人说这不叫推理,叫推断”,他表示,当前推理主要依赖优化结果,而非推理过程,这导致有可能出现结果是对的,但推理过程错误的现象。因此,需要强化AI推理的过程优化,使其更加符合人类的逻辑,这主要需要依托强化学习(Reinforcement Learning)的投入研究来解决。
此外,AI的可解释性一直是业界关注的核心挑战。张钹院士认为,这一问题不能仅靠企业解决,更需要学术界和产业界的协同合作,寻找理论层面的突破。