大模型发展的三个迷思

段永朝 原创 | 2023-12-24 07:06 | 收藏 | 投票 编辑推荐 焦点关注

 自 ChatGPT 发布以来,大模型掀起人工智能领域新一轮技术革命浪潮。作为数据密集型行业,金融业沉淀了金融交易、客户信息、市场分析、风控等海量数据,又有大量高效处理的技术需求,因此也成为大模型最有可能落地实践的领域之一。但金融作为一个强监管且对精准性、可控性要求很高的行业,通用大模型在金融核心业务领域的应用还面临诸多挑战。在此背景下,中国财富管理50人论坛(CWM50)近期邀请政策与行业专家,召开“大模型在金融业的应用、监管与市场未来格局”专题研讨会。中国计算机学会终身会员、《智能科学与技术》学报编委段永朝参会并发言。

 

段永朝认为,大模型发展带来了三个迷思,一是大模型所依赖的数理逻辑基础,并不支撑大模型的雄心壮志,二是AGI面临解释难题,三是技术伦理的价值中立原则的破产。目前AGI通用人工智能大模型和金融数字化的关系并未获得严肃对待,智能时代的数据是“活”数据,数据成为生产要素之后,将会给会计准则、账户概念、资产界定、交易界定以及劳动、财富的含义等诸多领域带来哪些变化,需要进一步研究。在数字世界中,未来商业逻辑可能会打破传统的串行逻辑,变成“并发”逻辑,即边生产、边消费、边分配。如果在数字人民币加持之下,进一步思考大模型应用对金融业的冲击,就需要深入想象未来银行扮演的角色和功能是否会发生根本性的变化,未来银行等金融机构或将实现“支付即结算”的场景。此外,财富增长和财富分配的平衡问题也需考虑。通过近年来大模型的发展和争论,我们可以看到时代的紧迫感,还有大量的基础问题或还需要破题,一些重要的理论问题或离破题还有相当距离。

 

 

一、关于大模型发展的三个迷思

首先,我谈一谈对大模型的粗浅认识。一年以来大模型的喧嚣,可以提这样一个问题:我们是否过度放大了今天所见到的大模型的威力?也许我们对大模型带来的迷思关注不够。我认为大模型或带来几个迷思:

第一,大模型所依赖的数理逻辑基础,并不支撑大模型的雄心壮志。大模型背后的数学物理基础其实相当薄弱,这里指的并不是教科书版高等数学物理的知识。奇怪的是过去十年来,似乎大家都认为深度学习、人工智能、大模型的数学物理基础是强悍的。从专业角度来看,简单地说,今天的人工智能、大模型最重要的算法基础是贝叶斯网络、卷积神经网络等等;最重要的数学物理基础是“丘奇-图灵论题”——要注意它是论题(thesis)而不是命题(proposition)。丘奇-图灵论题就是说所有可计算的过程都可以用图灵机实现。这只是一个猜想,不是数学意义上的结论。不难理解为什么著名美国语言学家乔姆斯基在ChatGPT出来后大声反对它,甚至到了愤怒的地步,简单说就是大模型仰仗的依然是“蛮力计算”。我认为在学理上,大模型的雄心壮志并没有得到严格的数理逻辑的论证和支持。

第二,AI面临解释难题。2017年,美国国防部的DARPA就开始提这一问题,希望人工智能能面向理解、面向解释,它提出AI的可解释问题,即XAI(Explainable AI);6年之后,学术界已经有一种日益强大(但倾向于悲观)的声音,就是AI的解释难题基本上是不可能突破的。也就是说,已经不是“AI解释难题”了,而是“AI解释不可能”问题了,这需要引起我们足够的重视。如果这个问题发展下去,人工智能“军备竞赛”的真正制高点,就是“解释权竞争”了。

第三,技术伦理的价值中立原则的破产。智能技术深度“嵌入”社会生活方方面面,深度“介入”生产消费组织的各个场景,带来安全、治理、伦理等种种难题。但最大的挑战,是“价值中立论”的破产。也就是说,智能技术不再是像传统工业技术那样是“死”的,智能技术是“活”的。现在一讲大模型就在比参数、晒榜单,忽略或者无视智能技术带来的价值中立论崩溃的深层次问题,这是远远不够的。最近一段时间出现的“人机对齐问题”,其实是智能技术价值中立原则崩溃的一种表现形式,是人工智能从“分析式”发展到“生成式”必然的挑战。

价值中立原则是工业资本主义技术伦理的奠基石,这一基础建立在工业时代理性主义的“事实-价值两分法”的基础上,其实质是对确定性的迷恋和崇拜。进入智能时代,脱胎于工业思维的计算主义思想,自然沿袭这一两分法的立场,但在多层级、多维度、万物互联的数字时代,这一确定性思维范式难以为复杂多变、深度纠缠、涌现生成提供更加合理的解释。换句话说,秉持价值中立原则,是难以拓展数字时代的技术伦理思想的。这一重大问题,产业界的研究者基本置若罔闻,对这一话题不作讨论(讨论这一思想势必引发对智能产业商业思想的批判)。

关于AGI的迷思、大模型的迷思,这里我想引用在第七届互联网思想者大会上,中国人民大学长期研究认知科学的刘晓力教授的话,她指出:“AGI通用人工智能有四大执念,一是对齐人类执念,二是情感意识执念,三是世界模型执念,四是具身-通用兼容执念”。熟悉人工智能60多年发展史的朋友都知道,人工智能从一开始就有“通用执念”,比如早期的“通用问题求解(GPS)”。所以我们一定要小心看待这种技术倾向背后深厚的文化思想。

坚持“计算原教旨主义”的人们认为,通过计算可以搞定世界秩序,甚至可以搞定人类生存的意义。这种计算原教旨主义在古希腊毕达哥拉斯学派,在中世纪古罗马新柏拉图主义,在500年前的伽利略、350年前的莱布尼茨、70年前的图灵这里可谓一脉相传。对于东方文化而言,深入思考计算原教旨主义思想的渊源、脉络、走向,或许才能把智能技术放置在更恢弘的文化交融、文明互鉴的高度。换个角度说,既然大家都认为智能技术已经极大改变了世界,并且仍然在迅猛发展、必将以更大的威力塑造未来世界,那么智能技术背后蕴藏的思想源流、文化底蕴,以及这些思想与文化如何在数学、语言学、符号学、计算理论中得以展现,就不是无关痛痒的软课题了。在这一问题上,我认为西方技术原教旨主义者,要么有意无意地忽略了这一问题,要么就是由它的执念所为。对大模型的理解是,我们只看到了热闹非凡的榜单,忽略了行业本身存在的浮躁、喧嚣,忽略了他们对人文精神的漠视。

二、AGI通用人工智能大模型与金融数字化的关系

AGI通用人工智能、大模型与金融数字化到底是什么关系?在我看来这一问题并未获得严肃对待。我们依然把数字化当成信息化的延长线,智能时代无非是信息化的加强版。好像只要用人工智能、区块链、物联网、大模型,把原来做过的事情再做一遍,就互联互通了。说得严重一点,这一想法害人不浅。简言之,在我看来,智能技术和工业技术最大的区别就是智能技术是活的,而工业技术是死的。这将带来最大的一个遗留问题是,数据也随之有了“死活问题”。传统工业时代的数据是“死”数据,它来源于采集,将数据剥离场景,对传统行业而言,产生大量的死数据是其必然宿命。举个最通俗的例子,报表数据是天然的死数据,符合死数据的三大特征——不完整、不及时、不准确。数字时代就要用5G、6G、传感网感知并交换实时数据。从过去的测量数据转化为感知数据,这是天大的变化。这一变化用IBM的范式是难以应对的——20年前IBM公司就提出“智慧地球(Smart Planet”的想法,理念虽感人,但是其障碍无法跨越,因为信息化的遗产就是“数据孤岛”。

智能时代的数据是“活”数据,它是实时的、交互的、感知的、流动的。财政部刚公布了明年开始要实施“数据入表”,这只是万里长征第一步。数据成为生产要素之后,将会带来会计准则什么变化?带来账户概念、资产界定、交易界定等什么变化?将会带来劳动的含义、财富的含义什么变化?这些问题统统需要深入研究。数据入表之后,财务报表还是那个报表了吗?下一步是否会出现行为入账、意愿入账?这里有太多的问题需要研究。

三、银行等金融机构在未来场景中扮演的角色

在科技巨变的大背景下,金融创新应该放在时代大背景下去理解,要确立我们的自信,在自信的基础上讲应用创新。我想讲一个金融创新的“思想案例”。过去一年来,我在北京大学为金融机构分享过20多次这一想象的场景。

传统意义上金融机构就是“账房先生”,记账、算账、结算是基本功课。真正的挑战是,我们能不能想象未来数字世界尘埃落定的时候,银行会变成什么?银行的职能会发生什么变化?如果我们的银行没有能力想象这一问题,那么向它提供一百个大模型也没有用,因为其不能想象未来的数字银行。

对此,我想提供一点粗浅的看法。传统交易逻辑是先生产、后消费、再分配,我们将其称为“串行”逻辑,金融就是为“串行”逻辑服务的。在数字世界中,我们需要想象商业逻辑可能会打破串行逻辑,变成“并发”逻辑,也就是边生产、边消费、边分配。这就是说,银行的账户体系将主要围绕“分账机制”来设计。举个例子,一瓶水5元,扫码支付后,这5元钱不需要先到小老板的手机里,一定是银行进行分账:瓶盖0.2元,瓶子0.3元,印刷商标0.28元,分摊银行贷款利息0.001元,分摊电费0.001元等等,每一个碎片化的支付项立刻到达末梢节点。企业在做ERP时,有个概念叫作BOM(物料清单),凝结在商品中的物料成本、物化劳动、待摊费用都已经固化成型,只是过去没有分配手段而已。央行在10年前开始构想数字人民币,设立“网联”“信联”,现在有了区块链,有了人工智能、大模型,可以想象这一分账场景的实现。这就是央行两年前发布的关于数字人民币白皮书里提到的“支付即结算”,也就是支付动作和结算动作同时进行,这是多么伟大的概念!

我个人觉得,我们现在谈创新,对科技力量背后的文化渊源、思想脉络理解不够,只是停留在“模仿创新”的层面,没有创新自信,忽略了自身的文化基础。中国市场体量大,中国的互联网应用场景和创造能力也可谓举世无双,很多方面都有无穷无尽的创新土壤和想象力。但最重要的还是解放思想,看清楚智能技术的本质。如果在数字人民币加持之下,进一步思考大模型应用对金融业的冲击,就需要深入想象未来银行扮演的角色和功能是否会发生根本性的变化,这是真正的未来场景。

四、财富增长和财富分配的平衡问题

千万不要把“金融高质量发展”“共同富裕”标签化和口号化。我有一个不成熟的观点,在马克思以后经济学的思想实际上是退化的,只关注增长问题,但是财富的生产和财富的分配问题同样重要,在数字世界里财富的分配问题显得更加重要,全球范围内财富分配的公平问题已经变成一个重大的社会命题、时代命题。

所以,通过近年来大模型的发展和争论,我们可以看到时代的紧迫感,但是还有大量的基础问题似乎还需要破题,一些重要的理论问题似乎离破题还有相当的距离,对此要保持足够的清醒。期待未来能够更多地组织深度的研讨,对未来格局展开想象和探索。

个人简介
每日关注 更多
赞助商广告