1178-1、人文-中国亮点外脑智库

创办院长罗卫国

1、人文首页 > 创办院长罗卫国 > 1、人文

AI估计分不清楚“苦乐”体验

发布时间:2024-02-26

每周用台式电脑精.jpg

从文生视频模型Sora说起：

现实不存在了，还是我们不存在了？

重木

罗卫国：AI估计分不清楚“苦乐”体验

在ChatGPT给我们带来的震撼还余波不断时，OpenAI（人工智能研发公司）文生视频大模型Sora在最近又带着自己的作品横空出世，更是给行业相关人士以及普通观众带来了强烈的视觉冲击。在看完Sora根据用户输入的提示词而生成的长达一分钟的高清视频后，许多人感慨“现实”已经不存在了，或许并非耸人听闻。

在OpenAI官方公布的Sora所生成的几段视频中，复杂的物理场景、角色以及运镜都十分成熟，给人一种纪录片般的“真实”感，而其之所以能够“以假乱真”也恰恰体现出这款模型的强大以及吸引人注意的特点。其中如“文本到视频的生产能力”自不必说，其对于用户输入的语言及其描述的理解能力也十分精准且能够表达出对于复杂情感样态的展现。

除此之外，就是它对于物理世界模拟的能力，尤其是对于真实世界场景的理解以及与之互动的能力，被普遍地看作是实现通用人工智能（AGI）的重要一步，即它能够模拟真实物理世界的运动，如物体的移动和相互作用……简而言之，Sora不仅是牛顿物理学的优异学生，而且也还能在“物理”之外为人物角色赋予复杂的情感表现形式，这一点或许更加令人意外。

无论是ChatGPT还是Sora，每一次新的AI（人工智能，下同）技术的发展与更新似乎都会影响到我们的神经，而在其背后实则始终都是对于人工智能技术的焦虑、期待与不安。

1、面对新技术发展，人类总是有复杂的态度

面对AI技术的新发展，这样一种交错复杂的情绪并非是什么新事物，而是始终伴随着人类对于自身所创造的技术发展而如影随形。但当下人们对于AI的关注以及由此引起的悲喜交加或许更加深刻。因为区别于传统技术发展，AI或许是第一次能够实现彻底脱离人类的新技术。

虽然在诸多关于技术的分析中，人们也曾指出许多技术一旦出现与发展起来，它们往往会遵循自身的规律持续“进化”，很多时候不会再以人类的意志为中心，但即使如此，相较于被各类科幻故事或是科技产业从业人员的科普，我们似乎普遍对AI技术的可能性超越具有一种令自己都会不安的信心，即一旦人工智能跨越自身技术发展的决定性门槛，就可能反客为主，成为影响人类社会的超越性力量……

这一焦虑虽然颇为杞人忧天，但其背后透露的却依旧是我们清晰地意识、认识或是感觉到，伴随着各种人工智能技术的发展，我们曾经熟悉的生活、对于自我的认知以及关于世界、甚至现实的看法或许都会随之改变，而未知总是会令人不安。

这一普遍的焦虑也伴随着对于新的可能性的期待，除此之外，AI技术的发展以及其所生产出的产品，如Sora的视频，也不得不让我们开始反思诸多曾经看似理所当然的“事实”，如何谓“现实”？虚构与真实之间是否存在什么隐秘的关系？而在这种文生视频模型面前，我们又该如何确认自我的存在，或是未来的我们是否会生活在一种新的“现实”之中？这些看似科幻的问题伴随着AI技术的发展而变得真实与切身。与此同时我们也会发现，这些问题也并非那么新，而是人类一直以来都在不断思考的对象，只不过AI的发展让这些问题变得更加当下。

如果我们就Sora所生成的几个视频来看，它具有强烈的传统延续性，即从西方文艺复兴之后遵循着透视法原则的绘画，到近代摄影技术以及电影工业的诞生。在某种程度上，Sora的工作就再现了曾经经过漫长时间积累与创造之后所形成的电影工业中的核心部分，即从剧本到影像化这一过程。因此我们才会发现Sora所生成的视频似乎都有一种强烈的“电影感”，这与训练它所使用的成千上万已有的视频数据库息息相关。

因此，Sora依旧遵循着当下AI技术最核心的模式，即建立在广泛的数据学习与模拟之上，所以它生成的视频一方面似曾相识，另一方面又是崭新的。其新颖之处恰恰在于它得以脱离人类曾经需要付出众多准备和劳动才能完成这一过程，而在短时间内迅速生成。由此，它对传统依赖或是涉及此类图像和影视制作的行业必然会造成巨大的影响，如传统的影视业、广告行业、短视频以及作为大学教育一部分的“影视摄影与制作”专业等。

2、Sora的进步与局限

正是Sora强大的数据库及其学习能力，使得它在未来几乎能够影视化所有人类通过语言描述而想象的场景或情节片段，因此在某种程度上它将能够使得每个人都成为“导演”，从而彻底改变当下短视频的制作方式以及其可能性。这些由Sora所生成的视频与当下导演们所制作的影视之间存在哪些差异？

我们或许可以说，一大部分的影视作品都将遭到淘汰，或是能够以更加完美的方式被呈现出来。但另一方面，有一些影视作品或许始终是Sora生成视频无法取代的，即那些有着强烈导演色彩的电影、有着精彩表演的作品以及那些涉及人类具体的处境以及对其进行反思的影视……在关于Sora模型的官方技术报告中，以及通过人们对其视频的分析发现，Sora的强大在于对物理世界的再现，这不仅包括具体的时空特色，如日本东京街头，还包括对于角色形象的精细再现，甚至连她脸上的瑕疵都能显现，并且以此表达出某种感情样态。

这也恰恰是Sora的短板，尤其当它遭遇具体的影视作品时，即使是纪录片，对于物理世界的展现背后也有一双人的眼睛以及提前的设计，它是作为某种“想法”而诞生的被剪辑的作品；而对于像电影这类形式，它们往往依赖于演员的表演而实现某种目的或传达某种思想——无论是贫瘠的思想还是深刻的哲思。归根到底，它是“人”的作品，是一个又一个具体的人根据自身的认知、情感和目的而创作的崭新之物，因此它必然具有强烈的“人性”，或者说人的色彩。

我们这里所说的“人性”一方面或许可以笼统地理解为传统人文主义中的概念，但另一方面它指的则是更加具体且关乎自身感受的东西，即我们是一种感受性（affectivite）和遭受（le Pathos）的存在，而非传统如笛卡尔与康德所认为的纯粹的理知（le pure intellection）。在西方现代哲学的起源处，笛卡尔即通过“我思故我在”确定了“我思”对于自我主体性的绝对位置，一切通过身体感官而接收到的纷杂感觉材料都遭到抛弃。在这里，身体的感受性是无足轻重的，或者被认为是某种恶魔所制造的虚幻梦境，唯一真实、清晰且确定的只有“我思”。笛卡尔所开启的“理知”哲学在其后影响深远，经过康德对于先验认知形式的创造性诠释而成为现代哲学的主流，而在这一框架中，我们的身体、感官以及其感受性都遭到厌弃（康德晚年的“第三批判”重新思考人类的感性能力），唯一的真实只有脱离了纷杂感官表象而存在。

对于理知的推崇在某种程度上与现代西方科学技术的发展有着隐秘的共振。个体被认为只有通过外部光的世界才能得以显现，而其主体性往往是与外部的客体所产生的一种关系效应。因此物理世界——尤其是空间——构成了现代主体性最核心的要素。这一哲学认知最终在胡塞尔所开启的现象学中遭到质疑，尤其是研究生命现象学的米歇尔·亨利，在他看来，胡塞尔的意向性观点依旧还不够还原，因为在其之前存在着一种更加源始的东西，即内在性，它是“一种先于意向性的现象性，先于一切关于世界的关系以及先于一切的绽出（ek-stase）”，而彻底的内在性与感受性紧密相关。

区别于亚里士多德对于“人是政治的动物”或是其后理知哲学关于“人是理性的动物”的定义，对于像米歇尔·亨利这样强调身体、感受性与内在性的现象学家而言，“我的身体是主体性的，尤其是这种主体性的本质是生命”（亨利这里所指的“生命”并非生物学意义上的，而是纯粹的关于身体、关于自身的经验）。恰恰是这种关乎自身的感受性在现代社会正在渐渐地消散，取而代之的是一种被客体化、世界化的科学在生物领域所呈现的“生命体”。也正是在此，福柯在现代政治中所发现的“生命政治”（biopolitics）才会产生，原本作为活生生并且继续活着的生命，如今在政治经济学以及现代科学技术眼中，变成了一具可供研究、保存与延续的生物体。因此重要的不再是个体的感受以及其内在性，而是一系列来自外部对于生命的规训、指导和禁令。

3、真正的恐怖是：人变得更像AI？

当我们惊叹于AI在未来可能越来越像“人”的时候，其实搞错了真正的恐怖，即具体的生命、具体的个体如今正变得越来越像AI，遵循着一套完整的系统规范，忽视自身的感受性而臣服于外部的权威，并且其主体性完全建立在一系列“科学”的认识论上。亨利说，这才是真正“绝望的生命”，它不关乎自身，逃避自身，仅仅关心客观世界和物质世界，最终导致生命在科学与技术的宇宙中彻底陷入沉默。因此，生命政治不仅仅自上而下，它也是一套可以被内化而形成了自下而上的呼应系统。而活生生的生命、具体的人在其中只不过是生产线上的某个零件，看似真实，实则不过是众多数据堆积而成的伪像。或者就像Sora所生成的视频，看似独特且具有创造性，但不过是对于物理世界的反射，而生命——即使它能够生成具有情感样态的表面，也缺乏了解其不断活着、不断差异和创造的感受性本质。

米歇尔·亨利的生命现象学对于我们思考当下关于AI的焦虑或许有着强烈的启发性。他区分了两种现象学：一种是希腊式的，世界现象学，总是从世界出发来思考主体，总是在外在性中思考；另一种则是生命现象学，避免或逃脱了一切外在性，仅仅从内在性出发、在自我生命中思考。“主体-世界”是整个德国观念论的思考基石，但在亨利看来，它恰恰忽视了更加始源的、关于生命的真相，即一种主体的自身体验，它无须朝向主体之外、无须朝向世界，是一种无需他者和世界的自我体验，并且更为原初。我们之所以在这里反复引用亨利的观点，恰恰是为了处理当下我们的处境，即一种“世界”的模式已经成为我们认知自己和理解自己的主要途径，这一“世界”在当下不仅与我们自身越来越远，而且伴随着物理科学的强势以及技术发展，它也渐渐与我们无关。

关于世界的各种“知识”，一方面依旧能够被作为认知主体的我们所识别，但另一方面却又总是与我们无关。所以才会出现“虽然听了很多道理，但依旧过不好一生”的感慨，因为那些关于“世界”的知识始终都是外在于我们生命的，那是一种由康德所证明的认知形式——我“认出”某种东西、我“知道”某样事物——与我们的感觉无关、与我们的快与不快（pleasure/displeasure）无关，与我们真实的存在无关。而恰恰是这些，是当下AI还一无所知的，它对我们存在的物理世界和科学知识知晓甚多，Sora甚至能够创造出我们的世界，但对我们通过身体感受到的痛苦与快乐却所知甚少。

在亨利看来，生命——纯粹的感受性——是一种源始的“自我受苦”（se souffrir soi-meme）与一种源始的“自我享乐”（jouir de soi），因为它是一种自我体验，在其纯粹的主体性中、在其自我感发中，“大写生命本身是一种纯粹的自身的‘苦-乐’体验”。而如今，这样纯粹的体验一方面被各种消费文化所捕捉，并且通过其精心设计的模式来引导与再生产；另一方面，就如亨利在批评现代技术时所指出的，它正在以渐进的方式将来自活生生生命的劳动从我们的生产过程中驱逐出去。结果就是，我们“知道”（科学知识、客观世界）太多，“生活”（关乎自身）太少。而未来的AI技术将与我们的生命、与我们的感受性无关，它将彻底外在化为一种新的现实，这或许才是我们恐惧的真实原因。

这也是Sora所生成的视频必然存在的局限，它虽然真假难辨，却总会在其顺滑的影像中泄露其虚构。而我们在这里讨论的“真实”与“虚构”不仅仅只是建基在光的反射上所形成的物理成像，即“真实”意味着我们眼睛能看见的东西，或许它的范围更加广泛。现代西方哲学对于传统视觉中心主义的批判提醒我们，我们身体的其他感官所感知到的东西同样具有“真实性”，尤其在爱欲生活中，声音、气味与爱抚都具有强烈的当下性与氛围感，甚至是文字的虚构也会呈现出不一样的“真实性”。在“真实”与“虚构”之间并不存在绝对的对立，甚至“虚构”本真也是真实的，但最终它们的“真假”判断依旧会涉及我们具体的生命和感受，因为痛苦和快乐都是具体而特殊的。康德在其《判断力批判》中便告诉我们，人类还存在区别于认知与道德实践之外的第三种能力，即感性判断力，它区别于前两者而体现出如下三个特点：

（一）无概念依傍；

（二）仅仅关乎感觉（feeling）的快与不快（pleasure/displeasure）；

（三）关乎自身。

康德对于我们感性判断能力的维护与其后法国哲学对于身体、内在性与感受性的讨论遥相呼应。当下，我们似乎早已经遗忘了康德的这些教诲，而陷入科学认知的外部世界，最终成为真正的“AI”——一种病态的、绝望的生命。

Sora强大的文生视频能力必然会对当下以及未来我们所熟悉的许多行业发展产生影响，而这也将切实地关乎每一个从事这些行业个体的生活。但在关于AI更加普遍和深远的焦虑中，我们其实关注的依旧是在这样一个令人隐约不安的可能性中，我们将会扮演什么样的角色？或是我们的生命、我们的生活以及我们存在本身，是否也会随之变化？

对于这些，我们当下都无法给出具体的回答，但也恰恰是这些焦虑可以让我们重新思考我们与自身的关系、我们的生命以及其关于世界的秘密。存在和生活最终都是具体且特殊的，关乎自身，而对于世界的认知以及生命的奥义，也必然不是仅仅通过概念或逻辑推理就能弄明白的；偶然和意外充斥着我们的生活，而最终一切的喜悦与痛苦都会真实地落在我们的身体上，由我们自己来承担、感受与体验。或许这才说明了生命的真相——我们存在于自己的身体与感受之中。所以在这场与AI提前预演的交战中，“How do you feel（你感觉如何）？”