问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

AI时代,何为现实主义?

创作时间:
作者:
@小白创作中心

AI时代,何为现实主义?

引用
澎湃
1.
https://www.thepaper.cn/newsDetail_forward_30111019

在人工智能时代,"现实主义"的概念正在经历深刻的变革。随着生成模型的兴起,"真实照片"这一传统概念面临着前所未有的挑战。本文将探讨在AI时代,我们该如何重新定义"现实主义",以及"深度真实"这一新概念的出现,如何为我们理解图像的真实性提供了新的视角。


AI-generated illustration created by Gregory Eddi Jones, 2024, for Aperture

长期以来,照片一直被操纵或修改,但生成模型(Generative Models)的兴起为“真实”图像的概念赋予了新的含义。随着能够模拟摄影式的并通过数学方程生成图像的生成模型的出现,描述那些未使用此类程序制作的图像时,有必要更加具体。但该如何称呼它们呢?今年夏季,几家科技新闻网站在标题中使用了“真实照片”(real photo)一词,指的是Meta将档案照片错误地标记为“由AI制作”。“真实照片”这个词似乎足够直观,但如果不说是明显的矛盾修饰法,它也是误导性的。难道每一张照片在某种程度上不都是不真实的,因为它是一种表现,而不是现实本身吗?“真实照片”难道不让我们想起,那种自满的假设,摄影客观地记录了现实,一直以来是多么可疑吗?Meta平台上所有相关的图像都是由数字代码而非纸张上的光线和化学物质构成的。这是否意味着它们都不具备真实性?

“真实照片”这个短语是不连贯的。它作为对图像本体状态的描述没有意义,而只是对图像制作者、他们的技术以及最终他们的意图的判断,仿佛真实性要求消除任何特定的目标或人类的观点。从某种意义上说,文本到图像模型的“人工智能”正是这样做的,它将数十亿张不加选择地摄入的图像平均化,以得出基于统计的任何可表达概念的表现,从经验偶然性和主观扭曲中提取其“真实”本质。然而,主观性的证据通常是我们将图像视为真实的原因:作为某人以某种特定方式看到某物并找到分享该视觉的手段的证据。生成图像违背了我们对现实的感知,不一定是因为它看起来与它所描绘的内容过于相似或不够相似,而是因为它欺骗我们将观点归因于合成描绘。


AI-generated illustration created by Gregory Eddi Jones, 2024, for Aperture


AI-generated illustration created by Gregory Eddi Jones, 2024, for Aperture

我们在“真实照片”的常识概念中发现了越来越大的张力。这个词现在用来表示图像不是机器生成的(而是主观的),但它也保留了图像没有以更熟悉的方式被伪造、没有为某种预定的概念或目的进行编辑(它不是主观的)的意义。Meta最近的标签争议反映了这种混乱,因为它的现实检测器被校准为将任何形式的数字编辑识别为AI存在的证据,无意中污名化了已经被广泛接受为非伪造的修图过程。将任何形式的后期制作与自动生成混为一谈,表明“由AI制作”根本没有明确、稳定的定义。“如果‘修图’的照片是‘由AI制作’的,那么这个术语实际上毫无意义,”摄影师诺亚·卡利纳(Noah Kalina)在平台Threads上发帖。“如果他们真的想保护人们,他们不妨自动标记每张照片为‘不是现实的真实表现’。”

鉴于Meta在煽动仇恨和暴力、助长商业监视和歧视以及将用户当作未公开的心理实验中的小白鼠方面的记录,很难相信Meta特别认真地保护人们。但即使它是认真的,也不清楚为什么这样的标签会具有保护性,或者为什么Meta或其他任何在媒体消费方面有既得利益的营利性公司应该被视为现实的可靠守护者。似乎更安全的是认真对待卡利纳的建议,将发布到社交媒体上的任何内容视为由于其不确定的来源和背景而实际上被伪造的,而不是感觉有权相信你看到的一切,除非Facebook告诉你不要相信。依赖内容标签不仅会在媒体素养方面代表一种道德风险(“别担心,媒体平台会为你解释图像”),而且会暗示唯一“安全”的图像是那些一开始就不需要解释的图像。这将用户对图像的兴趣视为严格地从图像中方便地提取信息的问题;从这个角度来看,最好的图像一眼就能被验证为“真实”,并像皮下注射针一样高效地传递其数据负载。这样你就可以更快地消费更多内容。

一个名为“内容真实性倡议”(Content Authenticity Initiative,简称CAI)的科技和媒体行业组织批评了Meta的实施,认为只有“完全由AI生成”的图像才应该被标记为“由AI制作”。CAI 的目标是,为数位媒体的来源制定跨产业的统一标准,为创作者、出版商、社群媒体等提供可参照出处的工具,并赋予阅听众评估其所见之内容是否可信的能力。但这种方法忽略了问题的核心:随着自动化软件工具越来越多地将“生成”和“操纵”两者模糊在一起,区分它们的复杂性。该组织的提议远非启动真实内容,而是利用AI的威胁来试图支持那些无法支持现实的摄影技术以及那些绝对不值得的媒体机构与现实的特殊关系。此外,这种标签将观众视为糟糕的信息处理者,他们期望图像被二分化为真与假,但不再能够依赖他们不可靠的感官,并边缘化了模糊性、未解决性、多义性以及其他与图像互动的美学模式的价值。

“由AI制作”标签假定,通常情况下,任何人都可以通过简单地查看图像来判断哪些照片是“真实的”,而无需任何上下文说明图像为何被制作或传播。这是《纽约时报》2024年6月在其网站上发布的一个测验的隐含主题,标题为“AI正在快速进步。你现在能分辨出什么是真实的吗?”(A.I. Is Getting Better Fast. Can You Tell What’s Real Now?)该测验展示了一系列名人和政治家的图像,其中夹杂着一些引人深思的随机图像,其中一些是机器生成的。与关于深度伪造的常见恐惧宣传相呼应,附带的文案坚称“虚假图像可能会增加人们在网上被欺骗的风险,它们还可能侵蚀公众的信任,使人们更难相信真实的图像。”其含义,如果你错误地相信一张Dwayne “The Rock” Johnson在商场穿着警服的照片是“真实的”,那就证明了AI已经压倒了你的脆弱认知能力,并成为对我们曾经所知的现实的威胁。

假设机器生成的图像很难与“真实”图像区分开来,可能更多地告诉我们媒体环境如何一直影响着我们对所见事物的理解,以熟悉的、公式化的方式塑造“现实”。即使一个人可以在图像表面发现现实,正如《纽约时报》的测试所暗示的那样,这在抽象中仍然是一种无意义的技能,无法提供保护,更不用说满足感了。观众,甚至是新闻消费者,并不总是只想用眼睛享受事实。在实验室条件下发现伪造品并不能说明一个人对“图像的修辞”(引用罗兰·巴特的概念)的理解有多好,并且与观看图像所提供的许多乐趣背道而驰。


Spread from Life magazine, 1947

《纽约时报》的测验让人想起1947年《生活》杂志的一个测验——弗雷德·里钦(Fred Ritchin)在其1990年出版的《我们自己的形象:摄影即将到来的革命》(In Our Own Image: The Coming Revolution in Photography)一书中提到,这是早期尝试应对数字成像对记录的影响——在该测验中,读者被展示了一系列头像,并被邀请决定哪些是罪犯,哪些是神秘作家。表面上的目的是消除读者的面相偏见。“这是一个诱人的测试,外观上看似科学,”弗雷德·里钦写道,但这些照片是“精心挑选的”,目的是让读者犯错,迎合并隐含地强化视觉刻板印象。通过使用与嫌疑人照片相同的灯光和相机角度拍摄作家的照片,《生活》杂志的编辑希望欺骗读者得出结论,使他们质疑自己准确理解世界的能力。正如弗雷德·里钦所说,“《生活》杂志表面上挑战刻板印象,主要展示了杂志在引导读者方面的才能。”

关心《纽约时报》测验中哪些图像是伪造的,并不是关心现实本身,而是关心报纸定义现实的能力,能够将其为编辑效果选择的照片当作可信的真实呈现。它的图像实际上也是生成的,以增强、夸张或净化的形式呈现一个概念。对诸如Facebook上AI生成的“虾耶稣”图像(这个词基本上会让你想到什么)等愚蠢但总体上无害的现象的灾难化,有助于恢复传统媒体中更成熟的摆拍图像形式。如果人们习惯性地假设任何图像都是“不真实的”,除非经过它们的认可,这将符合传统媒体和社交媒体的利益。那么,只有拥有新闻凭证或平台BlueCheck验证的人才能发布“真实照片”。


An example of a 'shrimp Jesus' image on Facebook. Source: The Conversation / Facebook


AI-generated illustration created by Gregory Eddi Jones, 2024, for Aperture

许多机器生成的图像与弗雷德·里钦所嘲讽的“编辑摄影”并没有太大不同:这些图像“借用了摄影的感知权威,同时为了自己的需要操纵图像。”但生成图像并不是借用了摄影的纪实忠实性权威,而是借用了我们经常消费它们的方式:自发地,仿佛它们的直接性不言自明,使得一个抽象的文字提示应该看起来像某种具体的东西。

《我们自己的形象》(In Our Own Image)一书在数字摄影开始普及之际出版,表明消费摄影的乐趣仍然与其自动视觉现实主义紧密相连。“以直接方式拍摄的场景被认为包含了所描绘的人和物体,”弗雷德·里钦写道。“除非明显拼接或以其他方式操纵,摄影的吸引力在于一种内在的感觉,即图像反映了可感知的现实。”在他看来,观众还没有准备好转向“摄影模拟”。他补充说,“如果摄影与物理存在的关系突然变得脆弱,它的词汇将被改变,其表现系统将不得不重新考虑。”

同时也让人们不断的深思熟虑其名词。目前,没有人会不知道照片是如何被操纵和拼接的;几乎每个人都在自己的手机上进行了这种人为操纵。生成模型合成和增强图像的能力已经被广泛、无情地宣传,Meta的“由AI制作”标签等表面上的警告加剧了这种炒作。但这种重新考虑并不是单方面的。随着人们越来越熟练地用图像表达自己,越来越熟悉数字操纵的普遍性,他们并没有相应地变得更加怀疑图像如何欺骗。他们也享受图像可以表达的内容,它们可以澄清的概念,它们可以帮助维持的社会纽带。观众不一定期望图像是现实的视觉记录,但他们也没有完全对摄影保存瞬间的承诺失去信心,精明和否认同时进行。

当然,观众仍然在现实主义中找到一些“摄影吸引力”,但这种对现实主义的渴望不应与对证据的渴望混淆。传播最广泛的图像类型,尤其是现在,并不是“最真实的”,而是那些为吸引注意力而优化的图像。然而,深度伪造并不需要深度关注;它们希望将观看的欲望压缩成表面的瞥视。具有恶意意图的深度伪造依赖于与内容标签相同的逻辑:观众将图像视为绝对真实或虚假,并立即决定是哪一种。它期望被一眼视为真实,将其虚假信息注入不幸的、被欺骗的观众。生成图像将观众从想法快速带到已经渲染的输出,以及带有强化刻板印象的编辑摄影,同样旨在确认偏见的现实主义,将它们当作其他人已经认为的东西。

被体验为真实的东西——看起来“真实”的东西——来自于有说服力的细节,而不是准确的细节。现实主义不是一种记录模式,不是一种忠实程度,而是一组围绕情感吸引力的惯例,一种对共享基本事实的怀旧,“每个人都相信的东西”,而不是对它的无可辩驳的描绘。深度伪造迎合了这样一种观点:可以被病毒式传播的东西会显得越来越真实,直到它通过被重复和报道如此频繁而达到一种类似Swift boat的确定性。图像的恶名成为其主要背景,如果不是“真实”的东西被捕捉到,就覆盖了图像中所代表的内容。“现实主义”的概念成为一种参与的消费模式。现实存在于传播中,而不是事件中。

但由于我们与现实主义的关系是赋含强烈的情感,它并不是通过在现实测试中为图像分配通过/失败等级来解决的。将我们悬在两者之间或不同解释之间的图像可能更具吸引力,也更具参与性,并且像病毒一样传播(正如2015年关于“裙子”颜色的争论所证明的那样)。享受“现实主义”不仅仅是抓住验证和认证的时刻,它也是被悬在现实与可能之间。

人们可能会称这些图像为“深度真实”,这是社会理论家内森·尤根森(Nathan Jurgenson)用来描述最近在内布拉斯加州龙卷风爆发期间拍摄的视频的短语。对许多人来说,这些片段中的龙卷风看起来太真实了,以至于不像是真实的——太像图像生成器会生成的东西。唐纳德·特朗普在暗杀未遂后的标志性形象是另一个例子。深度真实是当记录的现实具有伪造的语法,即计算机生成的图像模拟时发生的事情。这是一种依赖于生成图像的普遍性以及对深度伪造的普遍焦虑的真实性。它们与加速的视觉消费非常吻合;它们是“真实”的图像,突出了实际上并未使用的特效。

这些图像并没有让预想的、非常渴望的世界观念消失在理所当然的视觉中;相反,它们通过其非常合适或明显性,坚持图像的形式品质与其内容之间存在某种张力。与其像深度伪造那样试图压制我们的怀疑,深度真实在更深层次上引发这种怀疑,图像的即时效力削弱而不是确认其真实性。当深度伪造呈现一个想法时,它故意隐藏操纵和说服技术的使用,试图因此看起来像一张“真实照片”。而当深度真实给我们一个现成的概念时,它突出了应该被视为操纵的东西,挑战我们重新看待它。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号