资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

什么是AI视频压缩？AI视频压缩的原理及未来

创作时间:

作者:

@小白创作中心

什么是AI视频压缩？AI视频压缩的原理及未来

引用

来源

https://www.nxrte.com/jishu/21823.html

AI视频压缩技术正在改变我们处理视频文件的方式。与传统的压缩方法不同，AI视频压缩通过理解视频内容来实现更高效的压缩，同时保持高质量。本文将为您详细介绍AI视频压缩的原理、现状及未来前景。

AI视频压缩是一场充满潜力并得到大型科技公司支持的AI革命。事实上，H.265和ProRes等现代视频编码器现在正受到由AI支持的新型智能视频压缩的挑战。这些AI视频编码器不一定要压缩视频文件，而是根据上下文和参考图像重建视频文件，以便在大幅减少文件大小的情况下保持质量。

今天使用哪些视频编码器？

顾名思义，编码器实际上是“压缩”和“解压”的组合词。因为这就是编码器的作用：压缩和解压。

视频和音频的编码器提供“有损”或“无损”压缩。有损压缩牺牲了文件的一些数据以使文件更有效，而无损压缩则包含所有的原始数据。大多数视频编码器都属于有损压缩。

可用的编码器类型之间也有区别：交付型、中间型和采集型。

交付编码器——用于广播和播放

H.264 (AVC)
H.265 (HEVC)
AV1
VP9
WMV

中间编码器——用于视频编辑

ProRes 422 和 4444
DNxHR
DNxHD
CineForm

采集编码器——用于采集视频

ArriRaw
Blackmagic Raw
Redcode Raw

我们中的许多人没有意识到我们身边有多少编码器，从电话到甚至我们消费的广播内容。事实上，看电视基本上是在实时见证压缩-解压过程。

为什么我们需要更好的视频编码器？

我们需要更好的视频编码器有几个原因，但主要是因为高分辨率视频文件已经变得大得离谱，而且一直在变大，部分原因是6K、8K、甚至12K分辨率的内容。

从Netflix、Amazon Prime、HBO Max或Disney+流式传输4K视频也会占用大量带宽，社交媒体平台驱动的视频消费也是如此。

事实上，视频在网络世界中无处不在：

全世界普通人每天观看大约84分钟的视频。
早在2018年，思科就预测视频将占全球所有网络流量的82%（当时为75%）。
到2022年，仅视频流就占所有移动数据消费的70%以上。爱立信表示，到2027年，这一数字将增加到80%。

以上对于视频创作者和消费者来说是个好消息，但问题是视频占用了大量空间。消费者也已经习惯于按需提供高质量视频。

最重要的是，传统的编码器是愚蠢的，因为它们不知道自己在做什么或正在压缩什么图像——它们只是压缩和解压缩像素，仅此而已。

什么是AI视频压缩？

传统的视频压缩会删除一些视觉信息，以减小视频的整体文件大小。AI视频压缩检查视频的内容以在更小的范围内重新创建它。换句话说，它创建了原始视频的超逼真副本。

这是因为“AI视频压缩”是基于机器学习(ML)的视频压缩（有时称为神经压缩）。机器学习算法或模型学习执行任务并根据人类提供的相关训练数据（在本例中为视频资料）进行评估。

这些模型已经学会了人脸是什么样子以及如何移动的概念模式，以及更广泛的环境模式，例如“船通常出现在水上”。

事实上，目前已经存在多种AI视频编码器，包括：

NVIDIA的Maxine
谷歌的VP9
AIVC
AccMPEG

让我们来看看AI视频压缩究竟是如何工作的。

AI压缩的工作原理

说明AI视频压缩工作原理的最简单方法之一是将其视为一件矢量艺术作品。

矢量艺术是：

从参考图像创建。
使用数学元素重新创建图像资产。
可无限扩展。

NVIDIA的Maxine视频编码器等AI压缩器的运行方式类似。他们使用参考图像（例如，每分钟一帧画面）来确定色彩平衡并隔离其他控制点，例如背景、前景、主体的面部和运动。

编码器在压缩时对这些数据进行映射，然后在解压时通过一个称为重新合成的过程填补细节，对其进行重建。

为什么要这样做？

视频背景

如前所述，传统的编码器不会对被压缩的媒体进行背景分析。他们在逐帧的水平上查看数据，看看哪些内容可以被删除而不影响整体质量。它们不知道视频中是否有说话的人、在高速公路上行驶的汽车、正在捕食的熊等等。这可能导致对其他重要数据的苛刻压缩。

带宽友好

通过只发送每一帧的基本信息，本质上是通过发送数学元素（小）而不是像素（大）——并在运行中重建帧，AI压缩是带宽友好的并且可以无限扩展。通过这种方式，AI编码器与thispersondoesnotexist背后的技术并没有什么不同，它可以为不存在的人创建逼真的图像。

升级

但这些编码器不仅仅是压缩视频；它们还可以通过其无限的可扩展性提高视频质量。由AI编码器编码的视频内容可以从头开始重建，以适应任何分辨率和帧率。在这方面，AI视频压缩很像视频升级，它使用类似的过程来提高旧视频和电影内容的质量。

视频压缩的未来是什么？

如果你想知道目前的人工智能压缩工具是否会把大多数其他编码器推到不重要的位置，答案是：可能不会。

首先，如果AI压缩重新创建图像，它会引出一个问题，新的输出是否与原始图像一样详细？这是一个常见的反对意见——但解决方案正在发挥作用。

但主要是，设备制造商总是会制作适合其用例的编码器。大多数相机都在设备本身的ASIC或FGPA式芯片上嵌入了定制的采集编码器。这不会很快改变，所以我们可能会一直使用Apple编码器、Sony编码器、ARRI编码器、Red编码器和其他设备制造商的编码器。

制造商肯定会继续这样做，因为他们以特定于相机文件格式的方式压缩相机数据。

但对于中间和交付编码器，AI视频压缩是一个巨大的变化，将提供天文数字的性能优势。

AI视频压缩简述

编码器已经存在很长时间了，但由于高分辨率视频对带宽和内存的需求不断增长，H.265等现代编码器最近承受着巨大的压力。

这就是为什么新一代基于AI的编码器可以更有效地压缩视频，通过无限可扩展性提高视频质量，并且与传统编码器不同——意识到它们正在编码的内容，现在已经加入了竞争。

基于机器学习和深度学习技术，这些编码器成为视频制作和后期制作工作流程中不可或缺的工具，可能只是时间问题。