资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

纯Web视频剪辑：基于WebCodecs API的技术实现详解

创作时间:

作者:

@小白创作中心

纯Web视频剪辑：基于WebCodecs API的技术实现详解

引用

来源

https://www.bilibili.com/read/mobile?id=39619095

WebCodecs API为Web平台提供了音视频编解码能力，使得在Web平台上实现高效、专业的视频剪辑成为可能。本文将详细介绍如何使用WebCodecs API实现视频剪辑功能，包括素材管理、画布模块、时间轴模块等核心功能的实现原理。

背景 & 方案

为了解决主播投稿场景中需要对直播视频进行简单编辑的需求，我们需要开发一款轻量视频剪辑产品，让用户能在线上完成直播-编辑-投稿的完整流程。

现有Web平台的剪辑产品实现方案主要有以下几种：

云端：网页提供剪辑UI，用户操作同步到云端进行剪辑
ffmpeg.wasm：将ffmpeg编译为wasm，在网页中剪辑
WebCodecs：使用WebCodecs API编解码视频数据，配合Web API与第三方库实现剪辑

方案分析

WebCodecs方案在成本与扩展性方面有明显优势，但生态成熟度和兼容性略显不足；云端方案是当前主流选择，如果项目成本预算足够正好可以与WebCodecs互补；ffmpeg.wasm因性能太差，无法应用。

WebCodecs方案

优势

成本：只需要少量Web开发即可完成前端剪辑功能，节省开发成本的同时，降低了技术复杂性，且不需要服务器运行、维护成本
扩展性：能轻松与Canvas、WebAudio配合，实现自定义功能

缺点

生态成熟度：没有直接可用的转场、滤镜、特效等功能，支持的封装格式有限
兼容性：WebCodecs API需要Chrome/Edge 94+（约10%的用户不兼容）

结合产品定位（轻量剪辑工具）与用户特征（主播），对缺点的包容性较高，因为：

生态不成熟并非能力限制，所以是开发成本问题，已有功能能满足当前产品的需要
兼容性其实是时间问题；当前做好提示，引导用户升级浏览器版本

功能分析

开发一个剪辑产品，只需要三个步骤：

实现素材管理模块
实现画布模块
实现时间轴模块

每个模块下都包含许多小功能，比如素材管理、缩略图、预览播放，最终都可以拆解成基础能力，然后基于Web平台提供的API来实现。

接下来介绍这些基础能力的实现原理，掌握基础能力即可构建完整的剪辑产品功能。

基础能力实现

素材存储

音视频素材体积一般都比较大，上传下载都有一定的时间、带宽成本。以前在Web平台读写文件有很多限制，现在可借助OPFS API，能较大提升用户体验。

OPFS中文名是“私有源文件系统”，相当于浏览器给每个网站开辟了一个私有的存储空间，Web开发者借助这个API在私有空间中创建、读写文件，不需要用户授权，相比读写用户空间的文件性能也会更好一些。

素材解析

我们都知道视频是由一系列图片组成的。音视频原始数据量非常庞大，为了方便存储、传输，需要将原始数据压缩、封装成常见的音视频文件。

将图像帧压缩后成组（时间连续的图像往往非常相似，成组压缩率更高）
许多压缩帧组再加上描述信息（压缩算法、时长、字幕等），构成音视频文件

图像帧压缩后分为I/P/B三种类型，I帧起始加上其后的P/B帧构成一个分组（Group of Pictures）。

处理音视频数据的第一步就是解析文件，目的是得到音视频原始数据，反向构建过程即可：

视频文件 -> 解封装 -> 压缩帧 -> 解码 -> 原始图像帧

使用第三方库（如mp4box.js）解封装视频文件，得到压缩帧
使用WebCodecs API解码压缩帧得到原始图像帧

EncodedVideoChunk（压缩帧）可通过VideoDecoder（解码器）转换为VideoFrame（原始图像帧）。

视频寻帧、遍历帧

因为视频文件体积通常比较大，不可能全部加载到内存中，所以一般是按需从磁盘读取数据然后解码。

比如为视频第10～20s的图像嵌入水印，过程如下：

寻找到10s～20s的帧在文件中的位置
从磁盘读取对应的帧然后解码，得到原始图像
在图像上绘制文字，然后重新编码生成新的压缩帧

以上可知，寻帧、然后流式遍历帧是音视频处理的第一步。前文提到视频文件的帧是成组的，组内的帧分了不同类型，所以寻帧、解码也需要按一定顺序处理。

图像帧序列（显示顺序），其中帧类型与解码顺序的关系，注意序号与帧类型。

图像处理

了解了上述的知识点，现在已经可以随意读取或遍历视频文件的所有图像帧了。

简单图像处理，如在原图像上绘制新的内容（文字、图片），或进行简单的滤镜处理，通过Canvas API即可实现。

复杂图像处理，如绿幕抠图、特效、自定义滤镜等，需配合WebGL Shader代码实现。WebGL Shader代码在GPU中运行，能高效并发处理每帧图像中的所有像素值。

空间、时间属性

空间属性指素材的坐标、大小、旋转角度。导出视频时，根据时间获取素材的的图像帧，动态设置当前时刻图像帧的空间属性，即可实现动画效果。

比如，一个图片素材的平移动画（0s～1s，坐标x10～100），0.5s时素材图像帧坐标为x=(100-10)*(0.5/1)。

时间属性指素材在视频中出现的时间偏移、持续时间。用这两个属性可描述素材在视频时间轴上的位置；当素材支持空间、时间属性后，不仅能通过程序动态设置其属性实现动画效果，还能用于实现让用户通过鼠标操作来控制（拖动、缩放、旋转等）素材。

总结

了解以上基础能力的原理，再加上些许耐心与时间就能实现视频剪辑的大多数功能了
以上的基础能力除了剪辑场景外，还能应用于端上的视频批量处理、直播推流、播放能力增强等场景
在Web平台处理音视频仍有许多细节，以及需配合大量的其他API，继续探索可阅读系列文章、使用开源的WebAV SDK。

热门推荐

最高法最新解读：代位求偿在保险理赔中的关键作用

石狮法院教你如何用代位求偿维权

胸口疼痛部位对照表：精准识别

曼陀罗花的神秘象征与深远寓意（探索曼陀罗花的精神之旅）

全脂牛奶vs脱脂牛奶：高血压患者的饮食新选择

高血压患者必知！高钠食品黑名单大揭秘

学会这3招，轻松应对情绪困扰！

打麻将真的能缓解情绪吗？哈佛80年研究给出惊人答案！

"兵马俑门票政策：儿童是否需要购票及收费标准"

古代避孕大法VS现代避孕神器：谁更靠谱？

理想旁路二极管：智能化光伏组件的关键创新

碧根果：心脏健康的秘密武器？

碧根果真的能护心？科学研究揭示其惊人效果！

PFC电路中旁路二极管的关键作用与设计要点

PFC旁路二极管：汽车电路的关键守护者

《难哄》教你掌握恋爱见面技巧

办公室恋情分手后，如何优雅地面对职场社交？

分手后如何保持心理健康：从专业建议到实际案例

分手后如何快速恢复？这6个情绪阶段帮你走出阴霾！

黄翡翠的招财效果与寓意：揭秘其风水作用及选购要点

秋冬肠道健康的守护者：双歧杆菌三联活菌使用全攻略

了解生成式 AI 的技术生态系统

单词candle的多种含义与用法

你真的知道一个番茄钟是多长时间吗？详解番茄工作法的时间管理技巧

侯智薰教你用邀请函加强职场内部沟通

中国如何培养气候世代