问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

搬运并翻译YouTube视频的方法分享

创作时间:
作者:
@小白创作中心

搬运并翻译YouTube视频的方法分享

引用
1
来源
1.
http://www.bilibili.com/read/cv37243781/

随着YouTube等海外视频平台的内容越来越丰富,许多优质视频需要被搬运到国内平台。本文将详细介绍如何搬运并翻译YouTube视频,包括素材准备、AI辅助翻译、配音制作等关键步骤。

一、素材准备

1. 视频下载

推荐使用以下工具进行视频下载:

不同视频可能需要不同工具。FreeTube 最通用但需要分别下载音视频;IDM 最便捷,建议购买正版(约100元);可先尝试免费的 Neat Download Manager。

2. 音视频转文字

使用阿里通义平台 (https://tongyi.aliyun.com/qianwen/) 的效率模块 (https://tongyi.aliyun.com/efficiency/home)。上传视频后转写自动生成字幕,下载 SRT 格式字幕文件。通义转写的字幕质量通常优于 YouTube 自动生成的字幕。

二、AI 辅助翻译

1. 选择 AI 模型

推荐使用最新、最强大的大语言模型,如 Claude 3.5 和 GPT-4。国产模型可能难以处理长篇复杂提示词,谨慎使用。

2. 翻译流程

将英文字幕和相关背景资料复制到 AI 对话工具中,使用文末的提示词模板进行翻译。仔细检查翻译结果,确保时间轴与字幕内容匹配。非顶级 AI 模型可能产生各种错误,影响翻译质量。

三、配音制作

  1. 导入字幕到剪映等视频编辑软件。
  2. 选择 TTS(文字转语音)引擎,可使用剪映内置功能或其他第三方 TTS 工具。

注:本指南假定用户具备基本的视频编辑和 AI 工具使用经验。如需更详细说明,请告知。

四、提示词实例

<task>
我将英语视频的转写文本<"文本文件" />发给你,
<文本文件>
1
00:00:00,010 --> 00:00:03,510
you ask for it,it hits here, flux in Forge
2
00:00:03,530 --> 00:00:06,200
So you can see up here we have this UI selection
3
00:00:06,260 --> 00:00:11,080
We have selected Flux here we have the Flux dev Bnb and F 4 checkpoint
4
00:00:11,090 --> 00:00:15,610
and we have a prompter regenerated cyberpunk sign that reads Flux in Forge
5
00:00:15,620 --> 00:00:16,940
And if I generate this again
6
00:00:16,990 --> 00:00:18,540
it's going to take about 12 seconds
7
00:00:18,550 --> 00:00:22,590
And then we're going to have a new flux image in Forge
……
【这里省略中间内容,就是个示例】
252
00:09:40,150 --> 00:09:40,940
thanks for watching
253
00:09:41,320 --> 00:09:41,690
see
</文本文件>
请将其翻译成中文,具体要求如下:
<TranslationRequirements>
- 原始文本可能有转写错误,请根据<Reference target="专有名词"/>、<Reference target="背景资料"/>等,确保翻译准确表达视频的内容。
- 最终输出的结果应该用中文呈现,是非常的口语化,没有带一点翻译腔调,完全是本地化的中文表达方式,可以适度地创新,让字幕很有活力,因为我是一个可爱的女生,要根据字幕配音。
- 确保翻译成中文后与视频画面和音频的同步,总时长一致。
- 请严格按照srt字幕文件的格式要求输出结果:
<srt_format>
- 每个字幕片段以序号开始,后接换行符;
- 序号后是字幕的起始和结束时间戳,格式为"小时:分钟:秒,毫秒",起始和结束时间戳之间用" --> "分隔,后接换行符;
- 时间戳后是字幕文本,可以单行也可以多行,多行之间用换行符隔开;
- 每个字幕片段之间用一个空行分隔。
- 请用Claude的artifacts特性再右边单独展示这个文档。
</srt_format>
</TranslationRequirements>
</task>
<专有名词>
专有名词保持英文:
- ancestral SD
- AuraFlow
- AnimateDiff
- automatic 1111
- batch size
- BrushNet
- Civic
- CivitAI
- CFG scale
- checkpoint
- Chibi
- ComfyUI
- conditioning
- ControlNet
- controlnet_aux
- ControlNet Union ProMax
- cosXL
- DDIM
- Differential Diffusion
- DenseDiffusion
- deis
- denoise
- Dream Shaper
- DPM adaptive
- DPM++ 2M
- DPM++ 2M Karras
- DPM++ 2MS
- DPM++ 3MS
- DPMPP_3M_SDE_GPU
- embeddings
- Euler
- Euler_cfg_pp
- Flux
- exponential
- exponential SGM
- GroundingDINO
- hugging phase
- Hugging Face
- HelloWorld XL
- insightface
- IP Adapter
- IP-Adapter
- IPAdapter
- Ic
- IDM VTON
- Inspyrenet-Rembg
- Karass
- latent space
- loader
- LoRA
- lanczons
- LexicatDat
- model page
- normal
- noise parameter
- noise strategy
- Nerdy Rodent:youtube channel of AI Tutorials
- pipeline
- Pixart Sigma
- Pixart Sigma 900M
- PowerPaint
- prompt
- proteus v0.4
- PhotoMaker
- Rybu
- SDXL
- seed
- segment anything
- softedge
- Stable Diffusion
- steps
- SUPIR
- tensor shape debug
- text prompt
- textual inversion
- time stepping
- token
- tokens
- tile
- UNI_PC
- UNET
- upscaled latents
- VAE
- word weighting
- WD14 tagger
专有名词翻译为特定中文:
- average: 平均
- base noise: 基础噪声
- batch: 批处理
- channels: 通道
- clip: 文本编码器
- conditioning average: 条件平均
- conditioning combine: 条件合并
- conditioning concat:条件拼接
- conditioning timestep:条件插入时间
- conditioning: 条件设定
- decode: 解码
- denoise:去噪
- dimensional size: 尺寸
- embeddings: 嵌入
- encode: 编码
- guidance scale: 引导比例
- inpaint: 局部重绘
- KSampler:K采样器
- latent: 潜在空间
- mask: 遮罩
- noise: 噪声
- outpaint: 扩图
- prompt: 提示词
- perturbed attention guidence:扰动注意力引导
- Queue Prompt:生成
- resolution: 分辨率
- sampler: 采样器
- scheduler: 调度器
- steps: 步骤
- strength: 强度
- tensor: 张量
- textual inversion: 文本反转
- variance: 方差
- word weighting: 词权重
</专有名词>
<背景资料>
【这部分就是给一些视频的背景资料,项目的主要说明,介绍等,不需要太长】
</背景资料>
</prompt>
© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号