易学社
第二套高阶模板 · 更大气的阅读体验

后期字幕制作流程:从听写到导出,一气呵成

发布时间:2026-01-24 13:10:25 阅读:3 次

上周帮朋友剪一条旅行Vlog,他发来一段3分钟的4K素材,说‘字幕你顺手加一下吧’。我打开AE,导入音频波形,拖着时间轴逐句对齐——结果发现他说话带口音、背景有风声、还有两处突然的笑声盖住了人声。字幕不是打完文字就完事,它是一整套环环相扣的活儿。

第一步:听清再动笔

别急着开软件。先用耳机听三遍:第一遍抓大意,第二遍记断句和语气停顿,第三遍抠细节词(比如‘这事儿咱得捋一捋’里的‘捋’,别打成‘缕’)。手机录音或现场收音常有杂音,建议用Audacity快速降噪:

效果 > 噪声抑制 > 获取噪声样本(选1秒纯噪音段)> 应用
处理后,字幕员耳朵能轻松不少。

第二步:时间轴上‘钉钉子’

主流做法是用Arctime或CapCut做初稿:导入视频,语音识别自动生成时间轴+文本。但识别率在75%左右,尤其遇到方言、专业词、语速快时,得手动调。关键技巧是‘分段对齐’:把一句话拆成2–3个时间点,比如‘今天去爬山(00:12:03–00:12:06),结果半路下大雨(00:12:07–00:12:11)’,中间留0.3秒呼吸空隙,观众看着不累。

第三步:字体和位置不是随便选

黑体字+白色描边+半透明黑色底衬,是B站和小红书最不吃亏的组合。位置固定在画面底部1/6处,避免遮挡人物下巴或字幕条。一行别超18个汉字,超过就断句——‘这个方案我们下周三前必须敲定’不如拆成‘这个方案,我们下周三前/必须敲定’。

第四步:导出别只盯SRT

SRT适合上传平台自动匹配,但本地播放常错位。如果交付给客户或投屏展示,优先导出硬字幕(Burn-in):用Premiere新建序列,把字幕轨道拖进主时间线,导出时勾选‘嵌入字幕’;或者用FFmpeg命令行压入:

ffmpeg -i input.mp4 -vf "subtitles=subtitle.srt" -c:a copy output.mp4
实测比软字幕少90%的兼容性翻车。

字幕不是翻译的搬运工,是观众和内容之间的那层玻璃——太厚看不清,太薄挡不住反光。做熟了,你会发现,一个准点出现的‘嗯…’停顿,比十句华丽文案更让人信服。