语音转文字

过去语音转文字给你的是一份文档,这里给你的是画面上的字幕。上传视频,Recapo 会听清里面说的话,把每一句变成清楚易读的字幕,再直接烧进画面——文字跟着视频一起走,而不是另存成一份文件。

不用设置,事后也不用再拼接什么。你交一段片子,AI 负责听写和落字,你拿回的是一段做好的带字幕视频成片(MP4),可以在页内直接预览,一键下载。

实时预览
上传视频后这里会显示画面,字幕样式即调即看字幕样式实时预览
现成字幕文件(可选,SRT / VTT / ASS)
识别语言
每条最多字数
配色
字体
字号(占画面高度 %)
垂直位置(%,越大越靠下)
底框

点击开始即在本页处理;处理期间请勿离开本页,离开将取消任务。

导出文字
上传音视频AI 识别导出文字

文字留在画面上,不在另一个文件里

这里的语音转文字,要的不是一份还得自己管理的文字稿,而是一段观众真的能边看边读到字的视频。Recapo 识别语音、写成字幕、再把字幕烤进画面,做好的片子走到哪都带着文字:在信息流里静音播放、在手机上、在会丢掉字幕轨的播放器里都行。一个文件,字幕在内,不用再额外附带。

  • 采访与播客:把回答里的话变成画面字幕,片子一边播观众就能读到原话。
  • 讲座与演讲:把每一个口述要点都做成烤进视频的字幕,方便静音观看。
  • 社媒与信息流视频:交付一版关掉声音也读得懂的带字幕成片,不必再管字幕文件。
导出文字
上传音视频AI 识别导出文字

从一段人声音频,到一段做好的带字幕视频

AI 一遍走完听写和落字:识别语音,把它变成跟着说话节奏走的字幕行,再渲染进画面。出来的是一段完整的带字幕视频——不是脚本,也不是事后要去对齐的文件——可在页内预览、下载为 MP4。语音进去,一段能看、带字幕的成片出来。

How it works

如何使用 Recapo 语音转文字

三步完成,全程在云端进行,无需安装任何软件。

上传音视频

步骤1:上传你的视频

上传本地视频文件,也可以用链接导入。采访、口播、讲座、播客视频都可以。

AI 识别

步骤2:让 AI 识别语音

AI 语音识别会听清音频里说的话,把台词变成干净、易读的字幕行,并和画面上说话的节奏对齐。

导出文字

步骤3:预览并下载带字幕成片

字幕已经烧进画面。在页内预览做好的视频,再下载这段带字幕的 MP4——文字和画面合在同一个文件里。

免费使用
FAQ

关于语音转文字的常见问题

我拿到的是文字文件还是视频?

是视频。Recapo 把说的话变成字幕、烧进画面,你下载的是一段做好的带字幕 MP4——文字和画面在一起,留在视频里,而不是另存成一份文字稿。

我该上传音频还是视频?

上传视频。Recapo 会听清视频音轨里的语音,写成字幕,再把字幕渲染回同一段视频——所以你下载的就是这段带字幕的片子。

如果人名或专业术语识别错了怎么办?

对于清晰的语音,AI 识别表现不错,结合上下文也能认对大多数人名和术语。字幕和语音对齐、烧进最终视频,文字始终对应着画面上正在说的内容。

它和字幕生成有什么区别?

语音转文字给你的是一份完整、可编辑的文字稿,方便用来写脚本、做笔记或搜索内容。字幕生成则是把台词做成跟语音对齐、显示在画面上的字幕行。很多创作者会先转出文字、改好文案,再据此做字幕。

准备好用语音转文字了吗?

语音转文字,落到画面上。上传视频,AI 识别其中的人声台词、变成字幕,并直接烧进画面,输出一段带字幕的视频成片,可在页内预览并下载。Recapo.ai。

免费使用