← 返回博客

语音控制提词器是怎么工作的:VoiceScroll 原理解析

语音提词器语音识别VoiceScroll

普通提词器会按照你设定的速度一直往上滚。你一停顿,稿子就先跑了;你想留一点空白,反而要等屏幕追上来。VoiceScroll换了一个思路,它不是让你跟着文字跑,而是让文字跟着你说话的节奏走。

为什么固定速度总是别扭

真实讲话不会匀速。熟悉的部分会快一点,重点会慢一点,中间还会停顿、重说、换个表达。固定速度忽略了这些变化,结果就是你在配合机器,而不是自然开口。

VoiceScroll怎么跟上你的声音

  1. 导入稿子后,应用会先整理文本,方便后面定位。
  2. 点开始后,麦克风开启,Apple 的语音识别会在设备上实时处理你的声音。
  3. 识别出的内容会和稿子做匹配,定位到你当前说到的位置。
  4. 已经说过的部分会淡出,当前位置保持可见,页面自动跟着移动。

全部在设备本地完成

音频不会上传到服务器,处理都在手机或平板本地完成。没有网络往返延迟,也不怕现场网络差。它支持包括中文、日语在内的 9 种语言,所以多语言稿件也能按同样的方式使用。

最适合的场景

  • 录视频时需要停顿、重来或临时改句子
  • 演讲中会被掌声、提问打断
  • 中文、日文这类不适合固定滚速的稿件
  • 长稿录制,希望始终按自己的节奏说

免费试用 VoiceScroll

会根据你说话节奏自动滚动的语音提词器。