语音控制提词器是怎么工作的:VoiceScroll 原理解析
语音提词器语音识别VoiceScroll
普通提词器会按照你设定的速度一直往上滚。你一停顿,稿子就先跑了;你想留一点空白,反而要等屏幕追上来。VoiceScroll换了一个思路,它不是让你跟着文字跑,而是让文字跟着你说话的节奏走。
为什么固定速度总是别扭
真实讲话不会匀速。熟悉的部分会快一点,重点会慢一点,中间还会停顿、重说、换个表达。固定速度忽略了这些变化,结果就是你在配合机器,而不是自然开口。
VoiceScroll怎么跟上你的声音
- 导入稿子后,应用会先整理文本,方便后面定位。
- 点开始后,麦克风开启,Apple 的语音识别会在设备上实时处理你的声音。
- 识别出的内容会和稿子做匹配,定位到你当前说到的位置。
- 已经说过的部分会淡出,当前位置保持可见,页面自动跟着移动。
全部在设备本地完成
音频不会上传到服务器,处理都在手机或平板本地完成。没有网络往返延迟,也不怕现场网络差。它支持包括中文、日语在内的 9 种语言,所以多语言稿件也能按同样的方式使用。
最适合的场景
- 录视频时需要停顿、重来或临时改句子
- 演讲中会被掌声、提问打断
- 中文、日文这类不适合固定滚速的稿件
- 长稿录制,希望始终按自己的节奏说