音声連動テレプロンプターの仕組み: VoiceScrollはどう動くのか
音声テレプロンプター音声認識VoiceScroll
一般的なテレプロンプターは、設定した速度で一方的に流れます。少し詰まるだけで原稿が先に行き、逆に間を取ると画面を待つことになります。VoiceScrollはここを変えます。話した内容に合わせて、原稿の位置を追いかけます。
固定速度が合わない理由
実際の話し方は一定ではありません。説明が順調なところは速く、重要なところはゆっくり、言い直しや間も入ります。固定速度のスクロールでは、自然に話す代わりに機械へ合わせることになりがちです。
VoiceScrollの仕組み
- 原稿を読み込むと、アプリが文章を追跡しやすい形に整えます。
- 開始するとマイクが有効になり、Appleの音声認識が端末上で音声を処理します。
- 認識された語句を原稿と照合し、今いる位置まで表示を追従させます。
- 読み終えた部分は薄くなり、現在位置が見えるようにスクロールします。
端末内で処理される
音声はサーバーに送られず、処理は端末内で完結します。回線待ちがないので反応が速く、収録場所の通信状況にも左右されません。日本語を含む9言語に対応しているので、多言語の原稿でも同じ感覚で使えます。
向いている場面
- 途中で止まったり言い直したりする動画収録
- 質疑応答や拍手で間が入るプレゼン
- 日本語や中国語など、固定速度だと読みづらい原稿
- 長文を自分のペースで読みたい収録