← ブログ一覧へ戻る

音声連動テレプロンプターの仕組み: VoiceScrollはどう動くのか

音声テレプロンプター音声認識VoiceScroll

一般的なテレプロンプターは、設定した速度で一方的に流れます。少し詰まるだけで原稿が先に行き、逆に間を取ると画面を待つことになります。VoiceScrollはここを変えます。話した内容に合わせて、原稿の位置を追いかけます。

固定速度が合わない理由

実際の話し方は一定ではありません。説明が順調なところは速く、重要なところはゆっくり、言い直しや間も入ります。固定速度のスクロールでは、自然に話す代わりに機械へ合わせることになりがちです。

VoiceScrollの仕組み

  1. 原稿を読み込むと、アプリが文章を追跡しやすい形に整えます。
  2. 開始するとマイクが有効になり、Appleの音声認識が端末上で音声を処理します。
  3. 認識された語句を原稿と照合し、今いる位置まで表示を追従させます。
  4. 読み終えた部分は薄くなり、現在位置が見えるようにスクロールします。

端末内で処理される

音声はサーバーに送られず、処理は端末内で完結します。回線待ちがないので反応が速く、収録場所の通信状況にも左右されません。日本語を含む9言語に対応しているので、多言語の原稿でも同じ感覚で使えます。

向いている場面

  • 途中で止まったり言い直したりする動画収録
  • 質疑応答や拍手で間が入るプレゼン
  • 日本語や中国語など、固定速度だと読みづらい原稿
  • 長文を自分のペースで読みたい収録

VoiceScroll を無料で試す

話すペースに合わせてスクロールする音声連動テレプロンプター。