Web会議で自動的に字幕テロップを表示するツールが凄い

Web会議

Web会議って何を喋っているか聞こえない時がある。字幕テロップが表示できたら良いのに。

コロナの外出自粛の影響で、Web会議システムを使う機会が増えた方も多いかと思います。Web会議では1人1人の発言が聞き取れず、何を言っていたか分からなかった、という事も多いかと思います。

この記事では、落合陽一さんの研究室で開発された発話内容を認識してWeb会議画面に字幕テロップ自動的に表示する方法について、紹介します。

Web画面に字幕テロップを表示するツール

落合陽一さんの研究室で開発された音声認識の仕組みが注目を集めています。

音声認識とは、発話した内容をAIが自動的に認識してテキスト化する技術で、自動議事録作成ツールや、自動テープ起こしツールなどで活用されています。

この技術を活用し、Web会議の画面上発話内容を文字化したテキストが表示するのが、今回のツールの仕組みです。

元々は聴覚障碍者の方向けに、Web会議での参加者の発言を理解するのを助けることを目的として開発されたもののようですが、普通のWeb会議にも有用だということで、このように公開されたようです。

ツールは、こちらで公開されています。PCもしくはAndroidのChromeでしか動作しないためご注意ください。

Speech to Text Webcam Overlay
Web Speech API で音声認識した結果の字幕をWebカメラ映像に重ねて表示するWebページです。ブラウザを画面収録して,ビデオ会議や生配信等で使用できます。

(2020年5月28日追記)
新たに自動翻訳と、ログダウンロードの機能が追加されていました。

GoogleTranslate APIを活用して、発話内容をリアルタイムで翻訳して画面表示することができます。
これにより、多言語を用いる会議でも、特に言語の違いを気にすることなく相手の言語を理解できるようになるかもしれません。まさに、ドラえもんの翻訳こんにゃくの世界ですね!

ログダウンロードは、議事録やエビデンスの作成に役立ちますね。迂闊なことは言えないですが・・・

動作の様子

以下の動画を見てもらうと分かるように、多人数で行うWebミーティングで各自の画面に発言内容が字幕表示されており、各自の発言がよくわかります。

動作制限について

このツールは、WebSpeechAPIというAPIを使用しており、このAPIが動作するブラウザでしか動作しません。
PCでは、ChromeとEdge、スマートフォンではAndroidのWebViewとChromeで動作します。Web会議はPCで使用することが多いかと思いますので、ChromeとEdgeで使用できれば問題はなさそうですね。

対応するWeb会議システム

検証したわけではないので、確かなことは言えないですが、ブラウザに字幕を表示させ、Web会議では画面共有してそれを見せるという疎結合なシステムなため、基本的には、どのWeb会議システムでも活用できると思われます。

ただし、企業などでChromeの使用を禁止されている場合などは使用できないので、ご注意ください。

他にも字幕テロップ表示ツールがあった

「Yoshiki NAGATANI」さんは、PC+Android+無料ツールで、同じように字幕テロップを表示できる方法を提案されています。
ただ、PCのスペックを要するらしく、PCに詳しく環境を用意できる方向けであるため、万人向けではないようです。

まとめ

Web会議画面に字幕テロップを表示するツールを紹介しました。今後は何でもWeb化が促進すると考えられます。このような音声の字幕化の仕組みは、必要性が増していくでしょう。

この音声認識APIは、私自身も使ったことがあり、精度は中々高かったです。私自身は当時、さしたる活用方法が思いつかずAPIの検証どまりでしたが、このように実用的なレベルまで作りこめるアイデアが素晴らしいと感じました。


音声認識は、精度が課題になっていますが、機械学習によりデータが溜まるほど飛躍的に制度が向上するため、今後ますます高精度の仕組みが登場するでしょう。

 

Amazon1位のWebカメラ!売れすぎて品薄中

一番売れているZoomの書籍

電子書籍ならこちら(Amazon Kindle)

ブログランキング・にほんブログ村へ

コメント

タイトルとURLをコピーしました