[スタートアップ紹介Vol.44] Verbit AI
イスラテックインターンが、AI と人の力によって、一般的な言語から専門的な言語まで幅広い範囲で、正確かつ素早いテキスト化を行うことができる技術を開発している 「 Verbit AI 」について、代表加藤に伺います。
Verbit AI とは、そもそも、どんな会社でしょうか?
Verbitは、人工および人間の知能の力を利用して、正確な文字起こしと字幕のソリューションを提供しています。
適応アルゴリズムに基づいて構築されたこのテクノロジーは、99 %を超える精度で詳細な音声テキスト変換ファイルを生成し、記録的な速さで配信することができます。
Verbitのカスタマイズされたソリューションは、組織が情報を検索、アクセス、実行できるようにすることにより、オーディオファイルとビデオファイルの可能性を最大化するのに役立ちます。
なかなか難しいですね。
要は、AIを用いた音声の書き起こしや動画字幕作成を行えると言うことですが、もう少し具体的にご説明いただけますか?
音響、言語、文脈の3つのモデルが、Verbit のキャプションを知らせます。バックグラウンドノイズとエコーを除外し、アクセントに関係なく話者を識別します。また、現在のイベントと更新を組み込んでいるときにドメイン固有の用語を検出します。クライアントはまず、処理のためにオーディオまたはビデオファイルをクラウドダッシュボードにアップロードし、次に、20 か国以上にいる 15,000 人を超える人々で構成されたチームが、顧客提供のメモとガイドラインを考慮した上で、資料を編集およびレビューしていきます。
完成した文字起こしは、Blackboard、Vimeo、YouTube、Canvas、BrightCode などのサービスにエクスポート可能です。
多少人の手は入るのですね。
私も利用していますが、書き起こしアプリで有名な Otter などとはどのように異なるのでしょうか?
このプラットフォームは、運用コストを最大 50 %削減し、競合他社の 10 倍の速さで結果を出すことと謳っています。
実際に私が比べたわけではないですが、大量になればなるほど速度は重要ですからね。
10倍ですか!その速さは圧倒的ですし、コストが低いのであれば導入がしやすいですね。
ハーバード大学も Verbit の技術を使用してオンライン授業を書き起こすようですが、やはり専門性が高い言語も転記可能な点が採用の要因なのでしょうか?
ドメイン固有の用語を識別し、アクセントや方言を認識するための言語アルゴリズムや、高精度を保証するために、現在のイベントと最新のニュースを組み込んだコンテキストイベントアルゴリズムなどの技術を使用して、Hardvardは学生にオリジナルのクラスビデオとテキスト文字起こしの両方を提供することができるようになっています。これは、学生が自分ですばやくメモを取る必要がある古典的な正面講義と比較して、遠隔学習を魅力的なオプションにしています。
大学以外にも導入して、より効率的かつ効果的な学習ができる環境を日本でも整えてほしいものですね。
本日はありがとうございました。
※イスラエルでは、こうしたスタートアップが 6000 社以上存在するといわれております。
弊社では、こうした企業の調査、目利きを行っておりますので、お気軽にお問い合わせください。
お問合せ先:お問合せフォーム