テキスト翻訳ツールで有名な AI 企業 DeepL は本日、リアルタイム音声翻訳市場に参入するための音声対音声翻訳製品ポートフォリオをリリースしました。これは、オンライン会議、モバイルおよび Web での会話、カスタマイズされたアプリケーションを介した最前線の従業員が関与するグループコミュニケーションなど、さまざまなシナリオをカバーします。同時に、DeepL は開発者や企業向けに、同社のテクノロジーに基づいたコールセンターやその他のビジネス向けのカスタマイズされた音声翻訳ソリューションをサポートする API も開始しました。

DeepL CEO の Jarek Kutylowski 氏はインタビューで、長年テキスト翻訳に注力してきましたが、音声は同社の「当然の次のステップ」であると述べました。同氏は、DeepLはテキストや文書の翻訳において大きな進歩を遂げてきたが、リアルタイム音声翻訳の分野では「真に優れた製品がまだ不足している」ため、同社が参入を決めたと強調した。

Kutlovsky 氏は、リアルタイム翻訳製品を構築する上で最も難しいのは、待ち時間の短縮と精度の維持のバランスを取る方法だと指摘しました。いわゆる遅延とは、ユーザーが話してから翻訳された音声が再生されるまでの時間差を指します。会議や対話のシナリオでは、その差が小さいほど、ユーザーのコミュニケーション エクスペリエンスは「同時対話」に近づきます。

このリリースでは、DeepL は Zoom および Microsoft Teams 用のプラグインを起動し、リモート会議のリスナーが母国語で話している参加者全員の発言を聞いたり、リアルタイムで翻訳された音声を聞いたり、画面上でリアルタイムに翻訳された字幕を読んだりできるようにします。このプログラムはまだ初期テストの段階にあり、DeepL はこの機能を最初に試すために待機リストに参加する企業を呼び掛けている。さらに、同社はモバイル端末や Web ページ向けの会話製品も提供しており、ユーザーが対面またはリモートで言語を越えたコミュニケーションを可能にします。

トレーニングやセミナーなど、複数人のオフラインまたはオンラインのグループ シナリオの場合、DeepL を使用すると、参加者は QR コードをスキャンして同じセッションに参加でき、全員が自分のデバイスで対応する言語で翻訳されたコンテンツを受け取ることができます。 DeepLによると、同社の音声読み上げ技術は、専門的なシナリオでの使用を改善するために、業界用語、企業名、個人名などのカスタム語彙を学習して適応させることもできるという。

Kutlovsky 氏は、AI が今後数年間で顧客サービス業界の形を変えるだろうと考えています。高品質の翻訳レイヤーは、現地言語の人材が不足し、採用コストが高い市場において、企業が多言語サービス サポートを提供するのに役立ちます。このビジョンのもと、DeepL は自社の音声テクノロジーが会議シナリオに役立つだけでなく、カスタマー サービス センターやグローバル企業の基本的な言語インフラストラクチャの 1 つになることを望んでいます。

DeepLは技術ロードマップで、現在の製品は自社開発の完全な「音声合成」技術スタックによって推進されているが、現段階ではまだ「音声からテキストへ - テキスト翻訳 - テキストから音声へ」の3段階のプロセスを使用していると述べた。同社は、長期的にテキスト翻訳に注力することで、全体的な翻訳品質が向上すると考えています。今後、DeepL は、遅延と自然さのさらなる改善を達成するために、テキストの中間ステップを省略したエンドツーエンドの音声翻訳モデルを開発する予定です。

音声と翻訳の分野では、DeepL は複数の新興企業との競争に直面しています。その中で、サナスは昨年、カドリール・キャピタルとテレパフォーマンスから6,500万米ドルを調達した。主にコールセンターのエージェント向けに、話者のアクセントをリアルタイムに変更する技術に焦点を当てています。 Camb.AI はドバイに本社を置き、メディアおよびエンターテイメント企業に音声合成および翻訳サービスを提供し、顧客による大規模コンテンツの吹き替えとローカリゼーションの完了を支援します。 Reddit の共同創設者 Alexis Ohanian 氏のファンド Seven Seven Six が投資している Palabra は、翻訳プロセス中に話者の元の声の特徴を保持することに重点を置いたリアルタイム音声翻訳エンジンを構築しており、DeepL によって構築されている機能とより直接的な競争関係を形成しています。

DeepL はテキスト翻訳市場で足場を確立した後、音声製品を通じてその限界を拡大し、その技術を会議でのコラボレーション、顧客サービス、および最前線の運用シナリオに拡張しようとしています。言語を越えたコミュニケーションコストを削減するために AI を活用しようとする企業が増えるにつれ、リアルタイム音声翻訳が新たな競争の焦点になることが予想されており、DeepL はこの路線での展開を加速しています。