Mozillaはオープンソース共通音声認識データセットで多言語対応

Mozillaは、より多くの言語を含めるために、オープンソースの音声認識データセットを作成するための取り組みである、クラウドソースのCommon Voiceプロジェクトを拡大していると発表しました。

最初の技術組織 昨年6月にCommon Voiceを発表 世界中のボランティアを招待して、音声でテキストの断片を記録する ウェブを通して そして モバイルアプリ

上:あなたの声を録音する

このプロジェクトは、アマゾン、グーグル、アップル、マイクロソフトなどが開発した独自の音声認識テクノロジの成長に対抗している。 前述の凶悪犯は音声対応のデジタルアシスタントAlexa、Google Assistant、Siri、Cortanaに多額の投資をしていますが、それぞれのデータセットは企業自身が所有しています。

Mozillaは、最初の「完全な」Common Voiceデータセットを英語で開始しました。 11月に戻る 、500時間の演説を収録したコレクションで、2万人からの40万の録音を構成しました。 今日から、Mozillaには 正式に立ち上げた 3つの言語(フランス語、ドイツ語、少しランダム)のデータセット – ウェールズ語。 ブラジルのポルトガル人、中国人(台湾)、インドネシア人、ポーランド人、オランダ人などの研究者や開発者のための「完全な」と見なされているところまで、すでに40の舌が進行中です。

次の大きなプラットフォーム

何年も明らかになっている その声は次の大きなプラットフォームになります 技術で。 ちょうど昨日、 Amazonは正式に立ち上げた そのカメラを着用した、Alexaを搭載したEcho Lookのスマートスピーカーが、着るべき服を教えてくれます。 私たちはまだこの動きの初期段階にありますが、音声はより普及していくことは明らかです。

この背景には、誰もが音声認識スマートをあらゆる種類のアプリケーションやサービスに組み込むために自由に使用できるオープンソースのデータセットを作成する計画が進んでいるということです。

Mozillaのカタルーニャ・ボルチェット(Catholina Borchert)最高技術責任者(CIO)は次のように述べています。「これらのインターフェースは音声対応サービスのゲートキーパーとして管理されるべきではないと考えており、ユーザーは言語とアクセントで一貫して理解してほしいものです。 ブログ投稿

コモン・ボイス・プロジェクトは、個人所有のプラットフォームに対抗するようになった他のオープン・ライセンス・プロジェクトと同様の目的を果たします。 OpenStreetMap 良い例です Google Mapsなどのライバルサービスのコストや制限なしに、開発者に世界の自由で使いやすい地図を公開する同様のクラウドソーシングプロジェクトを提供しています。

アクセシビリティの面では、英語は リンガ・フランカ しかし、実際にはほとんどの人が母国語として英語以外の言語を話すことに変わりはありません。 また、音声認識AIの革命が始まり、開発者や技術者に機械学習モデルを訓練するための多言語データセットを提供するものだけが良いことになります。

「多言語のマークはCommon Voiceにとって大きな一歩を踏み出しました。そして、それは一般的なスピーチ技術の大きな一歩となることを願っています」 追加された MozillaのCommon VoiceプロジェクトのデジタルストラテジストMichael Henretty 「民主化された音声技術は、世界的な革新の障壁だけでなく、情報へのアクセスの障壁も低下させるだろう」

シェアする

  • このエントリーをはてなブックマークに追加

フォローする