多言語音声コーパス作成
導入事例

多言語の音声データを海外現地で大規模収録して
高品質な音声コーパスを作成

業   種:公的研究機関
課   題:多言語での音声コーパス作成
音声認識や音声合成技術の多言語化は、世界の「言葉の壁」をなくすために重要な課題となっています。より実用的なレベルに精度を高めるため、限られた期間と予算の中、高品質で大規模な多言語音声コーパスを作成しました。
ソリューション

海外現地スタッフの教育・管理・入念なチェック

効果

高性能な多言語音声認識・音声合成システムの構築に貢献

海外現地スタッフの教育・管理・入念なチェック

音声合成システムの構築には非常に高品質な音声データが必要です。お客様の求める騒音レベル、残響レベル、その他細かな要件を満たす録音スタジオを選定し、合格基準を満たす音声データを納品してまいりました。収録する国によっては基準を満たすスタジオを探すことが難しいこともあり、そのような場合には現地に赴いて音響対策を施しました。

音声認識システム用音声データは数百から数千時間規模で、ネイティブ話者から音声データを収集します。信頼のおける海外現地ネットワークにてプロジェクトチームを結成して話者募集から音声収録、書き起こし作業をおこないました。仕様書は非常に細かく、日本語で記載されているため、現地のプロジェクトチームが仕様を細部まで理解していることが確認できるまで、しっかりと教育をおこないました。

現地のプロジェクトチームとは定期的にミーティングし、進捗管理や課題管理、品質管理をこまめに実施しました。ときには文化や環境の違いから、日本では想定しない事態が発生することもありますが、素早く、柔軟に対応して解決します。
収録のルールや手順が細かく定められていましたので、コロナ禍以前は現地の収録現場に立会い、仕様の確認と教育を入念におこないました。コロナ禍後もWeb会議を利用して、仕様の齟齬がないようにコミュニケーションを図っています。

納品対象の音声データは数万から数十万ファイルになりますので、ファイル形式等を確認するためのチェックツールを開発し、品質と作業効率の向上を図りました。もちろん機械チェックが難しい項目もありますので、その場合は適切なチェッカーを手配して人手のチェックをおこなうことで品質を担保しました。

高性能な多言語音声認識・音声合成システムの構築に貢献

2015年~2021年にかけて、15言語の合成音声用音声コーパスを収集・整備しました。各言語で数十名のプロナレータのオーディションをおこない、数万文の音声を収録しました。
音声認識用音声コーパスにおいても、非常に厳しい検査基準をクリアし、高品質なデータを納品することができました。私たちの収集したデータをもとに高性能な音声合成・音声認識システムが構築され、自動音声翻訳アプリケーション等で使用されています。

自然言語処理・音声情報処理サービス導入事例

CONTACT

通訳・翻訳でお悩みの方は
お気軽にご相談ください

お電話でのお問い合わせはこちら
〈受付時間〉平日 9:00〜17:30
ご不明な点はお気軽に
お問い合わせください
品質にこだわり抜いた
通訳・翻訳サービスの詳細はこちら