次世代ロボット知能化技術開発プロジェクト
平成19年度~

コミュニケーション知能(社会・生活分野)の開発,
公共空間における
情報支援知能モジュール群の開発

株式会社国際電気通信基礎技術研究所
株式会社イーガー
オムロン株式会社
三菱重工業株式会社

English version
課題概要 研究内容 成果 モジュール公開について

聞く(言語情報)

音声認識モジュール


概要

本モジュールでは、5年間のうちに、コミュニケーションロボットにおいて重要な機能である音声認識モジュールの開発を行います。65dBAという騒音環境下において、ロボットと対話者との間の距離が1mという条件で、75%以上の音声認識性能を実現することを目標としています。騒音環境下における音声認識にとって、頑健な発話区間の推定は音声認識性能の改善に大きく影響します。本モジュールでは、顔動作推定モジュールから得られる唇や顔の情報と音響信号の間の関係をモデル化することにより、騒音環境下においても頑健に発話区間を推定する手法を開発します。

現在公開中のモジュールの構成

入出力 データ内容 備考 ブロック図との対応
InPort 発話区間開始・終了時間,音声波形ファイル 『true』で音声認識開始、『false』で認識終了.音声ファイルはWAVE形式とLAW形式に対応 ①,②
OutPort 音声認識結果の文字列 同じ内容のデータを2つ出力する ⑤,⑥
ServicePort 音声認識実行時の設定,認識結果の出力指定 『true』設定成功、『false』で設定失敗
本研究は、平成19 年度経済産業省、平成20 年度NEDO 委託研究
「次世代ロボット知能化技術プロジェクト」の一環として行われた。

Copyright (C) ATR Intelligent Robotics and Communication Laboratories
Contact: irc-contact@atr.jp