報道資料
2011年4月20日
株式会社エー・アール・アイ(ARI)
Tel:042-656-3473(広報担当)
岩手大学
Tel:019-621-6303(工学部・工学研究科)
科学技術振興機構(JST)
Tel:03-5214-8404(広報ポータル部)
株式会社エー・アール・アイ(ARI)(本社:東京都八王子市、社長 佐藤 克昌)は、JST(理事長 北澤 宏一)の有用特許制度によってライセンスされた「通信系・音響系のためのシステム同定の新技術」に関する特許(特許444919号)を事業化し、今回、高音質の電話会議システムを実現しました。
ライセンスされたこの特許は、JSTが出願し、平成22年に登録(特許444919号)されました。ARIはその内容を早くから高く評価し、特許に基づくエコーキャンセラ注1)の開発に乗り出すため平成20年6月にライセンスを行い、事業化を進めていました。
近年、インターネットを利用した電話会議やテレビ会議が盛んになってきていますが、これは単に経費削減のためだけではなく、人の移動を減らすことによりエネルギーコストを下げるための有効な手段です。ここでは、音質向上のためにエコーキャンセラが用いられていますが、従来のシステムで用いられているエコーキャンセラは計算処理速度が遅く、遠隔地の話者(遠端話者)と受聴者(近端話者)との間で同時通話(ダブルトーク)を行った際のエコーを十分に防止(キャンセル)できないため、音質が劣化し易く、その性能向上が求められています。
エコーキャンセラは、スピーカーとマイクの空間における音の伝わり方(伝達関数)を数学的に計算できるソフトウェアを利用して、受話信号からエコー成分を生成し、マイク入力信号からエコー成分を差し引くことでエコーを防止します(図1)。今回、独自開発したソフトウェア「J-FHF(高速ハイパーH∞フィルタ 注2)」では、 エコー成分を従来のものより安定に高速同定して除去できるため、同時通話も可能となりました。さらに、今までは難しかったスピーカーやマイクが移動した際の音声の追従もできるようになりました。これにより、テレビ電話の会議において、スピーカーの相手の音声(エコー成分)を高速にキャンセルすることができ、あたかも同一空間にいて会話をしているような擬似同居を実現することができます。
本技術は、パナソニック株式会社より2011年2月に発売されたSkype対応BDレコーダー(DIGA)にエコーキャンセラとして利用されており、これをテレビと一緒に使うことにより、高音質の快適なテレビ電話が可能となります。
有用特許とは、研究者が出願を希望し、有用性が期待できる大学などの研究成果を、JST(科学技術振興機構)が出願人となり出願した特許(有用特許取得制度:平成15年度まで実施)。
本新技術の背景、内容、効果の詳細は次の通りです。
現在用いられているテレビ会議や電話会議システムでは、遠端と近端の遠く離れた2者が同時に話をした場合、音声が劣化するため、この劣化を防ぐさまざまな開発がなされています。
しかし、この劣化を防ぐ工夫は多くの場合エコーキャンセラに使われるアルゴリズムの改良というよりは、「2者のどちらが話者か」という判定を制御プログラムにより行い同時に話すということを回避するというものでした。そこで、この問題を根本的に解決するアルゴリズムが望まれています。
エコーキャンセラの処理では、音響エコーの伝達経路と変化に応じたフィルタ処理(適応フィルタ)を行うために、送話信号と受話信号からフィルタの演算係数を常時算出(同定)し、追従する信号処理を実行します(図1)。
伝達経路の変動に追従する速度や精度が劣ると音響エコーを正しく低減できず、かえって雑音を発生してしまうため、高音質通話のためにはフィルタ係数の算出(伝達関数の同定)が高速(図2、3)で誤差の少ない手法を用いる必要があります。
従来の手法では、フィルタ係数の算出の追従速度を高速化すると、算出した係数の誤差が大きくなり、高速化と精度を両立してエコーキャンセラの性能を向上させるのが困難でした。さらに、同時通話時には、音響エコーと相手の音声が混合した受話信号からエコーの経路の変動のみを推定算出することは難しく、同時通話時においては良好なエコー除去性能を実現することができませんでした。
そのため、テレビ電話ではボイススイッチ(話者を特定するスイッチ)によって同時通話(図4)を避けることでエコー除去性能の低下の回避を図るなどして、通話音声品質の劣化ができるだけ問題とならないような工夫が行われています。
しかし、家庭で用いられるテレビを利用した電話では、スピーカーとマイクは、携帯電話のようなハンドセット(受話器)を用いる方法と比較して話者からの距離があり、音響エコーによって通話音声品質が低下しやすいため、一層のエコーキャンセラの性能が求められます。ボイススイッチの利用は家庭向けのテレビ電話としては現実性が低く、同時通話が発生しても高いエコー除去性能を維持できることが望まれます。
J-FHFによるエコーキャンセラは、相手話者の音声まで含むような信号変化(外乱)に対して、安定(高いロバスト性)した伝達関数の高速同定が可能となり、エコー除去性能が向上するのみにとどまらず、従来技術でも難しかった同時通話時であっても良好なエコーキャンセラを実現します。
本技術により、相手が話している時に割り込んで話す自分の声を音質よく相手に伝えることができるようになり、ミスコミュニケーションが大きく改善されました。この同時通話性の大幅な向上により、遠隔地の2地点で電話をするという次元から同一空間に2者が存在するという擬似同居という次元に進化させることができ、快適な会話環境を実現できます。
また、今後、J-FHFのロバスト性、高速処理および追従性が有色信号でも性能劣化が少ないという特徴を生かして、音声認識エンジンの前処理や立体音響再生などの分野へも展開が期待されます。
音響エコーキャンセラが無い場合はエコー成分が話者に返るため話者は聴き難い。
音響エコーキャンセラがある場合はエコー成分が除去されるため話者は聞き易い。
(a)J-FHFによる同時通話時の適応フィルタ係数 |
(b)従来方式による同時通話時の適応フィルタ係数 |
J-FHFは同時通話時の適応フィルタ係数が安定しているが、従来方式は近端音声によって係数が乱れている。 係数が乱れると送話音声の音質が劣化するが、J-FHFは係数が安定しているため送話音声の音質が劣化しない。
音声や音楽信号はAR信号と呼ばれている。これと同様の性質を持つAR信号を用いて同定の様子を測定したもの。 従来方式は収束に時間がかかるが、J-FHFは高速に収束するため短時間で高いキャンセル量を得ることができる。
同時通話時の送話者のマイク入力信号
J-FHFによるキャンセル処理音(同時通話検出なし)
従来方式によるキャンセル処理音(同時通話検出なし)
同時通話時のエコーキャンセル後の送話信号を時間波形で比較すると、従来方式では係数の劣化により送話音声の間に残留エコーがあるが、 J−FHFでは同時通話時でも係数が安定なためエコーがキャンセルされ、快適な会話が可能となる。
株式会社 エー・アール・アイ
〒192-0081 東京都八王子市横山町6番9号丸多屋ビル8F
独立行政法人 科学技術振興機構 イノベーション推進本部 知的財産戦略センター
ホームページ:http://www.jst.go.jp/
TV・WEB会議システム用エコーキャンセラー Artifit Voice JFHF-EC1401VC
高速H∞フィルタ(J-FHF)を使ったWEB・TV会議システム向けエコーキャンセラ製品 JFHF-EC1401VCは良好な音声通話、エコーキャンセル性能を実現します。
受託開発によるソフト、ハード開発以外に音響機器製品を開発、製造、販売しています。 また、オーラサウンド社のプロオーディオ製品の代理店として、スピーカユニット、振動 ユニットを輸入販売しています。
3GPP対応携帯電話開発用オーディオアナライザ MTA-02WB-S
ノイズキャンセルマイクロホンモジュール A-DMA-001/002
AURA SOUND のスピーカーユニット NRT & Whisper Technology
AURA SOUND の体感振動ユニット BassShaker
ARIは音響・デジタル機器の ハード、ソフト開発、 信号処理(DSP)ソフトウェア 開発と製造・販売を行っています。また、 AURASOUND社のプロオーディオ製品の代理店として製品を輸入・販売しています。