インターネット回線を利用し、 ワールドワイドに遠隔地を結ぶTV会議、WEB会議システムは、 専用回線を用いて行われていた社内会議システムの仕組みを 企業間の日常的な会議に広がりをもたらし、 専用機に限らずPCやスマートフォンまでを含めた コミュニケーションツールとなっています。
TV会議システムのエコーキャンセラーは、遠隔地を結ぶ回線遅延を伴うエコーと 会議室が利用されることによるやや長めの残響に対応します。 TV会議向けアーティフィットボイスは、エコーキャンセラーモジュールをコアとして会議システムに求められる 音量の適性化や環境ノイズの低減のための機能を統合した音声通話機能モジュールになっています。
J-FHF(高速H∞フィルタ)の高性能な適応フィルターをコアテクノロジーに、 会議システム用にダブルトークコントローラーやノイズリダクションを統合化したJFHF-EC1401は、 音声通話モジュールとしてTV会議、WEB会議システムの音声通話品質の向上に貢献します。
TV会議、WEB会議システムは、エコーキャンセラーが機能していない状態では、 受信側のスピーカーとマイク間で発生する音響エコーが通信回線の回線遅延を伴い長めで音量が大きいエコーが送話側に返ります。 会議システムではエコーサプレッサーによってエコーを抑制するシステムも存在しますが、 適応型エコーキャンセラーとは異なり、事実上、同時通話時に音声が途切れ、円滑な会議に支障が生じます。
小規模なTV会議システムの場合にはテーブルやTV付近、もしくは本体のマイクと TVのスピーカーや近くに設置されたスピーカーを通じて通話されます。 スピーカーとマイク、会議参加者はやや距離があり、全ての参加者に音声が明瞭に聞こえるように 音量ボリュームは大きく設定されている状態で利用されます。
音響エコーは、スピーカーからマイクに直接到達する音が含まれる可能性もありますが、 最適に配置されてマイクの指向特性の範囲から直接音が到来しない位置関係にあれば、 会議室内の反響音が音響エコー成分になります。
常識的にマイクはスピーカーの方向を向けることはありませんが (ハウリングが発生しますので)、 一つのマイクを使って複数の人数の音声を送信するシステムでは、 マイクは広い指向性にする必要があり(無指向性など)、 マイクの指向特性の範囲にスピーカーからの直接音も到来するような位置関係になる場合もあります。
遠い人や小さな声の人にも対応するために感度は高目にセッティングされ、 必然的に音響エコーや周囲の環境雑音をマイクが拾うレベルも上がります。
TV会議システムのマイクやスピーカーは外付けで設置されるケースはめずらしくないため、 ユーザーのマイクやスピーカーの設置位置などが最適とはいえなくても対応できなければいけません。
さらに、会議システムには、 音声通話機能の中でAGC(自動利得制御)によって小さな声を適正音量まで増幅され、 スピーカーで大きな音量で聞いているため、聴感上も、よりエコーが目立つことになります。 このように会議システムで機能しているエコーキャンセラーには、スピーカー通話機器の中で比較しても、 強くエコー抑制することが期待されます。
適応型エコーキャンセラーは、スピーカーから出力している送話側(相手)の音声が、 受話側の会議室内を伝搬してマイクに到達する特性(伝達関数)を推定し、 入力された信号から音響エコーの成分を抑制する働きをします。
この働きは適応フィルターによって実現され、適応フィルターの信号処理上の基本的な性質は、 スピーカーへの出力信号とマイクからの入力信号を用いて入力信号中に発生しているエコー成分を推定し、 推定に基づいて入力信号からエコー成分を引くことでエコーを抑制しています。
適応フィルターの伝達関数の推定処理は逐次機能しつづけていて、安定的にエコー成分がそろった状態になると、 性能をフルに発揮します。空間内の状況や入力信号に突発的な雑音が入る場合などもあり、 安定動作に達する(収束)までの時間や、入力信号の変化に対する追従性などはアルゴリズムによる差が生じます。
適応フィルターのマイクからの入力信号にスピーカー出力からのエコー成分のみが戻っている時には、 最も条件が良くなりますので、送話、受話の関係が交互に発声されている場合には、 古典的なアルゴリズムであっても比較的うまく機能できます(シングルトーク)。
ところが、実際の会議では、同時に発声する場合も、 周囲の雑音が高い場合もあるため安定動作は簡単ではありません(ロバスト性)。
中でも、同時に発声するダブルトーク時には、受話側で発せられる声とエコーの音声が混合した状態になり、 状況の変化に対応しやすいことを優先したアルゴリズムであれば、受話側の音声の中からエコー成分を推定することになり、 適性な処理ができなくなりやすい傾向にあります。
会議システム用のアーティフィット・ボイスの適応フィルターのアルゴリズムには、 J-FHF(高速H∞フィルタ)を用いています。 J-FHFはロバストで収束が高速な特長を持ち、 そのロバスト性はダブルトーク時の性能が良いという特性に至ります。
さらに、JFHF-EC1401のエコーキャンセラー部には、 J-FHFのダブルトーク性能を生かすための制御部 DDC(ダブルトーク・ディテクション・コントロール)を備え、 より、会議システムの同時発声を良好なものにするようになっています。
WEB会議など自由に発言がゆるされる小規模な会議では、ダブルトークが発生しやすい状態になりますが、 そのようなケースに、ダブルトーク性能の高さが発揮され、会議システムに搭載されたエコーキャンセラーの性能差が顕著になります。
電話など音声通話機器の多くが話者の音声の大きさの差を適正化するために AGC(オートゲインコントロール/自動利得制御)機構を備えています。 TV会議システムでは、マイクから話者の距離が会議の参加者によって差があり、話者の声量も異なるので、 AGCの補正範囲は広めに調整されます。
声が小さい話者がマイクから離れた席にいる場合には、AGCはかなり音量を増幅する動作をします。
AGCのこの動作によって、マイク信号に含まれる環境ノイズや音響エコーのレベルも増幅されるため、 AGCの調整は、即、通話音質に直結しています。
会議システムの場合には、屋外で使われるモバイル機器などに比較すると会議室で使用されるため、 環境ノイズがひどいケースは少なくなりますが、先に述べたようにAGCが大きな増幅効果で機能していると 低めの周囲雑音であっても増幅されて伝わります。 そのため会議システムにおいてもノイズの低減機構が必要となります。
アーティフィット・ボイス シリーズには、 エコーキャンセラーと統合連動するノイズ・リダクションを搭載し、 環境ノイズの低減に対応できるようになっています。 ノイズリダクション機能は、適応型エコーキャンセラーのコアと統合的に制御されるため、 適応フィルタとノイズサプレッサーを直列に接続した動作とは効果は異なります。
会議システム用には、ノイズゲートやノイズサプレッサー、AGCの調整などによって 完全な無音となった場合に、不自然な無音にならないようにするために CNG(コンフォートノイズ生成器)をオプション構成で選択することができます。
エコーキャンセラー・ソフトウェア製品についてご不明な点などございましたら、 ARI Artifit Voice担当までお気軽にお問い合わせください。 お客様の秘守に関しましては機密保持契約(NDA)を締結させていただいた上でご相談賜ります。