VoiceXML 2.0勧告案公開

サウンドコラム 音とオーディオの四方山 vol.34
音響,AV サウンドコラム
NC曲線と騒音計 音響測定 image コネクタ、配線と測定器 音響測定 image 無響室 スピーカユニット特性測定 image マイク、ミキサー、A/D変換 インパルス応答 image 音圧分布、ホールのワイヤーフレーム 音響測定 image

音響技術とソフトウェア、ハードウェア開発

音響と開発 : Sound & Development
株式会社エーアールアイ / ARI
ARI CO.,LTD.
音とオーディオの四方山

VoiceXML 2.0勧告案公開

サウンドコラム 34
34

このコラムは無料メールマガジン「アメニティ&サウンド音と快適の空間へ」 vol.12〜vol.64(2002年8/15〜2004年11/18)に音響システムの関連コラムとして連載していたものを編集掲載したものです。

昨年(2004年2月掲載時) 勧告候補公開されたVoiceXML2.0がW3C(World Wide Web Con-sortium)勧告案としてとして公開されました。

  ▼『VoiceXML』仕様がさらに前進
    Japn.internet.com Webテクノロジー 2004年2月4日
    http://japan.internet.com/webtech/20040204/11.html

VoiceXMLは音声認識や音声合成、音声入出力、対話処理などをWEBで利用するためにXMLデータとして記述する標準仕様です。

  ▼XML(eXtensible Markup Language)
    e-Words IT用語辞典
    http://e-words.jp/w/XML.html

VoiceXML(VXML)の応用範囲は広いのですが、データのフォーマットを標準化することで、音声合成や音声認識などの各社サービスや製品を利用するアプリケーションや機器で共通の方式が利用できるようになることがメリットです。

VXMLを利用した製品やサービスは、IBMのWebSphere Voice Serverなどの音声対応製品などがありますが、VXMLの形式のテキストを、サーバーと送受信することでブラウザで音声合成したり、電話の音声をサーバーで認識して結果をVXML形式でのテキストを送信するという機能を提供する製品です。

音声合成はともかく、音声認識には、言葉を認識するボキャブラリ用データベースが大量に必要となりますから、音声認識部分をサーバーで実現するという解決方法を採ることでデータ蓄積などできない携帯端末などでも、通信回線を通じて音声認識の結果を利用することができます。

この送信データの形式にVXMLを利用することで、各社の製品に互換性を持たせることが容易になります。

音声サーバー機能やデータベースを独自に開発していると高価になり専用のアプリケーションでしか利用できませんが、送信データの形式にVXMLを利用することで、各社の製品に互換性を持たせることが容易になり、市販製品としてのアプリケーションや製品が作りやすくなります。

VoiceXML 2.0では、音声合成、ディジタルオーディオ、音声認識、携帯電話やプッシュホンのダイヤルトーン入力、音声の録音、通話、音声対話ダイアログの機能と多彩な内容になっています。

  ▼W3C(World Wide Web Consortium)
    2/4日現在NewsのトップにVXML2.0の公開が掲載されています。
    http://www.w3.org/

VXML2.0のサーバーを廉価に利用できるサービスがあれば、携帯機器から音声を送り、送信されてきたXMLテキストに応じて表示し、音声合成による対話も行うというような機能が実現できます。

現在は、企業のコールセンターの電話受付などで音声合成と音声認識エンジンが採用されていたり、WEBサイトのナビゲーションに利用(ボイス・ポータル)されている例などがありますが、携帯電話やカーナビゲーション、家電製品などから音声によってWeb上のサービスを利用したり、音声で操作できるようにする場合などでの利用方法が期待されています。

日本や米国では、自動車に搭載されるカーナビや電話などの車載機器は、安全運転のために、走行中はハンズフリー環境であることが求められます(道交法の改定以来、走行中の携帯電話による通話もハンズフリーであることが必要となっています)

現在は、リモコン操作のための認識に利用されていますが、ヘッドセットや、音声の入出力装置を備えているため、情報端末として高度な音声対話機能を提供できる可能性も持っていますが、端末の処理能力を超えるような場合であっても、VXMLによってWEBサーバーを介することで、高度な処理を簡易に実現できる可能性があります。

カーナビなどの場合には、情報端末としてのディスプレイや処理能力をある程度備えていますが、工場や現場などでのハンズフリーの音声応答システムには応用用途が期待されます。

これらの応用時にVXML形式を採用することで複数のシステムを利用したサービスや機能を実現できます。SF映画などでの音声命令が実現するというわけではありませんが、VoiceXML 2.0の勧告案公開は、高度な音声対話処理をより身近なもの一歩近づけたかもしれません。

サウンドコラム 音響とオーディオの四方山

音響システムやオーディオ、AVに関連した雑記

「アメニティ&サウンド音と快適の空間へ」 vol.12〜vol.64に 音響システムの関連コラムとして連載していたものを編集掲載したものです。

サウンドコラム 音とオーディオの四方山

サウンドコラム 音響とAV,オーディオの四方山vol.41〜50

3D音響システムとスピーカ・アレイ Iosonoとサラウンド / プレーヤーとメディアのハイブリッド化(BD,HD DVD,DualDisk) / デジタルアンプとデジタルスピーカ(D級アンプと消費電力, 特徴-シンプルな構成- パワーアンプと伝送 -効率,発熱,クロスオーバー,デジタルスピーカの特徴) / 自衛隊の大砲を使ったコンサート / コーデックキラー(音声圧縮エンコードとノイズ)

サウンドコラム 音響関連イメージ

サウンドコラム 音響とAV,オーディオの四方山vol.31〜40

40音効とCGスペクタクル映画
映画の音響効果とリアリティ
39開発者の音作りと発想
デジタルの音作りと哲学
38海の音響技術 後編
海洋音響トモグラフィー/深層海流の計測
37海の音響技術 中編
音響チャンネル(SOFAR) 音響哨戒網
36海の音響技術 前編
海洋の音響技術ソナーと低周波ソナー
35チェンバロにタンチョウヅルの羽根
サウンドコラム 35
34VoiceXML 2.0勧告案公開
サウンドコラム 34
33騒音性難聴の防止薬品
サウンドコラム 33
32闇と静寂
サウンドコラム 32
31Inter BEE 2003 とHD放送
SD、HD、テレビ解像度

サウンドコラム 音響とAV,オーディオの四方山vol.21〜30

30地上デジタルTV 開始とInter BEE
サウンドコラム 30
293D音響のトラッキング付き配信
ヘッドホンの立体音響/ヘッド トラッキング
28機械の音のリアクション
サウンドコラム 28
27音質?デザイン?
サウンドコラム 27
26米国のCD市場の変化とCCCD
サウンドコラム 26
25録音テープの「肉声」
サウンドコラム 25
24音の記憶
サウンドコラム 24
23過去と周期と予想
サウンドコラム 23
22魔法の杖と音声認識の確率
自動音場調整AVアンプのレビュー
21音響冷却方式と水冷式
サウンドコラム 21

サウンドコラム 音響とAV,オーディオの四方山vol.11〜20

CDを再生できないCDプレーヤー CCCD(Copy Control CD) / 音質は確実に落ちている? / 手軽に音響測定 / アカデミー音響賞、音響効果賞 / デジタルTVの双方向性 / テクノロジーと本質の視点( デジタル・オーディオは高音質か? ) / PCMはCDと同じ? / デジタルアンプの時代( デジタルアンプのコンシューマ化 ) / オーディオ機器への音楽配信 / 家庭の音場補正

サウンドコラム 音響とAV,オーディオの四方山vol.01〜10

デジタルオーディオと記録 DVD製造者認識コード(Disc ID) / CD誤り訂正と音質、ピット、誤り訂正 / CDリッピングで音質向上? / パソコンのサウンド機能 / 人間の耳−最も優れた音のセンサー(精密測定用マイク, カクテルパーティー効果) / パソコンの静音設計とノイズ / ホームAVサーバー / TV放送の音声と帯域 / パソコンVS家電 - データ交換 / DVDの評価表現「劇場上映時と」

サウンドコラム 音響測定編

音響測定、音圧レベル分布、伝送周波数特性

「アメニティ&サウンド 音と快適の空間へ」のvol.1〜10に連載していた 音圧レベル分布と伝送周波数特性に関連したコラムをサウンド コラムのページに編集して掲載しました。

サウンドコラム 音響測定編

サウンドコラム 音響測定編 音圧分布

音圧レベル(SPL)、オクターブバンド、dB、ノイズ

サウンドコラム 音響測定編 周波数特性

周波数、基音と倍音、無響室、フラット再生

≪ サウンドコラム 音響とAV,オーディオの四方山 ≫

Inter BEE 2014 参考出品の報告 - 幕張メッセ 2014年11月19日(水)〜21日(金)

放送用音声比較装置 ABE-2100Cを国際放送機器展に参考出展しました。 ご来場ありがとうございました。

Inter BEE 2014(国際放送機器展) 放送用音声比較装置 ABE-2100C (Sound Comparator) 参考出展の報告

《 VoiceXML 2.0勧告案公開 : 音響・オーディオ,AV サウンドコラム 34 》

株式会社エーアールアイ/ARI CO.,LTD.
東京都八王子市横山町6丁目9番 丸多屋ビル8F
tel:042-656-2771 fax:042-656-2654

ARIはアナログ、デジタル音響機器の ハードウェア開発ソフトウェア開発、 製品、受託開発を行なっています。試作、研究開発や特注機器などのソフト、ハード、システムの設計から製造までご相談いただけます。

エーアールアイ会社情報
製品情報と販売
音響と開発・サービス
音響機器メーカーと代理店

ご利用案内 | 免責事項 | 音響とAVのサイトマップ | 株式会社エーアールアイ | 東京都八王子市横山町6丁目9番 丸多屋ビル8F

Copyright(c) 2001-2017 ARI Co.,Ltd. all rights reserved.