新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   >>中国XML论坛<<     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> VoiceXML, CCXML, OpenVXI
    [返回] 中文XML论坛 - 专业的XML技术讨论区XML.ORG.CN讨论区 - 高级XML应用『 XML在语音技术中的应用 』 → VoiceXML语音上网 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 16682 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: VoiceXML语音上网 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     admin 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      头衔:W3China站长
      等级:计算机硕士学位(管理员)
      文章:5255
      积分:18406
      门派:W3CHINA.ORG
      注册:2003/10/5

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给admin发送一个短消息 把admin加入好友 查看admin的个人资料 搜索admin在『 XML在语音技术中的应用 』 的所有贴子 点击这里发送电邮给admin  访问admin的主页 引用回复这个贴子 回复这个贴子 查看admin的博客楼主
    发贴心情 VoiceXML语音上网


    2004/04/12

      有许多交互式语音应用程序可以让用户通过按键式电话与计算机交流。但是,通常呼叫者需要浏览的菜单很长,而且很花时间。同时,让呼叫者一边听电话,一边在蜂窝电话的小型键盘上搜索并且按钮要按得正确,是很困难的事情。因此用户需要IVR用户界面来与计算机交流。

      VoiceXML 2.0是一种标记语言,用来构建语音界面——有语音的 HTML。语音浏览器类似 Web 浏览器,它通过解释VoiceXML 2.0脚本来向用户提供语音信息并接受用户的语音请求。

      万维网联盟(W3C,World Wide Web Consortium)全力推荐使用VoiceXML 2.0,它通常被理解为一种Web标准。该标准添加了语音识别语法格式,用来识别用户可能就提示回答的字词,上一版本没有这一功能。

      为了更好地理解VoiceXML 2.0,可以将VoiceXML和HTML进行类比。采用HTML的Web应用可以分为两部分:浏览器和Web服务器。相应地,VoiceXML涉及的组件也可分为语音浏览器和相当于Web服务器功能的应用服务器。

      由于电话(包括很多蜂窝电话)没有计算功能,无法管理语音浏览器,所以语音浏览器驻留在网络上的语音服务器中。语音服务器可以位于企业数据中心,或者位于主管供应商处。用户拨叫一台语音服务器,该服务器从一台应用服务器上下载VoiceXML 2.0脚本、语法格式和声音文件。语音浏览器以一种语音信息的形式将VoiceXML 2.0脚本翻译给用户听,语音信息可以是预先录制的语音,或经由一个文本语音合成器产生的文本。然后语音浏览器调用一个自动语音识别(ASR)软件,使用语法格式来识别出用户响应的语音词汇。

      下面我们来看一个具体的例子:

      系统:“欢迎致电小李。请问您想接通销售部门、会计部门还是维护部门?”

      用户:“维护部门。”

      ASR 将识别用户的语音回复。在上面这个例子中,语法格式只包括三个词:“销售部门”、“会计部门”和“维护部门”。由于ASR的语法格式仅由有限数量的单词组成,这种语法驱动的ASR比起听写式ASR执行更为精确。听写式ASR则是试图识别用户说出的大多数英语或其他语言的单词。

      开发人员使用VoiceXML 2.0来为多种应用程序和信息(包括有时效性的数据、业务数据和个人信息)提供电话用户界面。有了这些应用程序,用户只需要从任意电话拨入,表明身份并请求所需的信息,就可以随时随地访问企业数据。客户还可以使用这些系统来访问订单状态;以及目录、交付和账户信息。

      有许多交互式语音应用程序可以让用户通过按键式电话与计算机交流。但是,通常呼叫者需要浏览的菜单很长,而且很花时间。同时,让呼叫者一边听电话,一边在蜂窝电话的小型键盘上搜索并且按钮要按得正确,是很困难的事情。因此用户需要IVR用户界面来与计算机交流。

      VoiceXML 2.0是一种标记语言,用来构建语音界面——有语音的 HTML。语音浏览器类似 Web 浏览器,它通过解释VoiceXML 2.0脚本来向用户提供语音信息并接受用户的语音请求。

      万维网联盟(W3C,World Wide Web Consortium)全力推荐使用VoiceXML 2.0,它通常被理解为一种Web标准。该标准添加了语音识别语法格式,用来识别用户可能就提示回答的字词,上一版本没有这一功能。

      为了更好地理解VoiceXML 2.0,可以将VoiceXML和HTML进行类比。采用HTML的Web应用可以分为两部分:浏览器和Web服务器。相应地,VoiceXML涉及的组件也可分为语音浏览器和相当于Web服务器功能的应用服务器。

      由于电话(包括很多蜂窝电话)没有计算功能,无法管理语音浏览器,所以语音浏览器驻留在网络上的语音服务器中。语音服务器可以位于企业数据中心,或者位于主管供应商处。用户拨叫一台语音服务器,该服务器从一台应用服务器上下载VoiceXML 2.0脚本、语法格式和声音文件。语音浏览器以一种语音信息的形式将VoiceXML 2.0脚本翻译给用户听,语音信息可以是预先录制的语音,或经由一个文本语音合成器产生的文本。然后语音浏览器调用一个自动语音识别(ASR)软件,使用语法格式来识别出用户响应的语音词汇。

      下面我们来看一个具体的例子:

      系统:“欢迎致电小李。请问您想接通销售部门、会计部门还是维护部门?”

      用户:“维护部门。”

      ASR 将识别用户的语音回复。在上面这个例子中,语法格式只包括三个词:“销售部门”、“会计部门”和“维护部门”。由于ASR的语法格式仅由有限数量的单词组成,这种语法驱动的ASR比起听写式ASR执行更为精确。听写式ASR则是试图识别用户说出的大多数英语或其他语言的单词。

      开发人员使用VoiceXML 2.0来为多种应用程序和信息(包括有时效性的数据、业务数据和个人信息)提供电话用户界面。有了这些应用程序,用户只需要从任意电话拨入,表明身份并请求所需的信息,就可以随时随地访问企业数据。客户还可以使用这些系统来访问订单状态;以及目录、交付和账户信息。


    VoiceXML组件


       收藏   分享  
    顶(0)
      




    ----------------------------------------------

    -----------------------------------------------

    第十二章第一节《用ROR创建面向资源的服务》
    第十二章第二节《用Restlet创建面向资源的服务》
    第三章《REST式服务有什么不同》
    InfoQ SOA首席编辑胡键评《RESTful Web Services中文版》
    [InfoQ文章]解答有关REST的十点疑惑

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2004/9/4 0:51:00
     
     ATOM 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:5
      积分:75
      门派:XML.ORG.CN
      注册:2005/2/23

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给ATOM发送一个短消息 把ATOM加入好友 查看ATOM的个人资料 搜索ATOM在『 XML在语音技术中的应用 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看ATOM的博客2
    发贴心情 
    楼主你好!我是一名大四的学生,现在正在做毕业设计,做的是语音互联网,也就是viocexml的应用,但我还处于初学阶段,需要很多资料,你能给我提供点吗?越多越好!谢谢!!
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/2/23 16:04:00
     
     卡卡嚓 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(高数修炼中)
      文章:13
      积分:104
      门派:XML.ORG.CN
      注册:2006/1/5

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给卡卡嚓发送一个短消息 把卡卡嚓加入好友 查看卡卡嚓的个人资料 搜索卡卡嚓在『 XML在语音技术中的应用 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看卡卡嚓的博客3
    发贴心情 识别率高不高呢?
    吵闹的环境应该不行了吧
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/1/5 16:38:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 XML在语音技术中的应用 』 的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/12/27 13:56:32

    本主题贴数3,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    62.500ms