新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   >>中国XML论坛<<     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> VoiceXML, CCXML, OpenVXI
    [返回] 中文XML论坛 - 专业的XML技术讨论区XML.ORG.CN讨论区 - 高级XML应用『 XML在语音技术中的应用 』 → VoiceXML与多通道 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 13032 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: VoiceXML与多通道 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     admin 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      头衔:W3China站长
      等级:计算机硕士学位(管理员)
      文章:5255
      积分:18406
      门派:W3CHINA.ORG
      注册:2003/10/5

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给admin发送一个短消息 把admin加入好友 查看admin的个人资料 搜索admin在『 XML在语音技术中的应用 』 的所有贴子 点击这里发送电邮给admin  访问admin的主页 引用回复这个贴子 回复这个贴子 查看admin的博客楼主
    发贴心情 VoiceXML与多通道

    - 语音界面的新标准

    2003/01/28

      世界上最古老的用户界面--人类语言终于在二十一世纪借助于VoiceXML,一种语音可扩展标记语言发展成熟起来。作为世界上第一个真正的语音通信标准,它定义了应用开发商向用户提供新型信息访问服务的方式。通过这种服务,用户在任何地方,都可以通过电话或任何移动设备,虚拟访问任何信息。VoiceXML正在被广泛应用于旅游、金融与信息服务等行业的各种业务领域中,甚至是政府部门与市政机构,全球的无线运营商等。

      VoiceXML最初由VoiceXML论坛创建,现在VoiceXML由万维网联盟(W3C)主持。后者是一个全球性组织,它已经制定了一系列网络技术标准。其宗旨在于为用户定义一种新方法,运用基于Web的服务通过口头指令和DTMF键盘实现交流,通过事先记录的话音、合成话音或音乐流获取信息。为了迎接这种挑战,W3C定义了一套在设计上与网页编写标准相类似的标记语言,以规范应用程序的语音问题,例如用户对话流、自动语音识别与相关语法、语音合成与呼叫控制等。

    按此在新窗口浏览图片


    应用中的VoiceXML

      在今天的通话应用市场上,应用VoiceXML的基本目标在于全力扩大现有网站及其内容的容量,使它们适应交互式语音响应应用,同时减小复杂应用方案的编程复杂性。此外,在客户服务器信息处理环境中,它允许语音与数据服务的轻松结合。

      VoiceXML是专门设计用于抽取应用开发商在底层特定平台上的编程内容。在本质上,由于开发商不再需要在通话平台上编写微小细节的地址代码,从而简化了语音应用的创建。它实现了应用程序内容的标准化,例如话音识别语法与呼叫控制等。因此,应用VoiceXML编译程序的系统,虽然具有自己的特定规格,但是无需考虑已经抽取的特定系统的要求,就可以容易地移植到其他系统中。作为一种通用语言,VoiceXML不但适合应用开发商,而且也适合提供新闻、天气预报及航空服务信息的服务提供商。


      VoiceXML设计的工作原理:语音应用程序作为系列页存储在类似于网络服务器的文件服务器上。从实现平台接收到输入呼叫时,VoiceXML编译程序会向文件服务器发出一个特定URL请求,就像用户浏览网络时输入网站地址一样。文件服务器可以与编译程序直接相连,也可以设置在外部,通过本地网或互联网的IP协议访问。他们可以保持应用程序的服务逻辑,可以提供数据库查找与其他系统操作功能。

      然后,这些页可以向编译程序提供系统需要的对话流和各种操作,例如要求呼叫用户提供特定语音输入。用户的回应影响对话编译,会使上述请求返回文件服务器。而后,下一VoiceXML页会完成答复,从而用户对话得以持续。

      VoiceXML应用于简单应用比较理想,例如自动值班应用程序。在此程序中,呼叫用户与系统间的对话不很复杂,用户交互简单。同时,VoiceXML也可应用于较为复杂的应用中。在这些应用中,向用户提供多种选择,数据检索范围较大。基于VoiceXML的应用接口向用户提示事先录制的和合成的对话,可以理解简单的单词和词组。随着这种技术的不断改进,它可以支持更丰富的人机自然语言对话。

    结构与HTML相同

      就结构而言,VoiceXML应用与目前应用广泛的HTML应用相同。唯一的差别在于前者使用语音浏览器,而后者使用Netscape或Internet Explorer作为浏览器。语音浏览器可以生成HTTP请求,形成结果标记。在这种情况下,VoiceXML图2说明了语音系统的基本结构。


    按此在新窗口浏览图片

    更多新规范

    话音合成
      由于具有一系列新规范,Voice XML性能非常强大。作为W3C语音浏览器工作组的开发内容,每种规范都具有自己独特的作用。尽管本文不可能详细说明所有的这些规范,但其中的两个是值得介绍的。

      话音合成标记语言(SSML)规范,界定了一种通过话音合成器生成合成话音的标准方法。在语音应用方案中,合成话音又称之为正文-语音合成。基于Sun Microsystems的JSGF或JSML规范,SSML规范设计用于向应用开发商提供一种控制合成话音输出,如单词发音、大小、音调、语速与节奏等的标准方法。


    语音浏览器 一种编译设备,可编译Voice XML语言并能够编译用户发出的话音与DTMF输入指令,同时通过文语转换和预录音系统提供应答。


    文语转换 从文本输入自动生成合成话音的过程。

      SSML提供一些关键设计元素,帮助实现跨平台和跨不同文语转换引擎之间语音输出的一致性。

    呼叫控制
      呼叫控制可扩展标记语言(CCXML),设计用于支持VoiceXML应用中的复杂的通话呼叫控制,处理与呼叫相关的操作,诸如呼叫转移、会议、选择呼叫应答与长线连接(系统把呼叫用户与出站线路连接,当出站呼叫结束时,再应答此用户)等。此外,CCXML还提供一种电话网络信号传输故障访问功能。这是一种运营商非常需要的性能。上述两种语言既相互独立,又相互补充,并且可以单独实现。


    多通道

      目前,存在一种话音交互与其他交互模式相融合的趋势。多通道顺应了应用开发商的需求。在多通道应用中,使用话音作为输入输出,同时还提供数据接口访问,例如应用HTML的网络接口、短信息服务(SMS)与无线应用协议(WAP)等。换一种说法,多通道应用不仅仅限于简单的输入输出,还能够容纳多种模式,用户不仅可以实现说、写、打字,而且可以通过更为自然的用户界面实现听和看。

      W3C已经认识到,把各种不同的设备融合成一种综合应用的需求,并且成立了一个小组进行研究。他们把多通道视为一种扩展网络用户接口、应用多种交互模式的方法,让用户自由选择语音和输入设备,例如辅助键盘、键盘、鼠标和输入笔等。对于输出,用户能够听到语音提示和音频,而且能够查看图形显示器上的信息。 一般来说,真正的多通道应用将不仅允许在访问服务器信息时,不同模态共存于一个设备上,例如移动电话,而且可以存在于多个一起使用的设备上。例如,用户可以一边驾车,一边询问行驶方向。系统响应生成,并通过图形和文本显示器传送到司机的个人信息终端(PDA)或全球定位系统设备上。

      W3C已经认识到,把各种不同的设备融合成一种综合应用的需求,并且成立了一个小组进行研究。此机构正在制定一种各种容量下的多通道、多设备同步化规范。 除了W3C正在进行的工作外,其他组织机构也认识到多通道应用的重要性,也提出许多不同的实现多通道的方法。IBM提出一种名为XHTML + 语音的设计方案,将 VoiceXML、XML和HTML相结合。此外,Microsoft、Cisco与Phiplips 语音处理以及其他一些公司共同建立一个研究机构,已经开发出一种名为语音应用语言标记(SALT)的多通道设计方案。

    目前的多通道应用


      近年来,随着社会发展步伐的加快,用户越来越期望随时随地获得信息。尽管传统的计算机是获取信息的一种最佳方式,但是用户更时常需要通过一种小的移动装置,如手机、无线PDA或智能全球定位系统来获得这些信息。同时,尽管语音应用正在逐渐成为了一种访问网络或公司数据的有效方法,但是在很多情况下,这种应用适用范围与效率都相当低。但是,应用本文所论述的性能增强方法,用户可以得到更好的服务。

    一些目前成功应用VoiceXML的多通道应用包括:

    · 蜂窝广播 - 使用SMS 通知服务用户,某一事件发生,允许用户即时操作按钮接受服务。
    · 远程信息处理 - 在车辆上通过语音询问信息,并在个人数据终端查看结果。
    · 语音电子邮件 - 使用语音指令发送接收电子邮件。
    · 即时会议 - 在接通现有呼叫同时,使用语音指令拨打第三方号码,然后三方同时通话。

      事实上任何应用方式都是可能的!

      VoiceXML与多通道应用,目前应用正在逐步扩大 - 电信运营商DoCoMo与SprintPCS等将其应用于增值服务,以增加自己的收入,旅游巨头美联航等将它用于旅游信息服务,通用电气等企业将它用于允许公司用户访问公司的数据库等。

      本文中简要说明的VoiceXML标准以及辅助技术,正在逐步激励应用开发商创建新型服务,鼓舞用户接受新型服务的信心。

      可以在下列网站上查看关于VoiceXML的信息:


    World Wide Web Consortium [URL=http://www.w3c.org/]http://www.w3c.org/[/URL]
    VoiceXML Forum [URL=http://www.voicexml.org/]      http://www.voicexml.org/[/URL]
    IBM             [URL=http://www.ibm.com/]http://www.ibm.com/[/URL]

    Salt Forum         [URL=http://www.saltforum.org/]http://www.saltforum.org/[/URL]

    按此在新窗口浏览图片
    按此在新窗口浏览图片


    NMS国际通讯有限公司供稿 CTI论坛编辑


       收藏   分享  
    顶(0)
      




    ----------------------------------------------

    -----------------------------------------------

    第十二章第一节《用ROR创建面向资源的服务》
    第十二章第二节《用Restlet创建面向资源的服务》
    第三章《REST式服务有什么不同》
    InfoQ SOA首席编辑胡键评《RESTful Web Services中文版》
    [InfoQ文章]解答有关REST的十点疑惑

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2004/9/4 0:52:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 XML在语音技术中的应用 』 的所有贴子 点击这里发送电邮给Google AdSense  访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/12/27 15:17:12

    本主题贴数1,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    46.875ms