« | July 2025 | » | 日 | 一 | 二 | 三 | 四 | 五 | 六 | | | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | | | |
| 公告 |
后其身而身先,外其身而身存。以其无私,故能成其私。
|
Blog信息 |
blog名称:火页的窝 日志总数:84 评论数量:180 留言数量:36 访问次数:612454 建立时间:2006年3月14日 |

| |
[知识技术]《知识技术及其应用》读书报告(2) 读书笔记, 科学研究
火页 发表于 2007/3/14 17:26:13 |
三、知识技术的在信息服务中的应用
(一)、网格技术
1.网格的定义
网格计算是在网络环境下,基于统一的协议,为了协同工作而实现对各种可用资源的高度、受限、安全共享。
网格计算模式中可共享的资源包括:计算资源、存贮资源、数据资源、操作平台、应用程序、License、带宽、外设。
网格的应用领域包括:科学计算、搜索引擎、企业计算、网络教育、数字图书馆。
2.网格架构
网格的系统架构:提交组件、调度组件、共享组件、网格管理组件、授权认证组件、加密组件、通讯组件、共享组件。
网格计算的五层协议体系:链路层、连接层、资源层、整合层和应用层。
网格计算的安全架构通过授权、认证和加密三部分来保证资源共享的安全性。
3.知识网格
知识网格是一个智能互联环境,它能使用户或虚拟角色有效地获取、发布、共享和管理知识资源,并为用户和其他服务提供所需要地知识服务,辅助实现知识创新、协同工作、问题解决和决策支持。
知识网格的体系结构分为五层,包括:网络层、资源层、知识表示层、知识推理层,知识应用层。
(二)、语义网
1.什么是语义网
W3C把语义网定义为因特网上数据的表述,是当前因特网的延伸。由于信息有了清晰明了的含义并为机器所理解,人与计算机便能够更好地合作。数据的表达要清晰一致,就必须有一个坚实的语义基础,这样的语义基础是由各种知识组织体系构成,包括叙词表、分类法、术语表以及近几年出现的实用分类系统(Ontologies),其中实用分类系统正在逐渐变成最重要的知识系形式。
语义网的目的不仅是要使人机交流更加有效,而且还要提高机器之间交流的广度和效率。实现这个目的的基础是必须要具有机器可以理解的数据,要做到这一点,首先要有一个通用的语义定式来作为一个基本模型,使得任何方面的应用都能够通过这个模型表述出来。这个通用模型就叫做资源描述框架(Berbers-Lee,1998)。有了资源描述框架,就像有了元数据,但是这还不够,因为元数据是由元素定义的,而元素本身需要有一个清楚的规定,如元素名称、元素的数据类型、元素的允许值范围。资源描述框架也需要有这样一种语言来规定资源描述框架的元素,这构成语义网的第二个层次。鉴于语义网众多的应用领域,为避免元素名称混乱和多义、歧义的现象,各个应用领域的元素名称必须有一个通用的方法限定起来,这个方法必须能够与资源描述框架及其定义语言共同使用。名域(Namespace)就是应这个要求而产生的。名域的作用不仅仅只局限于区分元素的归属,而且也可以用来转换不同名域之间的同义词,如DC.创造者可以转换为MARC格式中的个人作者或团体作者。名域是语义网的第三个层次。在这三个层次基础上的更高一级是逻辑层。逻辑层实际上是由一系列规则组成,这些规则可以从一种文献类型推纳出另一种文献类型,或根据规则检查一个文献的完整性和一致性。
2.语义网的要素
语义网有几个要素:标记语言,表达知识领域里概念及其相关关系的实用分类系统;包含词表和规则的知识库以及相关的信息技术。
3.实用分类系统
实用分类系统的主要成分是一整套对某一领域里的知识进行表述的词和术语,编制者根据该知识领域的结构将这些词和术语组成等级类目,并且应用面向对象的方法按需要给一些类目加以更细的定义。实用分类系统与传统知识分类工具的一个根本区别就是系统中的概念、特性、限制条件等内容都是计算机可读(懂)的,因而实用分类表中的知识定义可以被再利用并且用推力规则来进行更高级的处理。
编制实用分类系统包括这样一些方法和步骤:知识采集,分析、提炼采集到的知识、有效性检验。
(三)、文本内容处理技术
文本内容主要是指构成文本的自然语言及其所表达的意义。文本内容处理技术,实质上就是自然语言处理技术。
1.基本概念
自然语言处理是人工智能的一个重要的研究分支,主要研究能够自动分析、理解和生成人类语言的计算机程序的设计原理和技术方法。自然语言处理只是指计算机处理书面语言的技术。计算机处理口语的技术称为言语处理技术。
2.基本技术和方法
计算机处理自然语言,从作为数据的语言的输入到输出,大体包括这样一些基本组成技术:语音识别和生成、文字识别、词法分析、句法分析、语义分析和解释、句子或文本生成、机器翻译中的语言转换处理等。
统计方法所需要的语言数据集叫做语料库。语料库就是有一定的使用目的,并按统计取样的原则,对语言文本或口语转成的文本进行选择并汇集起来形成的集合。
句法分析是自然语言理解处理过程中最核心、最关键的一环。正在蓬勃兴起的一类新型高度形式化、可计算的语法模型,即所谓基于约束的语法模型,这一类语法以LFG(词汇功能语法)、HPSG(中心词驱动的断语结构语法)为重要代表。基于约束的语法模型的首要特点就是语法描写分为多个层面进行。第一个层面称为成分结构,这个层面基本等同于CFG的描写,第二个层面称为功能结构,这个层面比第一个层面更为抽象,打破了自然语言的表面的线性结构和顺序,为向更加抽象的语义描写以及逻辑表达奠定基础。
自然语言生成的研究分为两类,一种是理论性的研究(验证某一种理论,特别是某一种语言学或语法理论),另一种是实用性的研究,即与某种特定的自然语言处理任务,比如机器翻译译文的生成相联系。大体上讲,整个生成过程依顺序可分为三个阶段或三个认为:篇章规划、句子生成、语音合成。
3.自然语言处理在文本内容处理中的主要应用
自然语言处理技术在文本内容处理中的主要应用,包括机器翻译、自然语言接口、自动分类和自动摘要等。
机器翻译从技术方法上分为直接式、转换式和中间语言式。
自然语言接口,又叫数据库的自然语言前端,是自然语言处理第一个重要的成功应用领域。自然语言接口的功能就是将一个对数据库的自然语言提问翻译为一个用数据库语言表示的提问式。另一种与自然语言接口很相似的应用就是所谓问答系统。但问答系统针对的不是一个结构化的数据库,而是以一个背景知识库为基础,自动阅读和理解有关的文本,这些文本都具备情节。
(四)、个性化信息服务
1.个性化信息服务的定义和目的
个性化信息服务是以信息活动中所涉及的用户信息需求、使用行为偏好和环境特点为依据,运用信息技术为用户构建个性化信息环境的服务机制和相关的服务项目,以实现满足用户个性化信息需求的资源定位、检索、处理和利用的过程。
个性化信息服务的主要内容包括:使用环境的个性化;服务时空的个性化;服务方式的个性化;服务内容的个性化,即向用户传送他真正需要的信息。
个性化信息服务的目的是:方便用户的信息获取,节省用户寻找信息的时间;发现用户潜在的信息需求;使信息服务系统具有更好的适应性,提升竞争力。
2.个性化信息服务的信息支撑技术
个性化信息服务的实现涉及两个重要环节,一是根据信息活动中所涉及的各种用户需求条件构建个性化的用户模型,二是根据已建立的用户模型将用户所需信息从全局信息空间中分离出来,形成与用户所需匹配的个性化信息集合。个性化信息服务所涉及的信息技术较多,其中用户建模技术、信息过滤技术、界面定制技术等是个性化信息服务的关键支撑。
建立用户模型所涉及的相关问题包括用户信息应该包括哪些内容、怎样收集这些信息和怎样表示用户模型等。
信息过滤的类型包括:基于内容的过滤、协同过滤、混合过滤。
智能搜索代理是能代替用户完成信息检索认为的软件,它通过观察用户行为、接收用户反馈等途径建立和更新用户兴趣模型。用户向代理提出检索请求,代理向多个搜索引擎发送检索请求,并将收到的检索结果按照用户兴趣模型进行过滤,最后只将发送有用的信息给用户。
信息推荐和搜索引擎是两种不同的服务模式。搜索引擎是一种被动的信息服务,而信息推荐是一种主动的信息服务。信息推荐是基于用户以前感兴趣或不感兴趣的样本集合来向用户推荐新的信息。
用于个性化界面定制的技术包括动态网页相关技术、XML和XSLT相关技术、Potal技术等。
3.个性化信息服务的应用
现有的很多信息服务系统都实现了个性化的功能,包括传统信息服务系统的个性化资源服务、数字图书馆中的My Library以及商业网站的个性化推荐等。
|
|
|