数字资源整合的机制与方法内容摘要:

( 2)信息抽取技术 ( 3)查询处理技术 ( 4)结果整合技术 ( 5)语义整合技术 ( 1)信息源选择技术 mediator/wrapper整合机制是一种虚拟整合方式,整合系统本身并不存储被整合的数字资源,当用户进行查询时,如果将用户查询不加区别地发送给参与整合的所有信息源,必然会导致占用较多的带宽并增加系统的负担,这就需要利用信息源选择技术来确定相关度高的信息源,以提高整合系统的效率。 信息源选择技术主要包括信息源描述和信息源选择两个方面,前者是按一定的算法建立对各信息源的描述模型,后者是在信息源描述模型的基础上,根据用户查询,按一定算法选出相关度高的信息源作为查询对象。 ( 2)信息抽取技术 信息抽取技术应用于整合系统的目的是将参与整合的半结构化、非结构化信息源中的数字资源转化成结构性更强、语义更清晰的格式,以提高查询速度。 目前,信息抽取技术已经成为了生成 wrapper的关键技术之一,广泛应用于面向网络数字资源的整合系统中。 ( 3)查询处理技术 查询处理技术是 mediator/wrapper整合机制中的最重要的技术之一,是对查询进行检验、重构、优化的技术。 用户对整合系统查询时,整合系统需首先对用户查询进行语法分析和检验,确保查询符合系统全局模式的要求,这部分工作主要由查询检验技术完成。 此后,整合系统再将经过检验的查询按一定的规则转换为面向不同信息源模式(本地模式)的多个查询,这个过程称为查询重构。 整合系统面对的是不同的信息源,由于各个信息源有其自身的特点,例如有不同的传输带宽和传输延时,加之当前运行情况有不确定性,如当前的信息源访问量是大还是小、信息源是否能很快与整合系统建立连接等等,这就要求整合系统根据各信息源的当前运行情况制定最优查询计划和查询调配方案,并据此对各信息源进行查询,这个过程称为查询优化。 ( 4)结果整合技术 整合系统提供对各信息源的一站式访问,因而对信息源访问完毕后需要用 mediator对来自不同信息源的结果信息进行整合及合成,以统一的形式呈现给用户。 结果整合主要是对不同信息源的结果做并操作,并且重新计算结果的相关度。 一般地说,对一个信息源进行查询会形成一个相应的查询子视图,结果整合的目的就是将这些子视图连接起来,形成一个完整的视图,提供给用户。 ( 5)语义整合技术 随着整合研究理论和实践不断深入,Ontology、语言建模、机器学习等语义相关技术逐渐应用于数字资源整合。 语义整合技术被用来在系统运行期间获取和处理数字资源的意义及其之间的关联,使整合系统能够建立用户提问与各信息源之间的语义联系,消除各种数字资源的异构性,并能够将分散存储、表现形式不同的信息源中的有用资源进行再组织,真正满足用户的信息需求,从而提高数字资源整合的质量。 整合机制- Agent整合机制 Agent是处于一定的环境中或者作为环境的一部分存在的一种软件系统,它利用传感器( Sensor)感应环境,获取相关信息,然后根据这些信息和指定的目标执行相应操作。 近年来,研究人员将 Agent技术应用于整合系统中,形成了 Agent整合机制。 Agent整合机制以 Agent作为核心模块,以 ontology作为核心技术,比较适合于整合分布性较强的数字资源, 其原理是:将整合系统框架中的各个(或主要)功能模块封装为 Agent,各 Agent之间进行通信、交互和合作,从而有效地实现整合。 Agent整合 机制 的基本原理如图所示 结果 结果 代理方 Agent 代理方 Agent 代理方 Agent 用户 Agent 用户 Agent 提问 提问 信息源 信息源 信息源 资源 Agent 资源 Agent 资源 Agent 在这种整合 机制 中,使用了三类基本的 Agent:用户 Agent、资源 Agent和代理方 Agent。 用户 Agent负责维护用 户信息,并提供系统接口, 以方便用户与整合系统进行交互。 资源 Agent负责对分布式资源进行处理,将数字资源按照整合系统的表示形式进行描述和转换。 代理方 Agent负责将从用户 Agent发出的查询请求与所要查询的资源 Agent进行匹配。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。