本书是基于双语主题空间的跨语言信息检索总体框架研究,在统一的框架下,从双语平行语料库抽取出一系列的主题构成每种语言的主题空间。每种语言的主题空间独立存在,且通过双语语义对应关系建立双语主题空间。双语主题空间反映了文档与文档、文档与词、词与词的语义对应关系,揭示了语言之间、语言内部的固有结构和内在联系,是抽象的概念空间,是各语言原始文档的中间表示。表示方式可以是线性或者非线性的。从数学原理上来说,两个主题空间是近似等价的。我们将查询和文档投影到双语主题空间上,不需要直接翻译,可以实现跨语言的检索、分类和聚类。
情报检索-研究
评论内容
发表评论