CALIS IR
English   中文  

| Receive email updates | My CALIS IR | Edit Profile |

   Search

 

Communities& Collections | Browse by Issue Date | Browse by Author | Browse byTitle | Browse by Subject

Refine Results



   Search Results

  Search Use 7 ms        
 
面向主题的查询分类与用户查询意图分析
作者: 陈冬剑, 深圳大学计算机与软件学院 主题: 倒排索引位运算, 面向主题的查询分类, 索引关联规则扩展, 查询意图分析, 马尔可夫链模型 年份: 2011
摘要: 由于web自身的异构特性及web海量的数据,基于关键字的搜索引擎很难返回用户满意的查询结果。为获得更准确的查询结果,一些研究人员提出查询分类的思想,即将用户提交的简短的查询通过一定的方法映射到预先指定的目标类别中。近年来,查询分类成为研究的热点,并应用于优化搜索结果、垂直搜索引擎选择、广告推荐等。本文对查询分类进行了系统的论述,在此基础上,重点对面向主题的查询分类、用户查询意图分析进行了深入研究与改进。第一,本文提出了基于深度优先和倒排索引位运算的频繁项目集挖掘算法(df-fimbii)。关联规则挖掘研究中主要要解决的两个问题:(1)减少候选集数量以及生成时间;(2)减少计算支持度的时间和空间开销。因为在查询分类的研究中要用到关联规则挖掘的算法,所以本文针对这两个问题,结合深度优先和倒排索引位算挖掘频繁项目集。实验表明,在小数据集以及中等规模数据集上,df-fimbii比其他算法在挖掘频繁项目集上有很大的优势。第二,本文对面向主题的查询分类进行了研究,针对现有的利用外部web资源进行查询特征丰富的方法容易产生高时延问题,本文提出一种基于索引关联规则扩展的查询分类方法(iare-qc),该方法采用基于索引的查询分类模型,将在线阶段的查询分类问题转化为等价的离线阶段的索引词分类问题,以改善查询分类的响应时间。为获得准确的索引词特征丰富,iare-qc进一步利用所提出基于索引关联规则扩展的相似度投票算法(iare-sv)确定索引词类别。在模拟搜索引擎环境上的实验结果表明,iare-sv比常用的简单投票算法(sv)能获得很好的查询分类效果。第三,本文对用户查询意图分析进行了相关探讨。首次利用中文领域最大的知识库百度百科,建立意图模型。通过马尔可夫链挖掘百度百科里面词条与词条之间的关系,用大量的词条构建某特定意图的表现形式。与其他研究不同,本文的意图分析方法没有收集大量的样本去训练一个意图分类器,这种样能够最大限度地减少对训练样本标注的人工参与。在本章的意图模型中,每一个词条都直接用以识别输入查询的意图,并且实验结果证明本章的方法比传统的分类方法有更好的性能。
基于全局特征的场景分类研究及应用
作者: 黄涛, 深圳大学计算机与软件学院 主题: 场景分类, 全局特征, 支持向量机, 分类器, 半监督学习分类算法 年份: 2011
摘要: 随着计算机技术、网络技术以及多媒体技术的发展,多媒体信息的传输、处理及访问呈指数级增长。由于视频、图像可以直观准确地传达丰富的信息,在多媒体信息中占有很重要的地位,其一直以来都是计算机技术的研究热点。视频图像的场景分类技术是视频内容分析的一个重要研究内容,本论文将对其进行深入研究。 视频序列是由一系列镜头组成,每个镜头又是由一组的视频帧组成。每个镜头都由一帧或者若干帧作为关键帧,关键帧图像可以代表该镜头的主要内容。因此,我们对视频场景分类在空间域上是对视频关键帧图像的分类。本论文分别对图像的全局特征的提取方法、特征变换降维方法、场景分类算法等进行了分析和研究,并将基于图的半监督分类算法用于场景分类中,具体如下: 一、本文介绍了图像特征提取技术的研究历史现状,重点分析了视频图像的全局特征提取技术,并指出了基于全局特征场景分类的优越性。 二、本文研究了支持向量机分类器的构造问题。支持向量机分类器最初是为了解决二类分类问题,其分类速度快、分类精度高。但是,当其用于多类分类问题,其性能大大降低。对此,本文引入超球支持向量机多类分类算法,将同一类样本数据包围,把整个数据空间分成数个超球。通过引入约束条件,有效提高支持向量机的多分类性能。 三、本文对经典的半监督学习分类算法进行了分析,并将基于图的半监督学习分类算法应用于场景分类实验中。实验结果表明,该算法可以大大降低人工标注数据集的工作量,分类精度比同等人工标注样本量下全监督学习分类算法有所提高。四、本文将场景分类信息应用于提取视频中的视觉感兴趣区域,有效地指导了视频编码。
  • 返回 2 个结果  
  • 1

 

Copyright © 2001-2012  CALIS (Developed Based on CALIS IR Software) - Feedback Number of User on Line: 273     Total of Site Visit: 6596082