针对场景分类问题,本文提出一种基于图像局部边缘区域的EILBP(Edge Improved Local Binary Pattern)视觉特征描述结合PLSA模型场景分类方法。EILBP视觉特征通过利用局部边缘区域的梯度、方向分布与特征的局部空间分布等信息对图像进行...针对场景分类问题,本文提出一种基于图像局部边缘区域的EILBP(Edge Improved Local Binary Pattern)视觉特征描述结合PLSA模型场景分类方法。EILBP视觉特征通过利用局部边缘区域的梯度、方向分布与特征的局部空间分布等信息对图像进行充分合理地描述。首先对场景图像边缘轮廓稠密采样,得到以稠密采样点为中心的图像局部边缘区域并提取区域的EILBP特征作为视觉词汇,对视觉词汇聚类形成视觉词汇表(码本);然后,用词袋(BOW,Bag-Of-Words)模型描述图像;最后,利用PLSA模型对图像的词袋模型进行潜在语义挖掘并用判定式KNN分类器进行场景分类,得到测试图像集合的混淆矩阵。在多类场景图像上的实验表明,本文所用的方法不需要对场景内容进行人工标注,具有较高的分类准确率,且对具有边缘轮廓的图像分类精度较高。展开更多
A novel method based on interval temporal syntactic model was proposed to recognize human activities in video flow. The method is composed of two parts: feature extract and activities recognition. Trajectory shape des...A novel method based on interval temporal syntactic model was proposed to recognize human activities in video flow. The method is composed of two parts: feature extract and activities recognition. Trajectory shape descriptor, speeded up robust features(SURF) and histograms of optical flow(HOF) were proposed to represent human activities, which provide more exhaustive information to describe human activities on shape, structure and motion. In the process of recognition, a probabilistic latent semantic analysis model(PLSA) was used to recognize sample activities at the first step. Then, an interval temporal syntactic model, which combines the syntactic model with the interval algebra to model the temporal dependencies of activities explicitly, was introduced to recognize the complex activities with a time relationship. Experiments results show the effectiveness of the proposed method in comparison with other state-of-the-art methods on the public databases for the recognition of complex activities.展开更多
关于舆情事件的新闻数据是纷繁复杂的.即便是关于同一舆情事件的新闻数据,往往包含有不同的子话题(事件的不同侧面).因此,如何生成能够准确描述事件子话题含义的标签对深入分析舆情事件(包括掌握事件热点、监测发展走向等)具有重要意义...关于舆情事件的新闻数据是纷繁复杂的.即便是关于同一舆情事件的新闻数据,往往包含有不同的子话题(事件的不同侧面).因此,如何生成能够准确描述事件子话题含义的标签对深入分析舆情事件(包括掌握事件热点、监测发展走向等)具有重要意义.事件子话题标签的生成通常包括两个关键步骤:首先发现子话题,然后依据每个子话题的关键词或文档内容生成描述该子话题的有效标签.传统方法在发现话题时多采用聚类或分类的方法,它们将同一个话题的文档整合到一个簇中.然而,由于隶属同一事件的文档具有很强的相似性,现有方法难以度量他们之间的距离,因此无法应用于发现事件子话题这一任务.此外,在为子话题生成标签时,传统的方法通常通过抽取来实现.此类方法所生成标签的准确性无法保证.为此,该文提出了一种基于PLSA with Background Language并结合关键词聚类发现事件内部子话题,进而基于维基百科等知识库生成事件子话题标签的模型ET-TAG.在多类舆情事件数据集上的实验结果表明,ET-TAG算法相比K-means和LDA等已有子话题发现方法具有更好的性能;从子话题标签生成角度而言,ET-TAG生成的标签相对于传统方法也具有更好的准确性和概括性.该文最后将ET-TAG算法生成的子话题标签用于事件的对比和追踪,结果表明通过子话题标签可以发现事件共性,并反映事件子话题热度的变化趋势.展开更多
文摘针对场景分类问题,本文提出一种基于图像局部边缘区域的EILBP(Edge Improved Local Binary Pattern)视觉特征描述结合PLSA模型场景分类方法。EILBP视觉特征通过利用局部边缘区域的梯度、方向分布与特征的局部空间分布等信息对图像进行充分合理地描述。首先对场景图像边缘轮廓稠密采样,得到以稠密采样点为中心的图像局部边缘区域并提取区域的EILBP特征作为视觉词汇,对视觉词汇聚类形成视觉词汇表(码本);然后,用词袋(BOW,Bag-Of-Words)模型描述图像;最后,利用PLSA模型对图像的词袋模型进行潜在语义挖掘并用判定式KNN分类器进行场景分类,得到测试图像集合的混淆矩阵。在多类场景图像上的实验表明,本文所用的方法不需要对场景内容进行人工标注,具有较高的分类准确率,且对具有边缘轮廓的图像分类精度较高。
基金Project(50808025)supported by the National Natural Science Foundation of ChinaProject(20090162110057)supported by the Doctoral Fund of Ministry of Education,China
文摘A novel method based on interval temporal syntactic model was proposed to recognize human activities in video flow. The method is composed of two parts: feature extract and activities recognition. Trajectory shape descriptor, speeded up robust features(SURF) and histograms of optical flow(HOF) were proposed to represent human activities, which provide more exhaustive information to describe human activities on shape, structure and motion. In the process of recognition, a probabilistic latent semantic analysis model(PLSA) was used to recognize sample activities at the first step. Then, an interval temporal syntactic model, which combines the syntactic model with the interval algebra to model the temporal dependencies of activities explicitly, was introduced to recognize the complex activities with a time relationship. Experiments results show the effectiveness of the proposed method in comparison with other state-of-the-art methods on the public databases for the recognition of complex activities.
文摘关于舆情事件的新闻数据是纷繁复杂的.即便是关于同一舆情事件的新闻数据,往往包含有不同的子话题(事件的不同侧面).因此,如何生成能够准确描述事件子话题含义的标签对深入分析舆情事件(包括掌握事件热点、监测发展走向等)具有重要意义.事件子话题标签的生成通常包括两个关键步骤:首先发现子话题,然后依据每个子话题的关键词或文档内容生成描述该子话题的有效标签.传统方法在发现话题时多采用聚类或分类的方法,它们将同一个话题的文档整合到一个簇中.然而,由于隶属同一事件的文档具有很强的相似性,现有方法难以度量他们之间的距离,因此无法应用于发现事件子话题这一任务.此外,在为子话题生成标签时,传统的方法通常通过抽取来实现.此类方法所生成标签的准确性无法保证.为此,该文提出了一种基于PLSA with Background Language并结合关键词聚类发现事件内部子话题,进而基于维基百科等知识库生成事件子话题标签的模型ET-TAG.在多类舆情事件数据集上的实验结果表明,ET-TAG算法相比K-means和LDA等已有子话题发现方法具有更好的性能;从子话题标签生成角度而言,ET-TAG生成的标签相对于传统方法也具有更好的准确性和概括性.该文最后将ET-TAG算法生成的子话题标签用于事件的对比和追踪,结果表明通过子话题标签可以发现事件共性,并反映事件子话题热度的变化趋势.