期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于联合权重的多文档关键词抽取技术 被引量:16
1
作者 杨洁 季铎 +2 位作者 蔡东风 林晓庆 白宇 《中文信息学报》 CSCD 北大核心 2008年第6期75-79,共5页
该文提出一种多文档关键词抽取方法,该方法提出ATF×PDF(Average Term Frequency×ProportionalDocument Frequency)来计算词语权重,并根据候选关键词之间的语义相似度,采用联合权重方法重新计算候选关键词的权重来抽取关键词... 该文提出一种多文档关键词抽取方法,该方法提出ATF×PDF(Average Term Frequency×ProportionalDocument Frequency)来计算词语权重,并根据候选关键词之间的语义相似度,采用联合权重方法重新计算候选关键词的权重来抽取关键词。该方法综合考虑了词语的频率,词性以及词语之间的语义相似性等信息,实验表明,该方法能有效抽取多个文档的关键词,同基于关键词的聚类标记方法相比,其准确率提高3%,召回率提高7%,F-measure提高4.4%。 展开更多
关键词 计算机应用 中文信息处理 atf×pdf 联合权重 多文档 语义相似度
下载PDF
大量网络游记文本中热度地名提取方法与实证研究 被引量:22
2
作者 李照航 郭风华 +2 位作者 李仁杰 傅学庆 严正峰 《地理与地理信息科学》 CSCD 北大核心 2015年第1期68-73,共6页
探讨网络游记文本中的地名使用特征及其研究意义,地名使用状态的定量特征能够反映游客对旅游地景观的认知结构与旅游行为的一般过程。在现有中文分词技术基础上,结合游记文本中的地名使用特点,选用ATF*PDF方法计算特征词汇在整个旅游文... 探讨网络游记文本中的地名使用特征及其研究意义,地名使用状态的定量特征能够反映游客对旅游地景观的认知结构与旅游行为的一般过程。在现有中文分词技术基础上,结合游记文本中的地名使用特点,选用ATF*PDF方法计算特征词汇在整个旅游文本集中使用状态的综合权重,设计了一种基于大量网络游记文本的热度地名自动提取方法,为不使用自定义地名库的旅游地理研究奠定了基础。以游客点评网游记为样本的实验证明,该方法能够实现旅游相关地名的快速提取,地名使用热度越高,提取准确率越高;对地名提取结果的类型结构分析发现了自然和人文旅游地游记在词汇使用方面的共性和差异,指示了旅游文本地名的分布意义及其对旅行过程其他信息解读的潜在价值,预示了网络游记文本在进一步解析旅游者的旅游地认知特征和旅游行为过程方面的科学意义。 展开更多
关键词 网络游记文本 热度地名 atfpdf模型 多样本集合共现
下载PDF
本体进化需求自动化生成模型的构建与实现 被引量:1
3
作者 尹绍宏 李敏 《计算机科学》 CSCD 北大核心 2013年第1期241-243,272,共4页
通过对本体进化的需求分析,提出了一个进化需求的自动生成模型。在此模型中主要通过对领域文本进行分词获得候选概念,先进行概念还原,再通过筛选、简约、转换获得最终的关键概念。采用ATF*PDF算法实现了关键概念的筛选,并引入叙词表把... 通过对本体进化的需求分析,提出了一个进化需求的自动生成模型。在此模型中主要通过对领域文本进行分词获得候选概念,先进行概念还原,再通过筛选、简约、转换获得最终的关键概念。采用ATF*PDF算法实现了关键概念的筛选,并引入叙词表把概念转换成规范化格式,把复合的进化需求分解成相应的原子变化,并结合相应的进化策略实现了一个本体自动进化系统。对实验的评测和分析说明了该模型能获得得良好的实验效果。 展开更多
关键词 本体进化 进化需求 自动化生成 atfpdf算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部