期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
融合C-Value和LDA的社会化标签研究热点识别与分析
1
作者 冯翠翠 莫富传 《情报探索》 2019年第3期33-39,共7页
[目的/意义]旨在帮助研究人员更清晰地认识与界定国内社会化标签研究领域的热点和发展演化过程。[方法/过程]综合基于C-value术语抽取的词频分析和融合Gibbs抽样方法的LDA概率模型的优势,对社会化标签领域的研究热点进行识别。[结果/结... [目的/意义]旨在帮助研究人员更清晰地认识与界定国内社会化标签研究领域的热点和发展演化过程。[方法/过程]综合基于C-value术语抽取的词频分析和融合Gibbs抽样方法的LDA概率模型的优势,对社会化标签领域的研究热点进行识别。[结果/结论]个性化推荐、社会化标签系统、知识管理、网络信息资源检索、资源聚合、用户兴趣和情感倾向等是目前国内社会化标签研究的6大热点。社会化标签领域研究热点的识别与分析,有助于研究者更好地把握未来的研究方向。 展开更多
关键词 社会化标签 c-value算法 LDA模型 热点主题 个性化推荐 资源聚合
下载PDF
基于语料库的对外汉语教学领域术语提取
2
作者 卢一鑫 《中国科技术语》 2024年第1期11-18,共8页
文章介绍了自动提取对外汉语教学领域术语的方法。以对外汉语教学领域文本为目标文本,遵循主题取向、语料科学性、样本代表性、规模有限性等原则,建立专用语料库,并对其进行分词标注等加工;将统计学和语言学规则相结合,引用C-value方法... 文章介绍了自动提取对外汉语教学领域术语的方法。以对外汉语教学领域文本为目标文本,遵循主题取向、语料科学性、样本代表性、规模有限性等原则,建立专用语料库,并对其进行分词标注等加工;将统计学和语言学规则相结合,引用C-value方法计算术语度值,探索该领域内不同长度术语的发现、辨识及提取的“混合方法”(hybrid solution),最终建立对外汉语教学术语集,其中包含单词型术语238个,两词术语375个,三词术语121个和50个由4~6个单词组成的长术语。 展开更多
关键词 专用语料库 术语提取 对外汉语教学 对外汉语教学术语集 c-value算法
下载PDF
基于关键名词短语聚类的中文搜索结果聚类 被引量:1
3
作者 麻雪云 肖诗斌 +1 位作者 王弘蔚 施水才 《计算机工程与应用》 CSCD 北大核心 2009年第31期118-121,共4页
目前,搜索结果聚类方法大多数采用基于文档的方法,不能生成有意义的聚类标签。为了解决这个问题,提出一种基于关键名词短语聚类的中文搜索结果聚类方法,该方法将名词短语、相关搜索词作为候选聚类标签,利用C-Value算法、IDF值筛选标签,... 目前,搜索结果聚类方法大多数采用基于文档的方法,不能生成有意义的聚类标签。为了解决这个问题,提出一种基于关键名词短语聚类的中文搜索结果聚类方法,该方法将名词短语、相关搜索词作为候选聚类标签,利用C-Value算法、IDF值筛选标签,然后使用Chameleon算法将标签聚类,最后将搜索结果划分到最相关的聚类簇。实验证明,该方法把关键名词短语和相关搜索词作为聚类标签,有效地提高了标签的描述性,降低了聚类算法的时间复杂度。 展开更多
关键词 搜索结果聚类 关键名词短语抽取 c-value算法 CHAMELEON算法
下载PDF
基于排序集成的哈萨克语固定短语抽取
4
作者 桑海岩 古丽拉·阿东别克 +1 位作者 孙瑞娜 陈莉 《计算机工程与应用》 CSCD 2014年第21期205-209,223,共6页
短语抽取是文本自动分类、主题提取及专利检索分析等文本信息理解等工作中都要应用到的一项关键技术。固定短语抽取作为短语研究的一部分,对短语标注、辞典编撰等自然语言处理任务都具有重要的现实意义。哈萨克语是黏着语,词形变化丰富... 短语抽取是文本自动分类、主题提取及专利检索分析等文本信息理解等工作中都要应用到的一项关键技术。固定短语抽取作为短语研究的一部分,对短语标注、辞典编撰等自然语言处理任务都具有重要的现实意义。哈萨克语是黏着语,词形变化丰富,这些特点给哈语固定短语的抽取带来了一定的困难。提出一个总体的固定短语抽取算法,把固定短语抽取看作一个排序问题,使用C-value、互信息和log-likelihood进行抽取排序,并设计了一个新的排序集成方法对抽取的结果进行集成。实验分析结果表明,与单独的抽取算法比较,该算法达到了更高的准确率。 展开更多
关键词 自然语言处理 固定短语 排序集成 互信息 似然比 c-value算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部