期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
因特网文本智能挖掘的模糊聚类算法研究 被引量:7
1
作者 王晓勇 肖四友 张文祥 《计算机仿真》 CSCD 北大核心 2009年第7期216-219,共4页
随着Internet的深入发展及普及应用,网络中可获取的大部分文本信息由来自各种数据源的文档组成。由于电子形式的文本信息飞速增涨,可以获知的文本信息已成海量之势,文本挖掘已经成为信息领域的研究热点,快速得到目标文本成为互联网发展... 随着Internet的深入发展及普及应用,网络中可获取的大部分文本信息由来自各种数据源的文档组成。由于电子形式的文本信息飞速增涨,可以获知的文本信息已成海量之势,文本挖掘已经成为信息领域的研究热点,快速得到目标文本成为互联网发展的瓶颈。在动态聚类方法和基于特征属性分类法的基础上提出基于混合模糊聚类理论的文本数据分类系统新模型,在模型基础上探究了一种模糊聚类仿真算法,通过实验验证算法能有效提高文本分类效率及文本分类准确率,从而在实际网络文本挖掘应用中快速得到目标文本,实现因特网文本智能挖掘。 展开更多
关键词 因特网文本 混合模糊聚类 文本智能挖掘 仿真算法
下载PDF
基于对话文本智能挖掘的电力设备供应商评价 被引量:6
2
作者 王海瑶 王慧芳 +3 位作者 胡俊华 徐积全 李建红 何奔腾 《电力自动化设备》 EI CSCD 北大核心 2021年第7期210-217,共8页
目前电网企业的电力设备供应商满意度评价主要依赖于人工统计和指标计算,其准确性受评价人员和评价内容的影响较大。以电力业务平台的对话文本为研究对象,在扩充已有电力本体词典的词条和属性的基础上,建立了基于文本挖掘技术的电力设... 目前电网企业的电力设备供应商满意度评价主要依赖于人工统计和指标计算,其准确性受评价人员和评价内容的影响较大。以电力业务平台的对话文本为研究对象,在扩充已有电力本体词典的词条和属性的基础上,建立了基于文本挖掘技术的电力设备供应商评价模型。首先提出了基于Transformer的双向编码器下句预测与余弦相似度加权的单轮对话文本下句预测分析方法,建立了对话中断交叉处理流程和供应商识别规则,实现了电力对话文本主题归纳;然后考虑对话文本语义情感的复杂性,提出了对话情感分析规则,建立了供应商评价模型。最后通过算例验证了所提方法的准确性,结果表明基于对话文本智能挖掘的电力设备供应商评价,具有可行性和有效性,可以作为目前评价方法的有益补充。 展开更多
关键词 电力设备 文本智能挖掘 对话文本 下句预测 情感分析 供应商评价
下载PDF
基于智能文本挖掘的技术水平预测研究——以声呐技术为例
3
作者 郭世杰 董璐 +2 位作者 孙蒙鸽 刘细文 韩涛 《情报理论与实践》 北大核心 2024年第5期12-17,38,共7页
[目的/意义]从开源文献中挖掘关于未来技术水平预测的观点信息,为我国前瞻预判科技风险、吸收利用国外技术专家智慧提供支撑。[方法/过程]设计“未来时间戳”词典,结合该词典和技术领域关键词,制定包含未来技术水平预测信息的文献检索... [目的/意义]从开源文献中挖掘关于未来技术水平预测的观点信息,为我国前瞻预判科技风险、吸收利用国外技术专家智慧提供支撑。[方法/过程]设计“未来时间戳”词典,结合该词典和技术领域关键词,制定包含未来技术水平预测信息的文献检索策略。利用搜索引擎和学术文献检索平台获取文献全文,或批量下载文献关键字段信息(标题、摘要、关键词等)。利用模式匹配方法和“技术性能三元组”智能文本挖掘软件,从文献中抽取“未来时间戳”+“技术性能三元组”,并对不同国家、机构的预测结果进行总结归纳。[结果/结论]经过开展声呐技术领域未来技术水平预测实证分析,认为基于文本智能挖掘方法开展技术水平预测是可行的,且相对于趋势外推法、专家咨询法等具有结论权威、可靠、能够利用竞争对手国家专家智慧等优势。[局限]受限于文献全文的可获得性等因素,人工判读工作仍必不可少;在此基础上还可以进一步开展中外未来技术水平对比、技术威胁识别等研究工作。 展开更多
关键词 技术水平 技术预测 智能文本挖掘 技术性能三元组
下载PDF
Research on Text Mining of Syndrome Element Syndrome Differentiation by Natural Language Processing 被引量:5
4
作者 DENG Wen-Xiang ZHU Jian-Ping +6 位作者 LI Jing YUAN Zhi-Ying WU Hua-Ying YAO Zhong-Hua ZHANG Yi-Ge ZHANG Wen-An HUANG Hui-Yong 《Digital Chinese Medicine》 2019年第2期61-71,共11页
Objective Natural language processing (NLP) was used to excavate and visualize the core content of syndrome element syndrome differentiation (SESD). Methods The first step was to build a text mining and analysis envir... Objective Natural language processing (NLP) was used to excavate and visualize the core content of syndrome element syndrome differentiation (SESD). Methods The first step was to build a text mining and analysis environment based on Python language, and built a corpus based on the core chapters of SESD. The second step was to digitalize the corpus. The main steps included word segmentation, information cleaning and merging, document-entry matrix, dictionary compilation and information conversion. The third step was to mine and display the internal information of SESD corpus by means of word cloud, keyword extraction and visualization. Results NLP played a positive role in computer recognition and comprehension of SESD. Different chapters had different keywords and weights. Deficiency syndrome elements were an important component of SESD, such as "Qi deficiency""Yang deficiency" and "Yin deficiency". The important syndrome elements of substantiality included "Blood stasis""Qi stagnation", etc. Core syndrome elements were closely related. Conclusions Syndrome differentiation and treatment was the core of SESD. Using NLP to excavate syndromes differentiation could help reveal the internal relationship between syndromes differentiation and provide basis for artificial intelligence to learn syndromes differentiation. 展开更多
关键词 Syndrome element syndrome differentiation (SESD) Natural language processing (NLP) Diagnostics of TCM Artificial intelligence Text mining
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部