期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于VC++/MFC的中文自动分词算法及其软件的实现 被引量:5
1
作者 王艳 元昌安 +2 位作者 覃晓 彭昱忠 宋叶俊 《广西师范学院学报(自然科学版)》 2008年第3期104-108,共5页
中文自动分词一直是中文信息处理、Web文档挖掘等处理文档类研究的基础技术之一,传统的中文分词技术研究,主要集中在算法的改进研究上,对实验的平台,有关软件的实现涉及很少.本文通过探讨中文自动分词的重要性和不可或缺性,给出了基于VC... 中文自动分词一直是中文信息处理、Web文档挖掘等处理文档类研究的基础技术之一,传统的中文分词技术研究,主要集中在算法的改进研究上,对实验的平台,有关软件的实现涉及很少.本文通过探讨中文自动分词的重要性和不可或缺性,给出了基于VC++/MFC自动分词软件的开发技术,最后对软件实现的四种基于词典的机械匹配的算法进行了实验分析,实验证明该系统能够高效的给中文信息处理提供一个平台. 展开更多
关键词 自动分词 中文信息处理 挖掘 基于词典的机械匹配
下载PDF
基于在线评论的Cucconi控制图
2
作者 彭昕怡 《统计学与应用》 2024年第6期2290-2300,共11页
近年来,互联网蓬勃发展,各种产品的使用用户会在互联网上发表自己的售后评价,这些评价中蕴含着很多潜在的信息,特别是文字评价。因此,本文首先采用了基于词典的情感分析将文字评价转换为情感得分,再进行后续的研究。情感得分代表着用户... 近年来,互联网蓬勃发展,各种产品的使用用户会在互联网上发表自己的售后评价,这些评价中蕴含着很多潜在的信息,特别是文字评价。因此,本文首先采用了基于词典的情感分析将文字评价转换为情感得分,再进行后续的研究。情感得分代表着用户对产品及服务的态度,当情感得分发生异常变化时,意味着该时段产品或服务有着质量下降的趋势,因此,对用户的在线评论进行监控有着极其重要的意义。当情感得分失控时,我们能及时告知产品经理,以便采取一些相关措施,减少不必要的损失。在此基础上,本文提出了非参数的Cucconi-EWMA控制图,来对情感得分的位移参数和尺度参数同时进行监控。最后,将本文提出的非参数控制图用于了实际案例上,监控效果良好,进一步证实了本文控制图对在线评论监控的有效性。In recent years, the Internet has developed rapidly, and users of various products will publish their after-sales reviews on the Internet. These reviews contain a lot of potential information, especially text reviews. Therefore, this paper first uses dictionary-based sentiment analysis to convert text reviews into sentiment scores, and then conducts subsequent research. Sentiment scores represent the attitude of users towards products and services. When the sentiment score changes abnormally, it means that the product or service has a trend of declining quality during this period. Therefore, it is extremely important to monitor users’ online reviews. When the sentiment score is out of control, we can inform the product manager in time so that some relevant measures can be taken to reduce unnecessary losses. On this basis, this paper proposes a non-parametric Cucconi-EWMA control chart to monitor the displacement parameters and scale parameters of the sentiment score at the same time. Finally, the non-parametric control chart proposed in this paper is used in actual cases, and the monitoring effect is good, which further confirms the effectiveness of the control chart in this paper for online review monitoring. 展开更多
关键词 情感分析 基于词典 异常检测 Cucconi-EWMA 非参数
下载PDF
基于自主学习的专业领域文本DBLC分词模型 被引量:2
3
作者 冯国明 张晓冬 刘素辉 《数据分析与知识发现》 CSSCI CSCD 北大核心 2018年第5期40-47,共8页
【目的】提高对专业术语、名词占比较高的专业领域文本的分词准确度。【方法】提出将词典、统计、深度学习三者有机结合的DBLC模型,并编程实现。获取中国管理案例库中的部分案例作为专业领域语料,将其他几种已有分词模型作为对比对象进... 【目的】提高对专业术语、名词占比较高的专业领域文本的分词准确度。【方法】提出将词典、统计、深度学习三者有机结合的DBLC模型,并编程实现。获取中国管理案例库中的部分案例作为专业领域语料,将其他几种已有分词模型作为对比对象进行实验与分析。【结果】通过实验得到各模型在实验语料上的分词效果,DBLC模型在各评价指标上均优于其他模型,分词准确率达到96.3%。【局限】未对原词典词与新词做区别处理,没有考虑词典的存储结构问题,模型计算时间复杂度较高。【结论】本文提出的DBLC模型提高了专业领域文本的分词准确度,且该模型分词准确率与词典规模正相关。 展开更多
关键词 中文分词 序列标注 BI-LSTM-CRF 自主学习 基于词典的分词
原文传递
基于最佳粒度匹配的中文分词算法的研究 被引量:1
4
作者 丁洁 《自动化与仪器仪表》 2016年第7期169-170,共2页
首先,介绍了机械分词方法,指出中文分词所面临的问题。其次,介绍了几种常见的机械分词算法。然后,在结合上面所介绍理论的基础上,融入了最佳粒度匹配算法,完成了一个高效、实用的中文分词系统。最后,本文对系统进行了测试,结果证明该种... 首先,介绍了机械分词方法,指出中文分词所面临的问题。其次,介绍了几种常见的机械分词算法。然后,在结合上面所介绍理论的基础上,融入了最佳粒度匹配算法,完成了一个高效、实用的中文分词系统。最后,本文对系统进行了测试,结果证明该种算法的效率和准确率都相对较高。 展开更多
关键词 中文分词 基于词典 最佳粒度匹配
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部