-
题名基于机器学习的无需人工编制词典的切词系统
被引量:24
- 1
-
-
作者
黄萱菁
吴立德
王文欣
叶丹瑾
-
机构
复旦大学计算机科学系
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
1996年第4期297-303,共7页
-
基金
国家高技术863智能机器人主题
国家自然科学基金
-
文摘
本文介绍了一个基于自学习的无需人工编制词典的切词系统.首先用统计方法建立起附有相关度的切词词典.然后,提出将切词问题转化为一个有向图中求解最大加权路径问题,并提出利用词典中的相关度信息切分文本的一个新算法.最后,我们对词典和切词的质量都作了系统的分析,并与其他方法作了性能比较.
-
关键词
机器学习
汉字信息处理
词典
切词系统
-
Keywords
Binomial Distribution, Coincidence Degree, Generalized Likelihood Ratio, Recall, Precision.
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名智能检索系统中生成语义分词的原理及调整策略
被引量:6
- 2
-
-
作者
颜小平
严长春
马顺
贺隽
裴非
杜寅辰
-
机构
国家知识产权局专利局专利审查协作广东中心
北京知呱呱科技服务有限公司
开普云信息科技股份有限公司
-
出处
《中国发明与专利》
2022年第9期42-51,共10页
-
基金
广东省重点领域研发计划项目“基于大数据智能的多层次知识检索关键技术研究及应用”(项目编号2021B0101420001)。
-
文摘
智能检索系统中的语义检索已经是专利检索中必不可少的检索方式,基于语义基准生成的语义分词对语义检索的结果有着至关重要的影响。本文从语义分词生成的原理出发,通过具体案例阐述了语义分词的选择策略和语义分词及其权重的调整策略,通过优化语义分词的调整来实现智能检索系统检索效能的提升。
-
关键词
语义检索
关键词
语义分词
系统切词
分词权重
-
Keywords
semantic retrieval
keyword
semantic word
system cut
semantic word weights
-
分类号
D923.4
[政治法律—民商法学]
-