期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于Transformer的司法文书命名实体识别方法
1
作者 王颖洁 张程烨 +1 位作者 白凤波 汪祖民 《计算机科学》 CSCD 北大核心 2024年第S01期113-121,共9页
命名实体识别是自然语言处理领域的关键任务之一,是实现下游任务的基础。目前针对司法领域的相关研究相对较少,司法系统的信息化和智能化转型仍有许多问题亟需解决。相比其他领域的文本,司法文书存在专业性强、语料资源少等局限,导致现... 命名实体识别是自然语言处理领域的关键任务之一,是实现下游任务的基础。目前针对司法领域的相关研究相对较少,司法系统的信息化和智能化转型仍有许多问题亟需解决。相比其他领域的文本,司法文书存在专业性强、语料资源少等局限,导致现有的司法文书识别结果较低。因此,从以下3方面开展研究:首先,提出了一种多标签层级迭代的文本标注方式,可以对原始司法文书文本进行自动化标注,同时有效地提升司法文书命名实体识别任务的实体识别效果;其次,提出了一种交融式的Transformer神经网络模型,对汉字固有属性的深层特征进行了充分利用,用于对司法文书进行命名实体识别;最后,对所提出的标注方法和模型与其他神经网络模型进行了对比实验。所提出的文本标注方式可以较为准确地实现司法文书的标注任务;同时,所提出的模型在通用数据集中相对于对照模型有较大的提高,并在司法领域数据集中取得了良好的效果。 展开更多
关键词 自然语言处理 数据标注 Transformer模型 深度学习 司法信息化
下载PDF
中文命名实体识别研究综述 被引量:12
2
作者 王颖洁 张程烨 +2 位作者 白凤波 汪祖民 季长清 《计算机科学与探索》 CSCD 北大核心 2023年第2期324-341,共18页
随着自然语言处理领域相关技术的快速发展,作为自然语言处理的上游任务,提高命名实体识别的准确率对于后续的文本处理任务而言具有重要的意义。然而,中文和英文语系之间存在差异,导致英文的命名实体识别研究成果难以有效地迁移到中文研... 随着自然语言处理领域相关技术的快速发展,作为自然语言处理的上游任务,提高命名实体识别的准确率对于后续的文本处理任务而言具有重要的意义。然而,中文和英文语系之间存在差异,导致英文的命名实体识别研究成果难以有效地迁移到中文研究中。因此从以下四方面分析了当前中文命名实体识别研究中的关键问题:首先以命名实体识别的发展历程作为主要线索,从各阶段存在的优缺点、常用方法和研究成果等角度进行了综合论述;其次从序列标注、评价指标、中文分词方法及数据集的角度出发,对中文文本预处理方法进行了总结;接着针对中文字词特征融合方法,从字融合和词融合的角度对当前的研究进行了总结,并对当前中文命名实体识别模型的优化方向进行了论述;最后分析了当前中文命名实体识别在各领域的实际应用。对当前中文命名实体识别的研究进行论述,旨在帮助科研工作者更为全面地了解该任务的研究方向和研究意义,从而为新方法和新改进的提出提供一定的参考。 展开更多
关键词 命名实体识别 深度学习 特征融合 评估指标
下载PDF
自然语言处理在文本情感分析领域应用综述 被引量:38
3
作者 王颖洁 朱久祺 +2 位作者 汪祖民 白凤波 弓箭 《计算机应用》 CSCD 北大核心 2022年第4期1011-1020,共10页
文本情感分析已经逐渐成为自然语言处理(NLP)的重要内容,并在系统推荐、用户情感信息获取,为政府、企业提供舆情参考等领域越来越占据重要地位。通过文献调研的方式,对情感分析领域的方法进行对比和综述。首先,从时间、方法等维度对情... 文本情感分析已经逐渐成为自然语言处理(NLP)的重要内容,并在系统推荐、用户情感信息获取,为政府、企业提供舆情参考等领域越来越占据重要地位。通过文献调研的方式,对情感分析领域的方法进行对比和综述。首先,从时间、方法等维度对情感分析的方法进行文献调研;然后,对情感分析的主要方法、应用场景进行归纳总结和对比;最后,在此基础上分析每种方法的优缺点。根据分析结果可以知道,在面对不同的任务场景,主要有三种情感分析的方法:基于情感字典的情感分析法、基于机器学习的情感分析法和基于深度学习的情感分析法,基于多策略混合的方法成为改进的趋势。文献调研表明,文本情感分析的技术方法还有改进的空间,在电子商务、心理治疗、舆情监控方面有较大市场和发展前景。 展开更多
关键词 自然语言处理 情感分析 情感字典 机器学习 深度学习
下载PDF
软硬结合的快速模糊C-均值聚类算法的研究 被引量:7
4
作者 尹海丽 王颖洁 白凤波 《计算机工程与应用》 CSCD 北大核心 2008年第22期172-174,共3页
讨论的是对模糊C-均值聚类方法的改进,在原有的模糊C-均值算法的基础上,提出一种软硬结合的快速模糊C-均值聚类算法。快速模糊C-均值聚类算法是在模糊C-均值聚类算法之前加入一层硬C-均值聚类算法。硬聚类算法能比模糊聚类算法以高得多... 讨论的是对模糊C-均值聚类方法的改进,在原有的模糊C-均值算法的基础上,提出一种软硬结合的快速模糊C-均值聚类算法。快速模糊C-均值聚类算法是在模糊C-均值聚类算法之前加入一层硬C-均值聚类算法。硬聚类算法能比模糊聚类算法以高得多的速度完成,将硬聚类中心作为模糊聚类中心的迭代初值,从而提高模糊C-均值聚类算法的收敛速度,这对于大量数据的聚类是很有意义的。用数据仿真验证了这种快速模糊C-均值聚类算法比模糊C-均值算法迭代调整过程短,收敛速度快,聚类效果好。 展开更多
关键词 模糊 C-均值算法 模糊聚类 软聚类 硬聚类
下载PDF
裁判文书关键词提取的改进方法研究 被引量:3
5
作者 白凤波 常林 +4 位作者 王世凡 李彬 王颖洁 周红 刘耀 《计算机工程与应用》 CSCD 北大核心 2020年第23期153-160,共8页
在国家加强依法治国的方针指引下,自然语言处理(NLP)和信息检索(IR)等领域与法治社会的深入结合是必然趋势。为司法工作者提供正确、全面的智能化辅助以提高工作效率,对裁判文书的关键词提取方法进行了研究。针对传统关键词提取方法的劣... 在国家加强依法治国的方针指引下,自然语言处理(NLP)和信息检索(IR)等领域与法治社会的深入结合是必然趋势。为司法工作者提供正确、全面的智能化辅助以提高工作效率,对裁判文书的关键词提取方法进行了研究。针对传统关键词提取方法的劣势,结合词语的词性、长度、词跨度、位置以及文档所属类别等多重因素,并基于图模型的TextRank算法,提出了一种改进的TF-IDF算法(IAKEF),引入信息熵、离散度、融合特征的概念,主要解决了传统算法对于词语在语义上的忽略和类间、类内信息分布上的问题,使其能够更有效地从文本中选择特征。通过对比实验,对改进算法的效果进行分析和评价,实验结果表明改进的算法与传统的算法相比在准确率、召回率及F1-Measure上均有显著的提高。 展开更多
关键词 改进TF-IDF 关键词抽取 信息熵 离散度 特征融合
下载PDF
关于模糊C-均值(FCM)聚类算法的改进 被引量:1
6
作者 王颖洁 白凤波 王金慧 《大连大学学报》 2010年第6期1-4,共4页
对模糊C-均值聚类算法的改进,即在原有的模糊C-均值算法的基础上,用一种新的定义距离的方法替代欧氏空间中距离的定义,改进模糊聚类算法。并且用数据仿真验证这种改进的模糊聚类算法与原来算法相比,聚类效果更好,分类更清晰。
关键词 模糊C-均值算法 模糊加权距离 模糊加权因子
下载PDF
工作区空调新技术的应用
7
作者 白凤波 周文源 《辽宁纺织科技》 1993年第2期40-43,共4页
关键词 化纤厂 工作区 空气调节
下载PDF
甲基苯丙胺检测方法研究进展 被引量:7
8
作者 郝红霞 白凤波 《分析试验室》 CAS CSCD 北大核心 2020年第3期364-372,共9页
通过调研和搜集国内外发表的重要文献,对毒品甲基苯丙胺的检测方法进行全面的研究分析,对于传统检测技术、电子微芯片竞争免疫法、局域表面等离子共振技术、有机场效应晶体管检测冰毒、电化学发光方法、快速傅立叶变换方波伏安法、无标... 通过调研和搜集国内外发表的重要文献,对毒品甲基苯丙胺的检测方法进行全面的研究分析,对于传统检测技术、电子微芯片竞争免疫法、局域表面等离子共振技术、有机场效应晶体管检测冰毒、电化学发光方法、快速傅立叶变换方波伏安法、无标记安培免疫、酶联免疫吸附等技术进行了详细论述,形成最新的研究进展,并介绍课题组检测甲基苯丙胺的最新研究成果,以期为检测人员和科研人员开展毒品甲基苯丙胺的检测时提供参考和借鉴,从而推动分析检测技术的不断更新与发展。 展开更多
关键词 甲基苯丙胺 检测方法 毒品检测
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部