期刊文献+
共找到33篇文章
< 1 2 >
每页显示 20 50 100
融合多粒度语言知识与层级信息的中文命名实体识别模型
1
作者 于右任 张仰森 +1 位作者 蒋玉茹 黄改娟 《计算机应用》 CSCD 北大核心 2024年第6期1706-1712,共7页
针对当前大多数命名实体识别(NER)模型只使用字符级信息编码且缺乏对文本层次信息提取的问题,提出一种融合多粒度语言知识与层级信息的中文NER(CNER)模型(CMH)。首先,使用经过多粒度语言知识预训练的模型编码文本,使模型能够同时捕获文... 针对当前大多数命名实体识别(NER)模型只使用字符级信息编码且缺乏对文本层次信息提取的问题,提出一种融合多粒度语言知识与层级信息的中文NER(CNER)模型(CMH)。首先,使用经过多粒度语言知识预训练的模型编码文本,使模型能够同时捕获文本的细粒度和粗粒度语言信息,从而更好地表征语料;其次,使用ON-LSTM(Ordered Neurons Long Short-Term Memory network)模型提取层级信息,利用文本本身的层级结构信息增强编码间的时序关系;最后,在模型的解码端结合文本的分词信息,并将实体识别问题转化为表格填充问题,以更好地解决实体重叠问题并获得更准确的实体识别结果。同时,为解决当前模型在不同领域中的迁移能力较差的问题,提出通用实体识别的理念,通过筛选多领域的通用实体类型,构建一套提升模型在多领域中的泛化能力的通用NER数据集MDNER(Multi-Domain NER dataset)。为验证所提模型的效果,在数据集Resume、Weibo、MSRA上进行实验,与MECT(Multi-metadata Embedding based Cross-Transformer)模型相比,F1值分别提高了0.94、4.95和1.58个百分点。为了验证所提模型在多领域中的实体识别效果,在MDNER上进行实验,F1值达到了95.29%。实验结果表明,多粒度语言知识预训练、文本层级结构信息提取和高效指针解码器对模型的性能提升至关重要。 展开更多
关键词 命名实体识别 自然语言处理 知识图谱构建 高效指针 通用实体
下载PDF
中文多方对话篇章结构语料库构建及分析模型
2
作者 何威恺 蒋玉茹 +2 位作者 陈杰 李宇 张仰森 《北京信息科技大学学报(自然科学版)》 2023年第5期10-18,共9页
针对面向篇章结构分析的对话文本语料库缺乏的问题,构建了第一个中文的日常生活场景下多方对话篇章结构语料库。同时,提出了一种基于图神经网络的篇章结构分析模型,针对日常生活场景下多方对话的特点,使用图注意力网络进行图网络设计和... 针对面向篇章结构分析的对话文本语料库缺乏的问题,构建了第一个中文的日常生活场景下多方对话篇章结构语料库。同时,提出了一种基于图神经网络的篇章结构分析模型,针对日常生活场景下多方对话的特点,使用图注意力网络进行图网络设计和基本篇章单元编码;并且模型融入了角色识别特征及少量手工特征,使得篇章结构分析性能进一步提升。该模型在所构建的语料库上的实验结果与基线模型相比,篇章结构分析中的链接识别和关系识别两个任务的F1值分别提升了7.8和3.6百分点。 展开更多
关键词 多方对话 篇章结构分析 图神经网络 角色识别
下载PDF
基于广义话题理论的话题句识别 被引量:13
3
作者 蒋玉茹 宋柔 《中文信息学报》 CSCD 北大核心 2012年第5期114-119,128,共7页
汉语标点句句首话题缺失是机器翻译、信息抽取准确率不高的原因之一。该文从广义话题理论出发,根据汉语话题结构的特点,提出标点句的话题句识别研究方案,包括两个阶段性任务:单个标点句的话题句识别和序列标点句的话题句序列构建。识别... 汉语标点句句首话题缺失是机器翻译、信息抽取准确率不高的原因之一。该文从广义话题理论出发,根据汉语话题结构的特点,提出标点句的话题句识别研究方案,包括两个阶段性任务:单个标点句的话题句识别和序列标点句的话题句序列构建。识别出标点句的话题句也就找到了标点句句首缺失的话题。该文解决单个标点句的话题句识别任务,主要采用语义泛化和编辑距离两种手段。实验中开放测试的准确率比基线高出12.51个百分点。该结果说明,运用广义话题理论进行单个标点句的话题句识别可产生明显的效果。 展开更多
关键词 标点句 广义话题 话题结构 话题句 话题句识别
下载PDF
基于细粒度特征的话题句识别方法 被引量:6
4
作者 蒋玉茹 宋柔 《计算机应用》 CSCD 北大核心 2014年第5期1345-1349,共5页
话题句(TC)识别中采用穷举方法生成标点句的候选话题句(CTC)影响系统的执行效率和话题句识别的准确率。提出一种新的候选话题句生成方法,利用标点句在篇章中的位置特征、话题的语法特征以及话题串与说明的邻接性特征,指导候选话题句的... 话题句(TC)识别中采用穷举方法生成标点句的候选话题句(CTC)影响系统的执行效率和话题句识别的准确率。提出一种新的候选话题句生成方法,利用标点句在篇章中的位置特征、话题的语法特征以及话题串与说明的邻接性特征,指导候选话题句的生成过程。实验结果表明,该方法减少了候选话题句的个数,提高了系统效率。而且,通过与基于穷举式候选话题句生成策略的话题句识别工作进行对比,该方法使单个标点句话题句识别的准确率提高了0.96个百分点,使标点句序列话题句识别的准确率提高了1.31个百分点。 展开更多
关键词 话题句 编辑距离 语法特征 可邻接性
下载PDF
话题句识别中候选话题句评估函数的优化 被引量:3
5
作者 蒋玉茹 宋柔 《北京工业大学学报》 CAS CSCD 北大核心 2014年第1期43-48,共6页
为了更好地解决汉语标点句句首话题缺失的问题,需要在话题句识别过程中优化用于评估候选话题句优劣的评估函数.为此,提出了话题句生成的上下文相似性特征、话题串与评述相邻接的局部相似性特征,并设计了相关的评估函数.实验结果表明:综... 为了更好地解决汉语标点句句首话题缺失的问题,需要在话题句识别过程中优化用于评估候选话题句优劣的评估函数.为此,提出了话题句生成的上下文相似性特征、话题串与评述相邻接的局部相似性特征,并设计了相关的评估函数.实验结果表明:综合运用这2个评估函数,话题句识别的准确率提高了5.72个百分点. 展开更多
关键词 广义话题 话题句 相似度 上下文相似性 局部相似性
下载PDF
基于Android的多模态情感识别APP的设计与开发
6
作者 张明嘉 黄丁韫 +2 位作者 赵凯 杨超宇 蒋玉茹 《现代计算机》 2023年第5期99-103,共5页
在团队自建的中文多模态情感识别语料库的基础上,训练了多模态情感识别深度神经网络模型,能综合视频中图片、音频和文本三个模态信息进行情感识别。基于该情感识别模型,设计并开发了一款基于Android平台的移动应用程序,捕获视频中人物... 在团队自建的中文多模态情感识别语料库的基础上,训练了多模态情感识别深度神经网络模型,能综合视频中图片、音频和文本三个模态信息进行情感识别。基于该情感识别模型,设计并开发了一款基于Android平台的移动应用程序,捕获视频中人物的话语文本、声音和面部表情,识别出人物的情感状态,以支撑后续共情聊天机器人的研发。 展开更多
关键词 深度神经网络 多模态情感识别 ANDROID Flask框架
下载PDF
基于HowNet的数据结构综合实践课程改革 被引量:1
7
作者 蒋玉茹 张仰森 +1 位作者 陈若愚 刘城霞 《教育教学论坛》 2020年第1期133-136,共4页
文章设计了一个适合于数据结构综合实践课程的实践项目。该实践项目的特点是可以让学生综合运用线性结构、树形结构和图形结构三种数据结构,让学生体验到分析、设计、实践的全过程。
关键词 数据结构 HOWNET 知网 综合实践
下载PDF
汉语零形回指消解研究综述
8
作者 蒋玉茹 张禹尧 +1 位作者 毛腾 张仰森 《中文信息学报》 CSCD 北大核心 2020年第3期1-12,共12页
关于零形回指的研究一直是语言学研究中的一个热点,零形回指消解是自然语言处理中一项十分重要的任务。20多年来,学者们基于语言学规则、机器学习、深度学习等方面,提出了各种研究方法,并取得了大量研究成果。该文首先介绍零形回指的相... 关于零形回指的研究一直是语言学研究中的一个热点,零形回指消解是自然语言处理中一项十分重要的任务。20多年来,学者们基于语言学规则、机器学习、深度学习等方面,提出了各种研究方法,并取得了大量研究成果。该文首先介绍零形回指的相关概念;接着介绍目前国际上汉语零形回指消解的公开评测资源OntoNotes 5.0数据集及评价指标;其次,系统梳理和对比了国内外汉语零形回指消解所采用的方法;最后,总结和分析了目前零形回指消解研究的主要制约因素,这些因素也正是未来可能的研究方向。 展开更多
关键词 零形回指消解 语言学规则 机器学习 深度学习
下载PDF
一种面向文本分类的特征向量优化方法 被引量:13
9
作者 郭正斌 张仰森 蒋玉茹 《计算机应用研究》 CSCD 北大核心 2017年第8期2299-2302,2348,共5页
对文本进行建模的普遍方法是使用向量空间模型构建文本向量,并利用权值调整和维度调整对文本向量进行优化。提出了一种面向文本分类的特征向量优化方法。首先利用剔除近义词方法优化文本向量中的特征项;然后提出贡献率因子的概念,并利... 对文本进行建模的普遍方法是使用向量空间模型构建文本向量,并利用权值调整和维度调整对文本向量进行优化。提出了一种面向文本分类的特征向量优化方法。首先利用剔除近义词方法优化文本向量中的特征项;然后提出贡献率因子的概念,并利用其优化特征值。实验表明,相比朴素贝叶斯分类方法其效果提高了0.96%。因此,通过去除近义词和对提取出的特征词调整权重,可以达到优化特征向量、提高文本分类效果的目的。 展开更多
关键词 机器学习 Mahout 特征向量 向量优化 文本分类
下载PDF
社交媒体话题检测与追踪技术研究综述 被引量:18
10
作者 张仰森 段宇翔 +1 位作者 黄改娟 蒋玉茹 《中文信息学报》 CSCD 北大核心 2019年第7期1-10,30,共11页
随着计算机的普及与互联网的高速发展,Facebook、Twitter、新浪微博等社交媒体逐渐成为人们信息交流的主要渠道。然而,由于社交媒体信息具有数量庞大、结构复杂、传播速度快等特点,人们无法从中快速准确地获取想要的信息。于是,话题检... 随着计算机的普及与互联网的高速发展,Facebook、Twitter、新浪微博等社交媒体逐渐成为人们信息交流的主要渠道。然而,由于社交媒体信息具有数量庞大、结构复杂、传播速度快等特点,人们无法从中快速准确地获取想要的信息。于是,话题检测与追踪技术应运而生,它将用户关注的信息从大量无序信息中筛选出来,经过细致的过滤和有效的整合,生成简单、清晰的话题信息,并在此基础上实现对话题的追踪和发展趋势分析。该文对社交媒体上的话题检测与追踪工作进行综述,首先论述了话题检测方面的三类方法,包括基于主题模型的话题检测、基于改进聚类算法的话题检测和基于多特征融合的话题检测;其次,对话题追踪的研究成果进行了介绍,主要分为非自适应话题追踪和自适应话题追踪两大类;最后,列举出社交媒体话题的检测与追踪中存在的问题以及对未来研究的展望。 展开更多
关键词 话题检测 话题追踪 聚类 主题模型
下载PDF
微博用户关系网络中意见领袖的分析与挖掘 被引量:4
11
作者 张仰森 蒋玉茹 +1 位作者 陈若愚 彭啟文 《北京信息科技大学学报(自然科学版)》 2015年第4期7-14,共8页
在微博世界中,微博意见领袖对微博中舆论的导向发挥着重要的作用,因此,研究微博意见领袖的分析与挖掘方法十分必要。探讨了微博用户网络中意见领袖的分析与挖掘方法,构建了微博意见领袖的特征指标体系,采用层次分析法(Analytic Hierarch... 在微博世界中,微博意见领袖对微博中舆论的导向发挥着重要的作用,因此,研究微博意见领袖的分析与挖掘方法十分必要。探讨了微博用户网络中意见领袖的分析与挖掘方法,构建了微博意见领袖的特征指标体系,采用层次分析法(Analytic Hierarchy Process,APH)给出了各特征指标的权重计算方法,从而提出了用户初始影响力的计算模型。在此基础上,借鉴PageRank算法思想,提出了用户初始影响力扩散的计算模型,实现了微博用户影响力的定量化度量,为意见领袖的分析确定提供了充分的依据。实验数据表明,所提出的微博意见领袖的分析与挖掘方法是非常有效的。 展开更多
关键词 微博用户关系网络 意见领袖 初始影响力 影响力扩散计算模型
下载PDF
小儿急性假性肠梗阻26例分析 被引量:4
12
作者 孟丽萍 蒋玉茹 霍开明 《中国误诊学杂志》 CAS 2004年第7期1117-1118,共2页
关键词 儿童 肠假性梗阻
下载PDF
焦作市儿童多动综合征流行病学调查
13
作者 孟丽萍 赵志华 +2 位作者 郑风莲 蒋玉茹 霍开明 《河南医学研究》 CAS 1999年第4期364-365,共2页
了解焦作市4~12岁儿童多动综合征流行情况。方法:采用整群、随机、分层的抽样方法,对焦 作市有代表性的4所幼儿园、2所小学904名4~12岁儿童进行家庭问卷调查。结果:总患病率为10.18%,男童 为13.32%,女童... 了解焦作市4~12岁儿童多动综合征流行情况。方法:采用整群、随机、分层的抽样方法,对焦 作市有代表性的4所幼儿园、2所小学904名4~12岁儿童进行家庭问卷调查。结果:总患病率为10.18%,男童 为13.32%,女童为6.49%;学龄儿童高于学龄前儿童。轻型为3.53%,中型为5.42%,重型为1.22%。有围生期 不良因素史的儿童患病率高达18.42%。结论:儿童多动综合征是儿童时期最常见的一种心理行为疾病;加强围 产期保健,可望降低儿童多动综合征患病率。 展开更多
关键词 儿童 注意力缺损 流行病学 多动综合征
下载PDF
焦作市儿童多动综合征流行病学调查
14
作者 孟丽萍 赵志华 +2 位作者 郑凤莲 蒋玉茹 霍开明 《华北煤炭医学院学报》 1999年第4期284-285,共2页
了解焦作市4~12岁儿童多动综合征流行情况。方法采用整群、随机、分层的抽样方法,对焦作市有代表性的4所幼儿园、2所小学904名4~12岁儿童进行家庭问卷调查。结果总患病率为10.18%,男童为13.32%,女童为6.49%;学龄儿童高于学... 了解焦作市4~12岁儿童多动综合征流行情况。方法采用整群、随机、分层的抽样方法,对焦作市有代表性的4所幼儿园、2所小学904名4~12岁儿童进行家庭问卷调查。结果总患病率为10.18%,男童为13.32%,女童为6.49%;学龄儿童高于学龄前儿童。轻型为3.53%,中型为5.42%。重型为1.22%。有围生期不良因素史的儿童患病率高达18.42%。结论儿童多功综合征是儿童时期最常见的一种心理行为疾病;加强围生期保健,可望降低儿童多动综合征患病率。 展开更多
关键词 儿童 注意力缺损 流行病学
下载PDF
中药治疗胃扭转1例报告
15
作者 梅桂森 蒋玉茹 《中国民康医学》 1995年第1期28-28,共1页
中药治疗胃扭转1例报告梅桂森,蒋玉茹巩某,女,35岁,工人。因上腹部阵发性隐痛二月余,突发性疼痛加重.频繁于呕2小时,于91年3月13日求治。查体:侵性病容,体瘦,精神萎糜,呕逆频繁,心肺肝脾肾未见异常,胃痛喜按,脉... 中药治疗胃扭转1例报告梅桂森,蒋玉茹巩某,女,35岁,工人。因上腹部阵发性隐痛二月余,突发性疼痛加重.频繁于呕2小时,于91年3月13日求治。查体:侵性病容,体瘦,精神萎糜,呕逆频繁,心肺肝脾肾未见异常,胃痛喜按,脉沉细无力,舌体胖大,舌苔白薄。血、... 展开更多
关键词 胃扭转 中药治疗 中气不足 上消化道造影 辩证施治 脉沉细无力 中国人民 精神萎糜 饮食不节 胃肠蠕动
下载PDF
基于多特征融合的中文微博评价对象抽取方法 被引量:3
16
作者 李景玉 张仰森 蒋玉茹 《计算机应用研究》 CSCD 北大核心 2016年第2期378-383,共6页
中文微博的评价对象抽取作为中文微博情感分析的基础任务,受到研究者的广泛关注,有着重要的研究价值。结合微博文本的特点,对微博文本进行预处理,利用句法分析构建包括名词、名词短语、微博话题在内的评价对象候选集,再分别利用SVM模型... 中文微博的评价对象抽取作为中文微博情感分析的基础任务,受到研究者的广泛关注,有着重要的研究价值。结合微博文本的特点,对微博文本进行预处理,利用句法分析构建包括名词、名词短语、微博话题在内的评价对象候选集,再分别利用SVM模型、加权模型实现多特征融合的筛选候选评价对象方法,所用特征包括语义角色信息、最小距离和词频。算法经实验证明有效,在对候选评价对象进行筛选后,采用SVM模型的F值达到0.357 3,加权模型的F值达到0.405 9。 展开更多
关键词 评价对象 评价对象候选集 句法分析 语义角色标注 支持向量机
下载PDF
基于SL-LDA的领域标签获取方法 被引量:2
17
作者 王胜 张仰森 +2 位作者 张雯 蒋玉茹 张睿 《计算机科学》 CSCD 北大核心 2020年第11期95-100,共6页
科学技术的发展为文献及学者的管理提出了新的挑战,为解决海量科技文献及学者的自动管理,文中提出了一种基于SL-LDA的领域标签获取方法。在海量科技文献的基础上,分析科技文献数据的分布特点,通过引入科技文献的词频特征构建了SL-LDA主... 科学技术的发展为文献及学者的管理提出了新的挑战,为解决海量科技文献及学者的自动管理,文中提出了一种基于SL-LDA的领域标签获取方法。在海量科技文献的基础上,分析科技文献数据的分布特点,通过引入科技文献的词频特征构建了SL-LDA主题模型,利用该主题模型对同一学者的科技文献进行"主题-短语"抽取,获得初始领域关键词。接着引入领域体系,对主题模型的抽取结果与体系标签进行向量表征,经过位置特征加权后使用相似度进行体系映射,最终获得学者的领域标签。实验结果表明,在同样的文献数据量下,SL-LDA模型与传统的LDA模型、基于统计的TFIDF算法和基于网络图的Text-Rank算法相比,最终获取的标签词效果更好,准确率更高,F1值也提升到0.572,说明基于SL-LDA的领域标签抽取方法在学术领域具有较好的适用性。 展开更多
关键词 领域标签 SL-LDA模型 标签映射 主题短语抽取 科技文献
下载PDF
网络用户角色辨识及其恶意访问行为的发现方法 被引量:1
18
作者 王建 张仰森 +2 位作者 陈若愚 蒋玉茹 尤建清 《计算机科学》 CSCD 北大核心 2018年第10期160-165,201,共7页
随着互联网络技术的快速发展,各种恶意访问行为危及到网络的信息安全,因此辨识访问用户的角色并识别用户的恶意访问行为对于网络安全具有十分重要的理论意义和实用价值。首先,以网络日志数据为基础,通过建立IP辅助数据库,构建IP用户的... 随着互联网络技术的快速发展,各种恶意访问行为危及到网络的信息安全,因此辨识访问用户的角色并识别用户的恶意访问行为对于网络安全具有十分重要的理论意义和实用价值。首先,以网络日志数据为基础,通过建立IP辅助数据库,构建IP用户的日角色模型,在此基础上,引入滑动时间窗技术,将时间的变化动态地融入用户角色辨识,建立了基于滑动时间窗的用户角色动态辨识模型。然后,在分析用户恶意访问流量特征的基础上,将用户访问流量特征和用户信息熵特征进行加权,构建基于多特征的用户恶意访问行为的辨识模型。该模型能够对爆发性和高持续性的恶意访问行为以及少量但大规模分散访问的恶意行为进行识别。最后,采用大数据存储和Spark内存计算技术,对所建立的模型进行实现。实验结果表明,在网络流量产生异常时,所提出的模型能够发现具有恶意访问行为的用户,并准确且高效地辨别出该用户的角色,从而验证了其有效性。 展开更多
关键词 网络用户 数据挖掘 角色辨识 恶意访问行为 滑动时间窗
下载PDF
MCA-Reader:基于多重联结机制的注意力阅读理解模型 被引量:4
19
作者 张禹尧 蒋玉茹 +1 位作者 毛腾 张仰森 《中文信息学报》 CSCD 北大核心 2019年第10期73-80,共8页
机器阅读理解是当下自然语言处理的一个热门任务,其内容是:在给定文本的基础上,提出问题,机器要在给定文本中寻找并给出最终问题的答案。片段抽取式阅读理解是当前机器阅读理解研究的一个典型的方向,机器通过预测答案在文章中的起始和... 机器阅读理解是当下自然语言处理的一个热门任务,其内容是:在给定文本的基础上,提出问题,机器要在给定文本中寻找并给出最终问题的答案。片段抽取式阅读理解是当前机器阅读理解研究的一个典型的方向,机器通过预测答案在文章中的起始和结束位置来定位答案。在此过程中,注意力机制起着不可或缺的作用。该文为了更好地解决片段抽取式机器阅读理解任务,提出了一种基于多重联结机制的注意力阅读理解模型。该模型通过多重联结的方式,更有效地发挥了注意力机制在片段抽取式机器阅读理解任务中的作用。利用该模型,在第二届“讯飞杯”中文机器阅读理解评测(CMRC2018)的最终测试集上EM值为71.175,F1值为88.090,排名第二。 展开更多
关键词 机器阅读理解 注意力机制 多重联结
下载PDF
以研究性视角探索研究生人工智能课程教学模式的改革方法 被引量:1
20
作者 张仰森 蒋玉茹 +1 位作者 黄改娟 陈若愚 《计算机教育》 2022年第6期175-178,共4页
分析人工智能传统教学方法中存在的问题,从研究性视角出发,提出人工智能课程中研究性教学模式及实践训练模式,探讨如何引导研究生以研究性思维学习人工智能基础理论的方法以及将人工智能技术用于自身科研的方法,介绍教学模式的推广应用... 分析人工智能传统教学方法中存在的问题,从研究性视角出发,提出人工智能课程中研究性教学模式及实践训练模式,探讨如何引导研究生以研究性思维学习人工智能基础理论的方法以及将人工智能技术用于自身科研的方法,介绍教学模式的推广应用并说明效果. 展开更多
关键词 研究性视角 人工智能 研究生教学 问题驱动 教学模式
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部