期刊文献+
共找到53篇文章
< 1 2 3 >
每页显示 20 50 100
基于文档顺序与多模态模型的金融票据信息抽取
1
作者 覃俊 林宇亭 +2 位作者 刘晶 叶正 刘洲 《计算机与数字工程》 2024年第1期23-27,80,共6页
目前的文档信息抽取方法大多针对简单的文档,在抽取包含背景干扰和结构复杂的金融票据时效果不佳。针对复杂金融票据中实体关系难以正确匹配的问题,提出了顺序重构方法和LayoutLMv3-GRU信息抽取模型。构建背景复杂的金融票据数据集,利... 目前的文档信息抽取方法大多针对简单的文档,在抽取包含背景干扰和结构复杂的金融票据时效果不佳。针对复杂金融票据中实体关系难以正确匹配的问题,提出了顺序重构方法和LayoutLMv3-GRU信息抽取模型。构建背景复杂的金融票据数据集,利用文本、布局和图像三个模态进行信息抽取。利用Layout-Parser工具,设计排序模块,使文本信息按照上下文关系排序,并把空间距离较远且逻辑关系较近的单词进行重新的排列组合。通过结合改进的LayoutLMv3模型与GRU网络,使模型的准确率进一步提升。并在公共数据集FUNSD与自建的复杂金融数据集进行实验。结果表明,该方法的F1值比LayoutLM3模型提升2.37%。尤其在自建的复杂金融数据集上,模型F1值达到了88.36%,验证了该方法在抽取复杂票据信息时的优越性与处理各种文档时的通用性。 展开更多
关键词 金融票据 信息抽取 多模态 LayoutLM3 门控神经网络
下载PDF
工程总承包项目定价与计价方式现状及对策
2
作者 叶正 赵剑龙 +2 位作者 陈超 李云明 赵良伟 《建筑技术开发》 2024年第2期46-48,共3页
定价与计价方式是工程总承包模式推行的关键内容,也是影响工程总承包模式推广与应用的重要因素。首先分析了我国部分省份工程总承包项目的定价与计价方式;其次重点分析了工程总承包模式的中国情境;第三剖析了工程总承包项目定价与计价... 定价与计价方式是工程总承包模式推行的关键内容,也是影响工程总承包模式推广与应用的重要因素。首先分析了我国部分省份工程总承包项目的定价与计价方式;其次重点分析了工程总承包模式的中国情境;第三剖析了工程总承包项目定价与计价方式存在的问题;最后提出了具有针对性的该建议。研究成果为推广我国工程总承包模式,提高工程总承包项目管理水平具有借鉴意义。 展开更多
关键词 工程总承包项目 定价方式 计价方式 对策
下载PDF
基于问句相似度的中文FAQ问答系统 被引量:14
3
作者 叶正 林鸿飞 杨志豪 《计算机工程与应用》 CSCD 北大核心 2007年第9期161-163,248,共4页
常见问题(FAQ)问答系统是一种在已有的“问题—答案”对集合中找到与用户提问相匹配的问句,并将其对应的答案返回给用户的问答式检索系统。其关键问题是用户提出问句与FAQ库中问句进行相似度计算,找出FAQ库中最相近的问句,并返回事先存... 常见问题(FAQ)问答系统是一种在已有的“问题—答案”对集合中找到与用户提问相匹配的问句,并将其对应的答案返回给用户的问答式检索系统。其关键问题是用户提出问句与FAQ库中问句进行相似度计算,找出FAQ库中最相近的问句,并返回事先存储好的问题答案。通过对常见问句特点的研究,给出一种基于分解的向量空间模型和语义概念的问句相似度计算方法,其主要思想是对一个问句向量进行分解,提取其三个关键部分:问点、主题词和疑问词,表示成三个分向量,然后对每个分向量计算基于《HIT-IRLab同义词词林(扩展版)》的语义相似度,通过线性加权就可以得出两个问句的语义相似度。试验表明,与传统的基于向量空间模型的TF-DF问句相似度计算方法相比,可以提高问句匹配的精度。 展开更多
关键词 问句相似度 语义相似度 常见问题集 向量空间模型
下载PDF
基于支持向量机的人物属性抽取 被引量:11
4
作者 叶正 林鸿飞 +1 位作者 苏绥 刘菁菁 《计算机研究与发展》 EI CSCD 北大核心 2007年第z2期271-275,共5页
研究了如何使用机器学习方法和语义资源实现有效的人物属性抽取.人物属性抽取是指从自由文本中提取出人的属性信息,如性别、职务信息等.如果把描述人属性的词也看做是实体,则可以把人物属性抽取看作是实体关系抽取的具体应用.使用<知... 研究了如何使用机器学习方法和语义资源实现有效的人物属性抽取.人物属性抽取是指从自由文本中提取出人的属性信息,如性别、职务信息等.如果把描述人属性的词也看做是实体,则可以把人物属性抽取看作是实体关系抽取的具体应用.使用<知网>提取描述人属性的词作为触发词,这样就可以把触发词和人名间的描述关系转化为一分类问题.当选取触发词和人名左、中、右的3个词的词义和词性作为特征,使用支持向量机进行判别时达到最好抽取效果. 展开更多
关键词 属性抽取 支持向量机 语义资源
下载PDF
天津肺癌趋势与燃煤污染关系研究 被引量:3
5
作者 叶正 《环境与健康杂志》 CAS CSSCI CSCD 北大核心 1989年第6期1-3,6,共4页
本文通过天津市区恶性肿瘤登记报告进行了肺癌流行学特征分析,剖析出天津女性肺癌增长除受吸烟影响外,还与市中心区过量燃煤污染有关,尤其是居民区的低空燃煤面源空气污染。家庭妇女肺癌发病率高达170/10万,不吸烟家庭妇女肺癌发病集中... 本文通过天津市区恶性肿瘤登记报告进行了肺癌流行学特征分析,剖析出天津女性肺癌增长除受吸烟影响外,还与市中心区过量燃煤污染有关,尤其是居民区的低空燃煤面源空气污染。家庭妇女肺癌发病率高达170/10万,不吸烟家庭妇女肺癌发病集中在市中心区者占90%,并与居住区内低空排放的面源燃煤量、工商机关单位和住家锅炉、炉灶的分布相关,市中心区居民吸入空气中BaP量已相当每天吸烟30支的危险性。 展开更多
关键词 天津 肺癌 燃煤 污染
下载PDF
天津市区家庭妇女肺癌环境病因探讨 被引量:2
6
作者 叶正 《中国肿瘤临床》 CAS CSCD 北大核心 1990年第4期195-198,共4页
本文用病例一对照研究方法,选择了天津市区住宅类型接近且肺癌较多的8个街区,1981~1983年全部家庭妇女肺癌病例82例,探讨家庭妇女肺癌的环境病因。揭示住宅附近有低矮锅炉烟囱、作坊油烟、马路等烟尘污染,其相对危险度为2.57(x^2=4.00;... 本文用病例一对照研究方法,选择了天津市区住宅类型接近且肺癌较多的8个街区,1981~1983年全部家庭妇女肺癌病例82例,探讨家庭妇女肺癌的环境病因。揭示住宅附近有低矮锅炉烟囱、作坊油烟、马路等烟尘污染,其相对危险度为2.57(x^2=4.00;P<0.05;95%可信限为1.02~7.28)和吸烟相对危险度为2.17(x^2=4.45;P<0.05;95%可信限为1.06~4.71)。提示预防天津家庭妇女肺癌,除应重视吸烟的危害外,还应重视改善她们的居住环境和能源结构,尽量减少在居民区直接燃煤,积极实现市政府关于“3年煤气化、5年暖气化”的市政规划,乃是控制天津市区肺癌增长趋势的有效对策。 展开更多
关键词 肺肿瘤 病因 环境因素 女性 天津
下载PDF
基于BERT与主题模型联合增强的长文档检索模型
7
作者 覃俊 刘璐 +2 位作者 刘晶 叶正 张泽谨 《中南民族大学学报(自然科学版)》 CAS 北大核心 2023年第4期469-476,共8页
尽管将BERT运用在Ad-hoc文档检索领域能够提升任务精确度,但也存在两个显著缺陷:第一,由于BERT存在输入限制,对长文档进行截断会导致文档信息丢失;第二,Ad-hoc文档检索任务的数据集中存在相当数量的领域特定词,而BERT不能较好地学习这... 尽管将BERT运用在Ad-hoc文档检索领域能够提升任务精确度,但也存在两个显著缺陷:第一,由于BERT存在输入限制,对长文档进行截断会导致文档信息丢失;第二,Ad-hoc文档检索任务的数据集中存在相当数量的领域特定词,而BERT不能较好地学习这些特定词的特征.而利用LDA主题模型不存在输入限制,可以表示完整的语义信息的优点,将其引入联合增强模型,且对文档中的领域特定词及语义内涵进行学习表征,弥补了BERT模型的不足.为此提出RWT-BERT联合增强模型通过对BERT和LDA主题模型的表征构建交互网络,对查询语句和长文档进行更深层次的特征挖掘.实验结果表明:该模型在3个数据集的主要指标上都有不同程度的提升,尤其在Core17数据集上,与目前效果最好的句子级Ad-hoc文档检索模型Birch相比,nDCG@20指标提高了4.01%. 展开更多
关键词 文档检索 预训练模型 长文档 主题模型 信息检索
下载PDF
基于利用BERT不同层信息的微调策略的对话状态追踪
8
作者 叶正 傅灵 +1 位作者 覃俊 刘晶 《中南民族大学学报(自然科学版)》 CAS 北大核心 2023年第3期327-333,共7页
在对话状态追踪任务中,BERT在训练下游任务时往往会选择模型的最后一层来做分类,尽管这样做的性能也非常出色,但是这种做法往往忽略了BERT的其他层包含的语义信息.在BERT的微调策略方法上,探究了BERT层数选择对任务结果的影响.为了缓解D... 在对话状态追踪任务中,BERT在训练下游任务时往往会选择模型的最后一层来做分类,尽管这样做的性能也非常出色,但是这种做法往往忽略了BERT的其他层包含的语义信息.在BERT的微调策略方法上,探究了BERT层数选择对任务结果的影响.为了缓解Dropout在训练和推理过程中产生的不一致性问题,引入了R-Drop正则模块对网络输出预测进行正则约束.实验结果表明:用注意力机制对拼接后的BERT的12层输出进行特征权重的微调,提高了对语义信息的特征表达能力,在数据集上Woz2.0上比只采用最后一层进行句子分类的BERT-Base效果更好. 展开更多
关键词 对话状态追踪 微调策略 层数选择
下载PDF
论城市景观生态过程与格局的连续性——以中山市为例 被引量:127
9
作者 俞孔坚 叶正 +1 位作者 李迪华 段铁武 《城市规划》 北大核心 1998年第4期14-17,共4页
以中山市为例,分析城市景观过程与格局的连续性,并为未来中山市城市景观格局的改进提出了初步方案。通过这一典型分析,旨在探讨中国的一些园林绿化质量较高的先进城市,应如何使城市建设再上一个台阶,领导全国其它城市的景观生态建设。
关键词 中山市 城市设计 景观规划 景观生态 景观连续性
下载PDF
锰砂填料人工湿地在钢铁废水回用处理中的应用研究 被引量:7
10
作者 徐竟成 范海青 +3 位作者 黄翔峰 李光明 张宜莓 叶正 《中国给水排水》 CAS CSCD 北大核心 2007年第15期29-33,共5页
采用锰砂填料人工湿地深度处理钢铁企业的达标排放废水,并与砾石填料人工湿地的处理效果进行对比。结果表明:锰砂填料人工湿地具有持续而稳定的铁、锰去除效果,对其去除率均在90%以上,当进水总铁和Mn^2+浓度分别为0.3~1.2mg/L... 采用锰砂填料人工湿地深度处理钢铁企业的达标排放废水,并与砾石填料人工湿地的处理效果进行对比。结果表明:锰砂填料人工湿地具有持续而稳定的铁、锰去除效果,对其去除率均在90%以上,当进水总铁和Mn^2+浓度分别为0.3~1.2mg/L和0.2~1.1mg/L时,相应的出水浓度基本保持在0.05mg/L以下,达到了回用水水质标准。而砾石填料人工湿地会出现铁、锰的累积和解吸现象,没有持续的铁、锰去除能力。同时,锰砂填料人工湿地对COD、TP和NH4^+ -N的去除效果均好于砾石填料人工湿地。 展开更多
关键词 人工湿地 锰砂填料 钢铁废水 回用
下载PDF
天津市高血压抽样调查 被引量:12
11
作者 武光林 耿贯一 +7 位作者 周森 马凤阁 王晓光 杜殿军 赵淑云 苏枫 叶正 杨露春 《天津医药》 CAS 1994年第2期89-92,共4页
1985年1月~7月对天津市高血压抽样调查9865户,30654人。≥15岁人群的确诊和临界高血压患病率分别为11.83%和3.76%,和1979~1980年抽样调查相比,呈明显上升趋势。城市高于乡村,女性高于男性。不同职业存在明显差异,服务行业最高,其次... 1985年1月~7月对天津市高血压抽样调查9865户,30654人。≥15岁人群的确诊和临界高血压患病率分别为11.83%和3.76%,和1979~1980年抽样调查相比,呈明显上升趋势。城市高于乡村,女性高于男性。不同职业存在明显差异,服务行业最高,其次为工人,农民最低,其它职业相近。同时显示文化水平越低,高血压患病率越高的倾向。在这次调查中,确诊和临界高血压检出率分别高达3.62%和3.88%,说明对人群进行高血压普查、健康教育和加强高血压防治有重要意义。 展开更多
关键词 高血压 抽样调查 发病率
下载PDF
生物除铁除锰在钢铁废水回用处理中的应用 被引量:6
12
作者 徐竟成 范海青 +3 位作者 黄翔峰 张宜莓 叶正 金磊 《工业水处理》 CAS CSCD 北大核心 2007年第11期31-34,共4页
研究了锰砂过滤工艺在钢铁废水回用处理中除铁除锰的应用。在滤速5.0 m/h、工作周期4 d、反冲洗强度21 L/(m2.h)和反冲洗时间6 min的操作条件下,经过自然生物培养成熟的锰砂滤层对钢铁回用废水中的总铁、锰的去除率达80%以上,出水总铁... 研究了锰砂过滤工艺在钢铁废水回用处理中除铁除锰的应用。在滤速5.0 m/h、工作周期4 d、反冲洗强度21 L/(m2.h)和反冲洗时间6 min的操作条件下,经过自然生物培养成熟的锰砂滤层对钢铁回用废水中的总铁、锰的去除率达80%以上,出水总铁和锰都达到再生水用作循环冷却用水的水质要求。同时成熟的锰砂滤料还具有一定的COD和氨氮去除能力。 展开更多
关键词 钢铁废水 锰砂生物过滤 除铁除锰
下载PDF
基于字符语言模型的垃圾邮件过滤 被引量:8
13
作者 苏绥 林鸿飞 叶正 《中文信息学报》 CSCD 北大核心 2009年第2期41-47,共7页
基于内容的过滤是当前解决垃圾邮件问题的主流技术之一。该文先简单综述了当前基于内容的垃圾邮件过滤中采用的各种技术,在此基础上提出将基于字符的语言模型应用于垃圾邮件过滤任务中,并通过实验对比了该方法与Na ve Bayes、SVM和基于... 基于内容的过滤是当前解决垃圾邮件问题的主流技术之一。该文先简单综述了当前基于内容的垃圾邮件过滤中采用的各种技术,在此基础上提出将基于字符的语言模型应用于垃圾邮件过滤任务中,并通过实验对比了该方法与Na ve Bayes、SVM和基于词的语言模型方法的性能差异,以及不同n值、不同特征选择方式对过滤结果的影响。实验结果表明,基于字符的语言模型实现简单且具有很高的性能,能较好地满足大规模在线邮件系统的需要,具有很高的实用价值。 展开更多
关键词 计算机应用 中文信息处理 垃圾邮件过滤 语言模型 朴素贝叶斯 支撑向量机 n—Gram
下载PDF
基于网络与数据库的多任务并行CAPP集成平台 被引量:5
14
作者 蔡力钢 叶正 +2 位作者 李培根 张远强 候奎孝 《高技术通讯》 EI CAS CSCD 1999年第7期6-10,共5页
分析了传统CAPP系统存在的不足和原因,提出了基于网络与数据库的多任务并行CAPP集成平台的解决方案,介绍了该集成平台的网络结构、模块框图、基本功能和主要特点。
关键词 CAPP 集成平台 网络 数据库
下载PDF
次氯酸钠在宝钢生活水站应用前景研究
15
作者 叶正 《冶金动力》 2006年第4期67-69,共3页
通过对次氯酸钠消毒方式的消毒效果、稳定性及经济性、安全性等各方面的论证,分析了宝钢生活水采用次氯酸钠消毒的优劣,认为采用次氯酸钠消毒,使用安全性有了很大提高,且设备成本大幅下降,但是次氯酸钠水溶液易分解,且运行成本较高。
关键词 次氯酸钠 氯气 消毒效果 安全性
下载PDF
基于分级规划的工艺决策推理与知识管理策略 被引量:5
16
作者 蔡力钢 李培根 叶正 《华中理工大学学报》 CSCD 北大核心 1998年第11期66-68,共3页
论述了基于分级规划的工艺决策推理控制策略、混合式推理策略以及工艺决策知识和数据管理策略.推理控制策略将复杂的工艺决策推理机分解成性质不同的三个子推理机,简化了推理机的结构.混合式推理策略综合了变异法、创成法以及人机交... 论述了基于分级规划的工艺决策推理控制策略、混合式推理策略以及工艺决策知识和数据管理策略.推理控制策略将复杂的工艺决策推理机分解成性质不同的三个子推理机,简化了推理机的结构.混合式推理策略综合了变异法、创成法以及人机交互法的优点,便于解决复杂多变的工艺决策问题.工艺决策知识管理策略使工艺决策知识和数据按三个子推理机分类存储,从而便于规则的搜索、存储、管理与维护. 展开更多
关键词 CAPP 工艺决策 推理策略 分级规划 知识管理策略
下载PDF
基于分级规划的加工方法排序规则研究 被引量:3
17
作者 饶运清 蔡力钢 +1 位作者 叶正 李培根 《华中理工大学学报》 CSCD 北大核心 1999年第2期13-15,共3页
结合工艺决策的分级规划策略,构造了一种新的实用化的加工方法排序规则,该排序规则将传统排序规则分解成两个相关的部分:工序排序规则与工步排序规则.工序排序规则代表了排序规则的普遍性,描述了一类零件的总体加工过程,只与加工... 结合工艺决策的分级规划策略,构造了一种新的实用化的加工方法排序规则,该排序规则将传统排序规则分解成两个相关的部分:工序排序规则与工步排序规则.工序排序规则代表了排序规则的普遍性,描述了一类零件的总体加工过程,只与加工方法有关,与组成零件的形状特征等其他因素无关;工步排序规则代表了排序规则的特殊性,描述了工序中各特征的加工顺序,与特征有关而与加工方法无关. 展开更多
关键词 加工方法排序 排序规则 工序排序 CAPP 分级规划
下载PDF
LMO2调控E-cadherin启动子的活性对前列腺癌恶化转移的影响 被引量:3
18
作者 彭茜 叶正 高杨 《中国应用生理学杂志》 CAS CSCD 2013年第5期385-389,共5页
目的:研究原癌基因LMO2异常表达对前列腺癌恶化转移的影响及其可能机制。方法:采用分子克隆技术构建了一系列不同长度和点突变的E-cadherin基因启动子区序列至pGL-3 basic荧光素酶表达载体,然后将这些重组质粒与LMO2表达质粒共转染Lnca... 目的:研究原癌基因LMO2异常表达对前列腺癌恶化转移的影响及其可能机制。方法:采用分子克隆技术构建了一系列不同长度和点突变的E-cadherin基因启动子区序列至pGL-3 basic荧光素酶表达载体,然后将这些重组质粒与LMO2表达质粒共转染Lncap细胞并在24 h后检测其荧光素酶活性。结果:过表达LMO2可以显著的抑制E-cadherin启动子荧光素酶报告基因的活性,使荧光素酶活性下降50%左右。通过截短和点突变研究发现其作用机制主要通过结合在启动子区-204/-198处的E-box位点发挥作用。结论:原癌基因LMO2可通过对Ecadherin发挥转录抑制作用来影响前列腺癌的恶化与转移。 展开更多
关键词 LMO2 E-钙粘蛋白 前列腺癌 启动子
下载PDF
基于锚文本相似度的链接算法 被引量:1
19
作者 刘菁菁 董静 +1 位作者 林鸿飞 叶正 《郑州大学学报(理学版)》 CAS 2007年第2期96-99,共4页
对链接算法在搜索引擎检索结果排序中的应用进行研究,提出基于Page Rank和锚文本对检索结果进行二次排序,合理评价网页重要程度.实验结果表明,该方法在一定程度上能提高检索效果.
关键词 链接分析 PAGERANK 锚文本 相似度
下载PDF
磁共振成像诊断冠心病的研究进展
20
作者 叶正 陈思聪 施增儒 《心血管病学进展》 CAS 1991年第3期156-159,共4页
磁共振成像(MRI)是七十年代末出现的先进检查技术,八十年代开始应用于临床。目前临床使用的MRI均为质子磁共振成像技术,其磁场强度在1.5特斯拉以下,对人体无损伤,是一种安全、无创的理想检查方法。其原理是:在均匀的强磁场中,组织中的... 磁共振成像(MRI)是七十年代末出现的先进检查技术,八十年代开始应用于临床。目前临床使用的MRI均为质子磁共振成像技术,其磁场强度在1.5特斯拉以下,对人体无损伤,是一种安全、无创的理想检查方法。其原理是:在均匀的强磁场中,组织中的质子的排列方向趋于一致,发射特定的电磁波可以激发质子共振。射频停止后,共振的质子开始恢复到正常位置,即质子的弛豫过程。根据组织质子密度(〔H^+〕)的不同及自旋晶格弛豫时间的不同(T_1)和自旋-自旋弛豫时间(T_2)的不同,磁共振成像仪把质子弛豫过程中接收到的信号排列成图像。 展开更多
关键词 冠心病 核磁共振成像 诊断
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部