题名 计算机虚拟取样测量单光子
1
作者
白妙青
肖连团
机构
山西大学计算中心
山西大学 物理电子工程学院
出处
《光电工程》
EI
CAS
CSCD
北大核心
2006年第4期132-135,144,共5页
基金
国家自然科学基金资助项目(60378004)
人事部留学归国人员项目资助
文摘
本文通过最佳信号噪声比分析,讨论了单分子辐射单光子在具有时间均匀分布背景信号时对同步取样时间的选取。利用理论分析单分子光子源最佳信噪比与取样门的对应关系,应用计算机虚拟取样测量单分子光辐射信号,有效地抑制了背景信号的影响,分析了光场的光子统计分布特性。
关键词
单分子
虚拟取样
单光子
信号噪声比
Keywords
Single molecule
Virtual sampling
Single photon
Signal-to-noise ratio
分类号
O431.2
[机械工程—光学工程]
题名 高校普系计算机实验课教改探讨
被引量:4
2
作者
刘并生
机构
山西大学计算中心
出处
《山西青年管理干部学院学报》
2002年第2期62-63,共2页
文摘
互动式教学方式提倡学生在学习中的主体地位,把它引入普系计算机实验课的教学中,能调动学生的学习主动性,提高学生在实践中独立解决问题的能力。具体的教改可从规范实验大纲、更新教学内容、突出设计性实验,组织操作演练、改革成绩评定方法等方面作出努力。
关键词
高校
计算机实验课
教学改革
互动式教学
教学内容
实验设计
实验能力
分类号
TP3-45
[自动化与计算机技术—计算机科学与技术]
题名 汉语框架语义角色的自动标注
被引量:41
3
作者
李济洪
王瑞波
王蔚林
李国臣
机构
山西大学计算中心
山西大学 数学科学学院
山西大学 计算 机与信息技术学院
出处
《软件学报》
EI
CSCD
北大核心
2010年第4期597-611,共15页
基金
国家自然科学基金No.60873128
国家高技术研究发展计划(863)No.2006AA01Z142~~
文摘
基于山西大学自主开发的汉语框架语义知识库(CFN),将语义角色标注问题通过IOB策略转化为词序列标注问题,采用条件随机场模型,研究了汉语框架语义角色的自动标注.模型以词为基本标注单元,选择词、词性、词相对于目标词的位置、目标词及其组合为特征.针对每个特征设定若干可选的窗口,组合构成模型的各种特征模板,基于统计学中的正交表,给出一种较优模板选择方法.全部实验在选出的25个框架的6692个例句的语料上进行.对每一个框架,分别按照其例句训练一个模型,同时进行语义角色的边界识别与分类,进行2-fold交叉验证.在给定句子中的目标词以及目标词所属的框架情况下,25个框架交叉验证的实验结果的准确率、召回率、F1-值分别达到74.16%,52.70%和61.62%.
关键词
汉语框架语义知识库
语义角色标注
正交表
特征选择
条件随机场
Keywords
Chinese FrameNet
semantic role labeling
orthogonal array
feature selection
conditional random fields
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于车牌底色识别的车牌定位方法
被引量:33
4
作者
郭大波
陈礼民
卢朝阳
韩丽萍
机构
山西大学 电子系
山西大学计算中心
西安电子科技大学 通信工程学院
出处
《计算机工程与设计》
CSCD
2003年第5期81-84,87,共5页
文摘
提出了结合汽车车牌纹理特征分析和颜色特征分析实现车牌定位的方法。以往的车牌定位技术主要是利用了车牌的纹理特征和形状特征,该文提出的方法是先进行纹理分析和形状分析,再进行色彩分析,从而尽可能多地利用车牌模式识别空间中的各种条件。得到边缘清晰整齐的尽可能小的车牌区域。这种方法明显地克服了单用纹理和形状分析时难以解决的车牌区域变大的问题。
关键词
车牌底色识别
车牌定位方法
汽车车牌
车流监控
计算机
彩色图像
数学形态学处理
Keywords
license plate recognition
LPR
location of the license plate
分类号
U492.22
[交通运输工程—交通运输规划与管理]
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 汉语框架自动识别中的歧义消解
被引量:11
5
作者
李济洪
高亚慧
王瑞波
李国臣
机构
山西大学计算中心
山西大学 数学科学学院
太原工业学院
出处
《中文信息学报》
CSCD
北大核心
2011年第3期38-44,共7页
基金
国家自然科学基金资助项目(60873128)
山西省高校高新技术产业化资助项目(20090003)
文摘
该文研究了汉语框架自动识别中的歧义消解问题,即对给定句子中的目标词,基于其上下文环境,从现有的框架库中,为该目标词自动标注一个合适的框架。该文将此任务看作分类问题,使用最大熵建模,选用词、词性、基本块、依存句法树上的若干特征,并使用开窗口技术和BOW策略,以目前汉语框架语义知识库中的88个词元的2 077条例句为训练、测试语料,进行了3-fold交叉验证实验,最好结果取得69.28%的精确率(Accuracy)。
关键词
汉语框架语义知识库
框架语义
框架消歧
最大熵模型
Keywords
Chinese FrameNet
frame semantics
frame disambiguation
maximum entropy
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于条件随机场的汉语框架语义角色自动标注
被引量:8
6
作者
宋毅君
王瑞波
李济洪
李国臣
机构
山西大学计算中心
太原工业学院
出处
《中文信息学报》
CSCD
北大核心
2014年第3期36-47,共12页
基金
国家自然科学基金(60873128)
文摘
在给定目标词及其所属框架的条件下,汉语框架语义角色标注可以分为语义角色识别和角色分类两个步骤。该文将此任务通过IOB2标记策略形式化为词序列标注问题,以词为基本标注单元,采用条件随机场模型进行自动标注实验。先对语料使用清华大学的基本块自动分析器进行分析,提取出15个块层面的新特征,并将这些特征标记形式化到词序列上。以文献[20]已有的12个词层面特征以及15个块层面特征共同构成候选特征集,采用正交表方法来选择模型的最优特征模板。在与文献[20]相同的语料上,相同的3组2折交叉验证实验下,语义角色标注的总性能的F1-值比文献[20]的F1-值提高了近1%,且在显著水平0.05的t-检验下显著。实验结果表明:(1)基于词序列模型,新加入的15个块层面特征可以显著提高标注模型的性能,但这类特征主要对角色分类有显著作用,对角色识别作用不显著;(2)基于词序列的标注模型显著好于以基本块为标注单元以及以句法成分为标注单元的标注模型。
关键词
汉语框架语义知识库
语义角色标注
条件随机场模型
基本块
Keywords
Chinese FrameNet
semantic role labeling
conditional random fields
base chunk
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于最大熵模型的中文阅读理解问题回答技术研究
被引量:6
7
作者
李济洪
王瑞波
王凯华
李国臣
机构
山西大学计算中心
山西大学 计算 机与信息技术学院
出处
《中文信息学报》
CSCD
北大核心
2008年第6期55-62,共8页
基金
国家自然科学基金资助项目(60873128)
国家社会科学基金青年资助项目(07CYY022)
文摘
该文基于山西大学自主开发的中文阅读理解语料库CRCC v1.1版,根据问句和候选答案句的对应关系,构建了词层面以及句法层面共计35个特征,基于最大熵模型对中文阅读理解问题回答进行了建模,在35个特征全部加入最大熵模型的情况下,测试集上得到了75.46%的HumSent准确率。考虑到特征取值之间的相关性对权重估计的影响,笔者先对35个特征观测值矩阵进行主成分降维,选择适当的主成分个数重构特征,然后再使用最大熵模型进行建模,在测试集上的HumSent准确率达到80.18%.实验结果表明,在阅读理解问答系统中,采用特征的主成分降维方法,能有效融合全部特征信息,回避了最大熵模型中特征筛选的过程,并且提高了阅读理解系统的准确率。
关键词
计算机应用
中文信息处理
阅读理解
问答系统
最大熵模型
主成分
Keywords
computer application
Chinese information processing
reading comprehension
question answering
maximum entropy model
principle components analysis
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于条件随机场模型的汉语功能块自动标注
被引量:7
8
作者
李国臣
王瑞波
李济洪
机构
山西大学 计算 机与信息技术学院
山西大学计算中心
出处
《计算机研究与发展》
EI
CSCD
北大核心
2010年第2期336-343,共8页
基金
国家自然科学基金项目(60873128)
山西省科技攻关计划基金项目(2007031126_01)~~
文摘
汉语组块分析是将汉语句子中的词首先组合成基本块,进一步组合形成句子的功能块,最终形成一个具有层次组合结构的汉语句法描述结构.将汉语功能块的自动标注问题看作序列标注任务,并使用词和基本块作为标注单元分别建立标注模型.针对不同的标注模型,分别构建基本块层面的特征集合,并使用条件随机场模型进行汉语功能块的自动标注.实验数据来自清华大学TCT语料库,并且按照8∶2的比例切分形成训练集和测试集.实验结果表明,与仅使用词层面信息的标注模型相比,基本块特征信息的适当加入可以显著提高功能块标注性能.当使用人工标注的基本块信息时,汉语功能块自动标注的准确率达到88.47%,召回率达到89.93%,F值达到89.19%.当使用自动标注的基本块信息时,汉语功能块的标注的准确率为84.27%,召回率为85.57%,F值为84.92%.
关键词
汉语基本块
汉语功能块
条件随机场模型
句法分析
序列标注
Keywords
Chinese base chunk
Chinese functional chunk
conditional random fields
syntactic parsing
sequence labeling
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于同义词词林信息特征的语义角色自动标注
被引量:7
9
作者
李国臣
吕雷
王瑞波
李济洪
李茹
机构
太原工业学院计算 机工程系
山西大学 计算 机与信息技术学院
山西大学计算中心
出处
《中文信息学报》
CSCD
北大核心
2016年第1期101-107 114,共8页
基金
国家语委"十二五"科研规划项目(YB125-19)
国家自然科学基金(61373082)
+3 种基金
国家自然科学基金(60873128
60970053)
山西省回国留学人员科研项目(2013-015)
国家863高技术研究发展计划(2006AA01Z142)
文摘
该文使用同义词词林语义资源库,以词林中编码信息为基础构建新的特征,使用条件随机场模型,研究了汉语框架语义角色的自动标注。该文在先前的基于词、词性、位置、目标词特征的基础上,在模型中加入不同的词林信息特征,以山西大学的汉语框架语义知识库为实验语料,研究了各词林信息特征分别对语义角色边界识别与分类的影响。实验结果表明,词林信息特征可以显著提高语义角色标注的性能,并且主要作用在语义角色分类上。
关键词
语义角色标注
同义词词林
条件随机场
正交表
Keywords
semantic role labeling
TongYiCi CiLin
conditional random fields
orthogonal array
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 基于COSA算法的中文文本聚类
被引量:9
10
作者
谷波
李济洪
刘开瑛
机构
山西大学 计算 机与信息技术学院
山西大学计算中心
出处
《中文信息学报》
CSCD
北大核心
2007年第6期65-70,共6页
基金
国家863计划(2006AA01Z142)
文摘
传统聚类算法在计算两个对象间的距离时,每个属性对距离的贡献相同。COSA(Clustering On Subsets of Attributes)算法[1]认为在不同的分组中,每个属性对计算距离所起的作用可能并不相等,因为不同分组中的对象可能在不同的属性子集上聚集。文献[1]在此基础上定义了新的距离,并提出了两种COSA算法:COSA1算法是一种分割的聚类算法;COSA2算法是一种层次聚类算法。为了对比COSA距离和传统的欧氏距离在文本聚类中的表现,本文对中文文本进行了分割聚类和层次聚类的实验。实验结果显示出COSA算法较基于欧氏距离的聚类算法有更好的性能,而且对于属性数的变化,COSA算法更加稳定。
关键词
计算机应用
中文信息处理
文本聚类
COSA算法
K—means算法
Keywords
computer application
Chinese information processing
text clustering
COSA algorithm
K means
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于字的分布表征的汉语基本块识别
被引量:6
11
作者
李国臣
党帅兵
王瑞波
李济洪
机构
太原工业学院计算 机工程系
山西大学 计算 机与信息技术学院
山西大学计算中心
出处
《中文信息学报》
CSCD
北大核心
2014年第6期18-25,55,共9页
基金
国家自然科学基金(60873128)
山西省科技基础条件平台建设项目(2013091003-0101)
文摘
汉语的基本块识别是汉语句法语义自动分析中的重要任务之一。传统的方法大多数直接将汉语基本块识别任务转化成词层面的一个序列标注问题,采用CRF模型来处理。虽然,在许多评测中得到最好的结果,但基于词为标注单位,在实用中受限于自动分词系统以及汉语词特征的稀疏性。为此,该文给出了一种以字为标注单位,以字为原始输入层,来构建汉语的基本块识别的深层神经网络模型,并通过无监督方法,学习到字的C&W和word2vec两种分布表征,将其作为深层神经网络模型的字的表示层的初始输入参数来强化模型参数的训练。实验结果表明,使用五层神经网络模型,以[-3,3]窗口的字的word2vec分布表征,其准确率、召回率和F值分别达到80.74%,73.80%和77.12%,这比基于字的CRF高出约5%。这表明深层神经网络模型在汉语的基本块识别中是有作用的。
关键词
汉语基本块
分布表征
深层神经网络
序列标注
Keywords
Chinese base-chunk, distributed representation ,deep neural network, sequence labeling.
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 三字歧义链自动分词方法
被引量:4
12
作者
张翠英
亢临生
机构
山西大学 信息管理系
山西大学计算中心
出处
《情报学报》
CSSCI
北大核心
1998年第3期203-207,共5页
文摘
歧义问题是自动分词系统中要解决的主要问题之一。本文介绍一种在最大匹配法基础上,根据大量的真实语料中出现的歧义现象,把可能产生歧义切分的词进行特性分类。
关键词
歧义
分词系统
三字歧义链
自动分词
信息处理
Keywords
ambiguity,characteristics in word segmentation,word segmentation system.
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 一种改进的病理切片图片拼接算法
被引量:3
13
作者
韩丽萍
杨永红
陈礼民
机构
山西大学 电子系
山西大学计算中心
出处
《计算机应用与软件》
CSCD
北大核心
2003年第7期56-58,共3页
文摘
本文针对现有图像配准方法存在的问题 ,提出了一种新的基于特征的图像对准算法 ,利用差值数据中最大包与次大包之间的距离来配准相邻图像 ,研究结果表明该算法在提高拼接精度的基础上 ,大大提高了配准的稳定性 ,是一种快速实用的拼接算法。
关键词
远程医疗
病理诊断
病理切片图片拼接算法
图像拼接
Keywords
Image mosaic Difference data Maximum envelope Submaximum envelope Distance between two envelopes
分类号
R361.2
[医药卫生—病理学]
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 连续波微扰下飞秒光孤子的传输特性研究
被引量:5
14
作者
田晋平
周国生
机构
山西大学计算中心
山西大学 电子信息技术系
出处
《光子学报》
EI
CAS
CSCD
北大核心
2005年第9期1389-1392,共4页
基金
国家自然科学基金(60244006
60477026)资助项目
文摘
给出了描述连续波扰动下飞秒光脉冲在光纤系统中传输的微扰高阶非线性薛定谔方程,通过矩法和微扰理论分析了飞秒亮孤子与连续波相互作用的特性,并利用龙格-库塔积分和分步傅里叶方法进行了数值模拟.结果表明,连续波微扰对光纤孤子通讯系统是十分有害的,在实际通讯过程中应当尽量避免连续波的渗入.
关键词
光通讯
光孤子
高阶非线性薛定谔方程
连续波
Keywords
Optical communication
Optical soliton
HNLS equation
Continuous wave
分类号
O437
[机械工程—光学工程]
题名 基于数据场相关性的光线投射算法
被引量:5
15
作者
陈礼民
梁晓辉
邵志东
机构
山西大学计算中心
山西大学 计算 机科学系
出处
《中国图象图形学报(A辑)》
CSCD
1999年第9期762-765,共4页
文摘
光线投射算法是体绘制中的经典方法。这一算法具有结构清晰,实现便利的特点。但简单的光线投射算法存在采样效率低和绘制精度低的缺点。本文利用数据场的相关性和不等步长的采样方法来改善光线投射算法的品质,使它既具有快速的优点又具有较高的成象精度。
关键词
科学计算
体绘制
光线投射算法
数据场
相关性
Keywords
Visualization of Scientific Computing, Volume Rendering, Ray casting algorithm, Coherence of 3D data filed
分类号
TP391.75
[自动化与计算机技术—计算机应用技术]
题名 病理切片远程会诊中图像拼接技术的研究
被引量:3
16
作者
陈立潮
王荣
陈礼民
机构
太原科技大学 计算 机科学与技术学院
山西大学计算中心
出处
《计算机仿真》
CSCD
北大核心
2012年第2期220-224,共5页
基金
山西省研究生优秀创新项目(20103099)
文摘
研究图像拼接技术优化问题,是当前图像处理领域的研究热点。由于技术原因,在拼接时会造成误配。目前有利用全局优化的拼接方法进行修正的,理论上比较合理,但在速度和效果方面,尤其是精度要求比较高的场合还不理想。为解决上述问题,提出一种新方法,根据图片拼接时位置之间的相关性进行修正。提出拼接参数的相关公式,分析并提出修正简化规律。最后对十六张病理切片拼接图中误配部分进行修正。实验证明,算法可以将误差控制在一个像素以内,取得良好的效果。证明方法适用于对拼接精度要求高的应用领域,有较高的实用价值。
关键词
图像拼接
图像处理
拼接修正
修正公式
修正权重
Keywords
Image mosaieing
Image processing
Errors correction
Correction formula
Correction weight
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 两水平无重复因析试验散度效应BH估计的性质
被引量:3
17
作者
李济洪
任改仙
王钰
机构
山西大学计算中心
山西大学 数学科学学院
出处
《应用概率统计》
CSCD
北大核心
2010年第2期179-189,共11页
基金
国家自然科学基金(60873128)资助
文摘
本文研究了两水平无重复因析试验散度效应BH估计的性质,给出了BH估计无偏性的充分必要条件,求得了它的近似方差.并在多个模型下对BH与MH估计进行了模拟比较.
关键词
散度效应
BH估计
无重复因析试验
Keywords
Dispersion effects
BH estimator
unreplicated factorial experiments
分类号
O212.6
[理学—概率论与数理统计]
题名 利用支持向量机实现动词-动词搭配的自动标注
被引量:4
18
作者
白妙青
郑家恒
机构
山西大学计算中心
山西大学 计算 机系
出处
《计算机工程与应用》
CSCD
北大核心
2005年第35期164-166,172,共4页
基金
国家自然科学基金(编号:60473139)资助
文摘
动词是中文信息处理的核心,是计算机对汉语进行分析和处理的基础。文章给出利用支持向量机法(SVM)进行动词-动词搭配的研究。首先构造训练特征库和学习特征库,然后利用高斯核函数将训练特征库中的样本映射为高维空间中的向量,使样本线性可分,求得超平面,最终实现SVM机的构造。通过对待测的1000句汉语句子应用SVM进行了动词搭配的自动识别分析,获得了开放测试抽取正确率为69.6%,召回率为67.8%的理想结果。
关键词
语料
搭配
特征选择
支持向量机
Keywords
corpus,collocation,feature selection,Support Vector Machine
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 动词与动词搭配方法的研究
被引量:3
19
作者
白妙青
郑家恒
机构
山西大学计算中心
山西大学 计算 机系
出处
《计算机工程与应用》
CSCD
北大核心
2004年第27期70-72,共3页
基金
国家863高技术研究发展计划项目(编号:2001AA114031)资助
文摘
搭配是汉语自动句法分析的重要环节,而动词是句法分析的核心。论文面向中文信息处理,通过对真实文本的统计分析归纳了搭配自动获取规则,结合统计模型,研究了动词-动词搭配中各关系类型的分布特征以及搭配词语的位置分布特征,在此基础上成功地抽取出所选语料中的动词—动词搭配。其中抽取正确率为75%,召回率为64%。
关键词
词语搭配
语料库
中文信息处理
Keywords
collocation,corpus,Chinese information processing
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于规则的中文阅读理解问题回答技术研究
被引量:1
20
作者
李济洪
杨杏丽
王瑞波
张娜
李国臣
机构
山西大学计算中心
山西大学 数学科学学院
山西大学 计算 机与信息技术学院
出处
《中文信息学报》
CSCD
北大核心
2009年第4期3-9,共7页
基金
国家自然科学基金资助项目(60873128)
国家社会科学基金青年资助项目(07CYY022)
文摘
该文针对中文阅读理解问答中的时间、人物、地点、数值、实体、描述六类问题,制定了各类问题回答的启发式规则集。对规则集中每条规则赋予一个相应权值,利用正交表对各规则所对应的权值进行了调优选取,给出了各候选答案句基于相应规则的得分计算方法。该文方法在山西大学自主开发的中文阅读理解语料库CRCC v1.1上进行了实验,在整个语料库上得到了83.09%的HumSent准确率。为了与文献[10]中的最大熵方法比较,该文在与文献[10]中完全相同的训练集上调优规则的权值,在相同的测试集上测试,最终得到HumSent准确率81.13%,比最大熵的方法高大约1%,且在全部的六类问题上,该文方法的HumSent准确率都不低于最大熵方法。
关键词
计算机应用
中文信息处理
阅读理解
问答系统
规则
正交表
Keywords
computer application
Chinese information processing
reading comprehension
question answering
heuristic rules
orthogonal array
分类号
TP391
[自动化与计算机技术—计算机应用技术]