期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
中文分词歧义识别算法的优化 被引量:2
1
作者 胡阿明 王卫东 《现代电子技术》 2012年第8期107-109,共3页
中文分词系统性能的好坏直接影响到后续的工作,而歧义字段的处理更是衡量一个分词系统好坏的重要标志。解决歧义问题前首先就要找到歧义字段,本文在之前的增字最大匹配算法基础上,提出了一种结合逐字扫描算法和逆向最大匹配算法的歧义... 中文分词系统性能的好坏直接影响到后续的工作,而歧义字段的处理更是衡量一个分词系统好坏的重要标志。解决歧义问题前首先就要找到歧义字段,本文在之前的增字最大匹配算法基础上,提出了一种结合逐字扫描算法和逆向最大匹配算法的歧义字段识别方法。实验结果表明,这里提出的算法执行效率要比增字最大匹配算法效率高,速度更快。 展开更多
关键词 中文分词 逆向最大匹配算法 歧义识别 算法优化
下载PDF
中文分词中的歧义识别处理策略 被引量:6
2
作者 魏莎莎 熊海灵 《微计算机信息》 2010年第30期190-192,共3页
中文分词是中文信息处理中最重要的预处理,分词的速度和精度直接影响信息处理的结果。歧义现象出现频繁,是目前中文分词的一大难题。本文通过介绍歧义存在的种类,分别介绍了目前各种歧义识别的处理策略,就各种策略进行了比较分析,以及... 中文分词是中文信息处理中最重要的预处理,分词的速度和精度直接影响信息处理的结果。歧义现象出现频繁,是目前中文分词的一大难题。本文通过介绍歧义存在的种类,分别介绍了目前各种歧义识别的处理策略,就各种策略进行了比较分析,以及指出未来的研究方向。 展开更多
关键词 中文分词 交集型歧义 组合型歧义 歧义识别
下载PDF
英文需求文档中的歧义识别
3
作者 方德权 恽芳芸 《商情》 2021年第44期46-48,共3页
需求是软件工程项目生命周期的第一个阶段,也是软件工程项目中最重要的阶段。开发方对需求的业务理解不够彻底,又或是需求方对需求描述不够清晰这些在需求过程中的缺陷都会给项目带来极大风险。本文中使用文献词汇、正则表达式、词性判... 需求是软件工程项目生命周期的第一个阶段,也是软件工程项目中最重要的阶段。开发方对需求的业务理解不够彻底,又或是需求方对需求描述不够清晰这些在需求过程中的缺陷都会给项目带来极大风险。本文中使用文献词汇、正则表达式、词性判断等方式对英文需求文档中潜在的歧义进行分析和识别,这对节约经济成本和人力成本有着积极因素,并且对提高软件工程项目的时间进度和开发质量意义深远。 展开更多
关键词 需求工程 需求说明文档 需求歧义 歧义识别
下载PDF
微弱光信号的量子增强接收优化方法(特邀)
4
作者 东晨 郭畅 +4 位作者 吴田宜 冉阳 党可征 李福全 周子超 《红外与激光工程》 EI CSCD 北大核心 2023年第6期132-141,共10页
在经典理论框架下,相干探测性能受限于散粒噪声对应的标准量子极限,而量子增强接收技术通过引入位移算子,采用关联的方式将经典的平衡零拍/零差探测转化为光子数态的测量,理论上可以突破标准量子极限并不断逼近Helstrom极限。无歧义量... 在经典理论框架下,相干探测性能受限于散粒噪声对应的标准量子极限,而量子增强接收技术通过引入位移算子,采用关联的方式将经典的平衡零拍/零差探测转化为光子数态的测量,理论上可以突破标准量子极限并不断逼近Helstrom极限。无歧义量子态识别(Unambiguous State Discrimination,USD)是量子增强接收常用的识别判决策略之一。然而,由于微弱光信号的能量有限,传统的USD量子增强接收方法的适用微弱信号范围较小,微弱信号识别的错误率较高。提出了一种QPSK调制量子增强接收的混合测量优化方案,该方案首先通过二态零差测量将QPSK相干态的区分转化为BPSK相干态的区分,然后通过BPSK量子增强接收测量实现相干态的无歧义识别。仿真表明,混合测量方案在平均光子数在3.2~11.3之间优于经典的外差测量方案,而且比传统QPSK量子增强接收方案具有更大的适用信号范围。 展开更多
关键词 量子增强接收 混合测量方案 歧义量子态识别 自适应反馈
下载PDF
Robust Integrated Models for Chinese Predicate-Argument Structure Analysis
5
作者 罗彦彦 浅原正幸 松本裕治 《China Communications》 SCIE CSCD 2012年第3期10-18,共9页
Predicate-Argument (PA) structure anal- ysis is often divided into three subtasks: predicate sense disambiguation, argument identification and argument classification mostly been modeled in To date, they have isol... Predicate-Argument (PA) structure anal- ysis is often divided into three subtasks: predicate sense disambiguation, argument identification and argument classification mostly been modeled in To date, they have isolation. However, this approach neglects logical constraints between them. We therefore exploite integrating predicate sense disambiguation with the latter two subtasks respectively, which verifies that the automatic predicate sense disambiguation could help the se- mantic role labeling task. In addition, a dual de- composition algorithm is used to alleviate the er- ror propagation between argument identification subtask and argument classification subtask by benefitting the argument identification subtask greatly. Experiment results show that our ap- proach leads to a better performance with PA a- nalysis than other pipeline approaches. 展开更多
关键词 semantic role labeling PA structureanalysis dual decomposition joint learning
下载PDF
Feminism and Gender Identity in Feminist Translation
6
作者 Wang Diqiu Hu Shanshan Pang Wenfang 《International English Education Research》 2014年第12期29-31,共3页
Bringing the aspect of "gender" into translation studies, feminism gave fresh impetus to the "Cultural Turn" for translation studies in 1990s. Feminist translation theory puts forward its viewpoints on the role of... Bringing the aspect of "gender" into translation studies, feminism gave fresh impetus to the "Cultural Turn" for translation studies in 1990s. Feminist translation theory puts forward its viewpoints on the role of gender and approves of translators' gender role in the interpretation of the original text. It seems that gender is of no more importance than other factors, such as nationality, class, and ideology of translators. Translation and women have been long associated with each other for they both occupy peripheral positions. The conventional view holding sway is that a translation is considered a secondary work dependent on, and subservient to, the original text, just as women are assigned dependent functions under patriarchal power. Unsatisfied with the notion that translator, translation and women are all relegated to the inferior class, feminist translators do their utmost to cast away the conventional sexism ideas in translation studies and social ideology. The core of feminist translation theory is: "identify and critique the tangle of concepts which relegates both women and translation to the bottom of the social and literary ladder" (Simon 1996:1). In order to realize the dream to overthrow patriarchal domination and make themselves visible, feminist translators seek to emphasize their identity and ideological stance in the translation project. Feminist translators are no longer invisible. They have the right to revise, manipulate and occupy the source text. Feminist translation is nothing but the translators' creative treason from the perspective of feminism. The thesis first systematically summarizes the present feminist translation theories, followed by a detailed analysis of some gender-related translation issues, especially the relationship between language and gender. After the analysis of some cases from the feminist translators, different translation approaches adopted are explored to show the peculiar characteristics of feminist translation. 展开更多
关键词 feminist translation gender language gender identity translation strategies
下载PDF
经济学等知识文本的深度表示学习 被引量:2
7
作者 程兵 邢玲 闫强 《计量经济学报》 2022年第1期58-80,共23页
本文首先介绍了表示学习的数学原理,分布式的表示使得语言的表达更加丰富和有效,特别是针对巨量的文本大数据,以著名的预训练BERT模型为例,它的12组高维(768维)实数表示向量表达了文本中的语法和语义信息,也可以通过一个解码器将向量中... 本文首先介绍了表示学习的数学原理,分布式的表示使得语言的表达更加丰富和有效,特别是针对巨量的文本大数据,以著名的预训练BERT模型为例,它的12组高维(768维)实数表示向量表达了文本中的语法和语义信息,也可以通过一个解码器将向量中隐含表达的信息重构出来.本文的主要贡献是两个方面,第一方面是使用统计方法评估BERT模型的表示能力;第二方面是利用BERT模型来处理中文句子分词的歧义模糊困难问题.在第一方面:我们的发现:一是BERT模型的表示能力的确很充足,即使是针对数十万的文本数据,也可以获得较好的向量表示效果,这说明了BERT模型已经预留了充足的表示向量空间来包含各种复杂的语言结构,我们发现BERT模型的不同层深度的表示向量表示了语言知识的不同层次信息,其中第1层表示了单字和单词的信息,而深度越深,表示向量则越接近表示文本的整体语言知识(从中文的词组,再到句子段落,直到文档以及文档之间的主题语言信息);二是发现语义相近的句子在BERT向量空间也是处于相近的空间领域,这说明整个BERT向量表示空间是自适应地将相似的语言组织安排在相近的子空间中.在第二方面,我们巧妙地利用了这个BERT模型的MASK机制,该机制允许模型的输入句子中将部分的词随意隐藏掉,但模型依然能够自适应地预测被隐藏部分的表示向量,通过比较正确分词以及错误分词masked后的句子表示向量,我们能够正确地识别出来哪一种分词方法是正确的,平均准确率达到66.875%. 展开更多
关键词 深度学习 表示学习 分布式表示 BERT模型 PCA主成分 语言相似性 分词歧义识别
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部