期刊文献+
共找到91篇文章
< 1 2 5 >
每页显示 20 50 100
基于Windows的维哈柯文多语种操作系统的研究 被引量:1
1
作者 刘俊 吾守尔.斯拉木 艾尼宛尔.托乎提 《现代计算机(中旬刊)》 2011年第10期17-20,共4页
为了满足新疆少数民族的信息化需求,提出一种基于Windows的维吾尔文、哈萨克文、柯尔克孜文多语种操作系统的本地化研究。引用微软提供的多语种接口及WFP(WindowsFile Protection)技术、文本处理技术、6种点阵字库等技术很好地处理了多... 为了满足新疆少数民族的信息化需求,提出一种基于Windows的维吾尔文、哈萨克文、柯尔克孜文多语种操作系统的本地化研究。引用微软提供的多语种接口及WFP(WindowsFile Protection)技术、文本处理技术、6种点阵字库等技术很好地处理了多语种操作系统常见问题。运行结果表明,系统界面字符清晰、输入快捷、可靠性高。 展开更多
关键词 多语种 本地化 文本处理 点阵
下载PDF
多语种二分查找类库及文件生成工具的实现
2
作者 艾山·吾买尔 帕肉克·司地克 +1 位作者 亚森·伊明 吐尔根·伊布拉音 《电脑知识与技术》 2013年第11期6996-6998,共3页
该文,为了满足汉维机器翻译系统、汉维词典、维文字转换等系统中对文件的快速访问,使用C#设计与实现了基于二分查找的检索类和该类可访问的文件生成工具。
关键词 二分查找 内容 C#
下载PDF
多语种(汉、维、哈、柯文)辅助办案系统的开发
3
作者 麦迪乃.热合木江 艾尼宛儿.托乎提 +1 位作者 吾守尔.斯拉木 阿依佳肯.阿曼太 《计算机应用与软件》 CSCD 北大核心 2013年第8期203-205,225,共4页
结合新疆少数民族地区公安机关的工作实际,在充分考虑到基层执法办案民警的需求后,开发出了中文、维吾尔文、哈萨克文、柯尔克孜文辅助办案系统。重点介绍辅助办案系统的系统结构、工作流程及关键技术。软件是多文种操作界面,操作简单... 结合新疆少数民族地区公安机关的工作实际,在充分考虑到基层执法办案民警的需求后,开发出了中文、维吾尔文、哈萨克文、柯尔克孜文辅助办案系统。重点介绍辅助办案系统的系统结构、工作流程及关键技术。软件是多文种操作界面,操作简单、具有良好的安全性及兼容性。系统使用了少数民族文字处理、模板化、软件国际化等技术。该系统的开发与应用,对降低警务成本,提升公安机关工作效率,促进执法规范化等方面具有良好的成效。目前系统在乌鲁木齐某公安局正常运行了2年。 展开更多
关键词 多语种 公安 辅助办案系统
下载PDF
融合方面语义和网格标记的多语言意见元组抽取
4
作者 古文霞 早克热·卡德尔 +1 位作者 杨乾 艾山·吾买尔 《计算机科学》 CSCD 北大核心 2024年第4期324-333,共10页
面向方面的细粒度意见抽取(Aspect-oriented Fine-grained Opinion Extraction,AFOE)任务的目的是以意见对的形式抽取文本评论中的方面和意见词或者再抽取情感极性,形成意见三元组。以往的研究通常以管道方式抽取意见元素,容易出现错误... 面向方面的细粒度意见抽取(Aspect-oriented Fine-grained Opinion Extraction,AFOE)任务的目的是以意见对的形式抽取文本评论中的方面和意见词或者再抽取情感极性,形成意见三元组。以往的研究通常以管道方式抽取意见元素,容易出现错误传播的问题,而且大多数只关注方面词和意见词的单个子任务抽取,忽略了不同意见元素之间的相互影响和指示信息,导致意见挖掘任务不完整。此外,面向中文的意见元素抽取任务的研究较少。针对以上问题,文中提出了融合方面语义和网格标记的多语言意见元组抽取模型。首先,使用向内LSTM(Inward-LSTM)和向外LSTM(Outward-LSTM)编码方面词及其对应的上下文信息建立方面和候选意见词的关联,再结合全局信息生成特定方面语义特征的上下文表示,有利于提高下游意见元素抽取的性能。其次,使用网格标记方案的推理策略,利用方面和意见词之间的依赖指示信息进行更准确的抽取,以端到端的方式处理AFOE任务。相比基线模型,对于方面意见对抽取任务,改进的模型在中英文数据集上的F1值提高了0.89%~4.11%,对于三元组抽取任务提高了1.36%~3.11%,实验结果表明,改进的模型能有效地对中英文评论的意见元素进行抽取,性能显著优于基线模型。 展开更多
关键词 方面意见对抽取 三元组抽取 网格标记方案 方面语义 面向方面的细粒度意见抽取
下载PDF
基于WebGIS的维吾尔文天气信息服务 被引量:3
5
作者 郑江华 阿地力肉孜 《计算机工程》 CAS CSCD 2012年第6期288-290,共3页
针对维吾尔语用户对基于地理信息技术的服务需求,提出一种基于WebGIS的维吾尔文天气信息服务系统。以天气信息服务为应用领域,集成Google Maps API地图服务组件与实时Yahoo Weather RSS天气信息,利用网页自定义字体技术解决维吾尔文的... 针对维吾尔语用户对基于地理信息技术的服务需求,提出一种基于WebGIS的维吾尔文天气信息服务系统。以天气信息服务为应用领域,集成Google Maps API地图服务组件与实时Yahoo Weather RSS天气信息,利用网页自定义字体技术解决维吾尔文的表达问题,使用VS2005开发工具实现系统。应用结果表明,该系统能提供多种内置工具,实现维吾尔文天气信息的实时查询。 展开更多
关键词 地理信息系统 封装 信息查询 天气信息
下载PDF
基于互信息的维吾尔文自适应组词算法 被引量:6
6
作者 吐尔地.托合提 艾克白尔.帕塔尔 艾斯卡尔.艾木都拉 《计算机应用研究》 CSCD 北大核心 2013年第2期429-431,435,共4页
传统的分词方法将一个维吾尔文语义词(多词关联模式)拆分成与词意义不符的若干个片段,因此在维吾尔语文本分析及文本处理过程中导致许多问题,严重影响文本处理效率。提出了一种维吾尔文组词的全新概念,用互信息作为相邻单词间关联程度... 传统的分词方法将一个维吾尔文语义词(多词关联模式)拆分成与词意义不符的若干个片段,因此在维吾尔语文本分析及文本处理过程中导致许多问题,严重影响文本处理效率。提出了一种维吾尔文组词的全新概念,用互信息作为相邻单词间关联程度的度量,实现了基于分段式策略和增量式策略的两种自适应组词算法,并与传统的分词方法得到的词汇表进行对比分析。实验结果表明,组词算法能够非常有效地提取文本中的语义词,两种算法在大规模文本集上的组词准确率分别达到了84.31%和88.24%。 展开更多
关键词 维吾尔文 传统分词 语义词 互信息 组词
下载PDF
场景文字识别技术研究综述 被引量:17
7
作者 王德青 吾守尔·斯拉木 许苗苗 《计算机工程与应用》 CSCD 北大核心 2020年第18期1-15,共15页
对文字检测和识别技术进行了全面的介绍。介绍了自然场景文字识别技术的研究背景、应用领域、技术难点等;介绍了场景文字识别的预处理技术及流程,介绍了近年来出现的基于深度学习的通用检测网络、维吾尔文和中英文的深度学习文字检测网... 对文字检测和识别技术进行了全面的介绍。介绍了自然场景文字识别技术的研究背景、应用领域、技术难点等;介绍了场景文字识别的预处理技术及流程,介绍了近年来出现的基于深度学习的通用检测网络、维吾尔文和中英文的深度学习文字检测网络、场景文字识别深度学习网络、端到端场景文字检测与识别深度学习网络,并总结了各类网络的结构特点、优势、局限性、应用场景以及实现成本,接着进行了综合分析;最后介绍了公开数据集,并探讨了场景文字识别技术的发展趋势及可能的研究方向。 展开更多
关键词 场景文字检测 文本识别 深度学习 端到端检测识别
下载PDF
基于TextRank算法和互信息相似度的维吾尔文关键词提取及文本分类 被引量:8
8
作者 阿力甫.阿不都克里木 李晓 《计算机科学》 CSCD 北大核心 2016年第12期36-40,共5页
针对维吾尔语文本的分类问题,提出一种基于TextRank算法和互信息相似度的维吾尔文关键词提取及文本分类方法。首先,对输入文本进行预处理,滤除非维吾尔语的字符和停用词;然后,利用词语语义相似度、词语位置和词频重要性加权的TextRank... 针对维吾尔语文本的分类问题,提出一种基于TextRank算法和互信息相似度的维吾尔文关键词提取及文本分类方法。首先,对输入文本进行预处理,滤除非维吾尔语的字符和停用词;然后,利用词语语义相似度、词语位置和词频重要性加权的TextRank算法提取文本关键词集合;最后,根据互信息相似度度量,计算输入文本关键词集和各类关键词集的相似度,最终实现文本的分类。实验结果表明,该方案能够提取出具有较高识别度的关键词,当关键词集大小为1250时,平均分类率达到了91.2%。 展开更多
关键词 维吾尔语 文本分类 关键词提取 TextRank算法 互信息相似度
下载PDF
用于双语科技术语对齐的汉维文可比语料库构建 被引量:2
9
作者 彭飞 吐尔根.依布拉音 +1 位作者 艾山.吾买尔 米尔夏提.力提甫 《新疆大学学报(自然科学版)》 CAS 北大核心 2017年第3期316-321,共6页
面向汉文维吾尔文(以下简称汉维)双语科技术语抽取这一应用目标,本文提出新闻科技领域的汉维可比语料库设计方案并进行实验.将网络采集的汉维语料利用机器翻译系统进行初加工后映射到向量空间中并使用LSI算法计算出各向量间的相关性,利... 面向汉文维吾尔文(以下简称汉维)双语科技术语抽取这一应用目标,本文提出新闻科技领域的汉维可比语料库设计方案并进行实验.将网络采集的汉维语料利用机器翻译系统进行初加工后映射到向量空间中并使用LSI算法计算出各向量间的相关性,利用计算后的向量建立索引并依次计算出源文本与候选文本的相似值.本文设计两种实验进行对比,对选取的可比语料进行评估、筛选,最终达到构建汉维可比语料库的目的. 展开更多
关键词 可比语料库 汉维可比语料库构建 双语术语抽取 LSI
下载PDF
信息交换用维哈柯文代码标准研究 被引量:1
10
作者 吾守尔.斯拉木 胡尔西丹 +1 位作者 艾尼宛尔.托乎提 刘俊 《信息技术与标准化》 2011年第6期30-32,36,共4页
对现有条件下维哈柯文代码标准存在的问题进行分析,阐述了维哈柯文编码字符集标准研究及技术特点、维吾尔文界面术语标准研究及技术特点、古维吾尔文编码技术研究,该标准的研究加快并推进了新疆少数民族语言文字的信息化及民文软件的产... 对现有条件下维哈柯文代码标准存在的问题进行分析,阐述了维哈柯文编码字符集标准研究及技术特点、维吾尔文界面术语标准研究及技术特点、古维吾尔文编码技术研究,该标准的研究加快并推进了新疆少数民族语言文字的信息化及民文软件的产业化,具有巨大的社会经济效益。 展开更多
关键词 维哈柯文 标准 编码
下载PDF
基于舆情新闻的中文关键词抽取综述 被引量:5
11
作者 杨文忠 丁甜甜 +1 位作者 康鹏 卜文秀 《计算机工程》 CAS CSCD 北大核心 2023年第3期1-17,共17页
基于舆情事件的关键词抽取算法作为舆情监测的基础技术之一,其目的是在不同的舆情事件中抽取出人们关注的核心词汇,从而快速了解新闻内容。随着深度学习的发展,传统的无监督关键词抽取技术和有监督算法中的分类模型已经逐渐被基于深度... 基于舆情事件的关键词抽取算法作为舆情监测的基础技术之一,其目的是在不同的舆情事件中抽取出人们关注的核心词汇,从而快速了解新闻内容。随着深度学习的发展,传统的无监督关键词抽取技术和有监督算法中的分类模型已经逐渐被基于深度学习的序列标注模型所替代。梳理无监督关键词抽取的限制性、分类模型在关键词抽取中的优势与不足、以及现有的深度学习对关键词抽取技术发展的帮助,重点分析整体关键词抽取技术的发展中卷积神经网络、循环神经网络等深度学习的关键词抽取方法,并归纳现有方法的优缺点与发展趋势。此外,深度学习虽然在关键词抽取领域发挥了重要的作用,但其自身也存在着依赖大规模带标签样本、训练时间长与复杂度高等缺陷,需要在未来发展中进行解决。为确保分析过程的真实性,利用6个舆情新闻数据集和2个小型数据集进行实验复现,实验结果与文中理论分析一致。在此基础上,对关键词抽取技术及其所面临的困难和挑战进行梳理和分析,并针对现存问题对该领域的发展前景加以展望。 展开更多
关键词 舆情监测 关键词抽取 核心词汇 深度学习 自然语言处理
下载PDF
基于多粒度与自修复融合的人脸表情识别 被引量:2
12
作者 王俊峰 木特力甫·马木提 +2 位作者 阿力木江·艾沙 努尔毕亚·亚地卡尔 库尔班·吾布力 《计算机工程与设计》 北大核心 2023年第2期473-479,共7页
为有效提取和融合表情多粒度特征信息,降低自然场景人脸表情数据集存在不确定性和错误数据等因素致使准确率难以满足现实需求的问题,基于深度卷积神经网络提出多粒度与自修复融合的表情识别模型。采用拼图生成器生成不同粒度图像,利用... 为有效提取和融合表情多粒度特征信息,降低自然场景人脸表情数据集存在不确定性和错误数据等因素致使准确率难以满足现实需求的问题,基于深度卷积神经网络提出多粒度与自修复融合的表情识别模型。采用拼图生成器生成不同粒度图像,利用渐进式的训练过程学习不同粒度图像之间互补的特征信息,采用自修复方法避免网络过度拟合错误样本图像,对错误样本进行重新标注。在AffectNet数据集和RAF-DB数据集上准确率分别达到了63.94%和87.10%,实验结果表明,该模型具有较高的准确率和良好的鲁棒性。 展开更多
关键词 多粒度 渐进式训练 自修复 拼图生成器 表情识别
下载PDF
基于多事件语义增强的情感分析 被引量:2
13
作者 张雪 赵晖 《计算机科学》 CSCD 北大核心 2023年第5期238-247,共10页
隐式情感分析是检测不包含明显情感词的句子的情感。文中集中于以事件为中心的情感分析,该任务是通过句子中描述的事件推断其情感极性。在以事件为中心的情感分析中,现有方法要么将文本中名词短语看作事件,要么采用复杂的模型建模事件,... 隐式情感分析是检测不包含明显情感词的句子的情感。文中集中于以事件为中心的情感分析,该任务是通过句子中描述的事件推断其情感极性。在以事件为中心的情感分析中,现有方法要么将文本中名词短语看作事件,要么采用复杂的模型建模事件,未能充分建模事件信息,并且没有考虑到包含多个事件的情况。为解决以上问题,提出将事件表示为事件三元组〈主语,谓语,宾语〉的形式,基于这种事件表示,进一步提出基于事件增强语义的情感分析模型MEA来检测文本的情感。文中利用句法信息捕获事件三元组的关系,根据每个事件对句子贡献程度的不同,采用注意力机制建模事件之间的关系。与此同时,采用双向长短时记忆网络建模句子的上下文信息,并采用多级性正交注意力机制捕获不同极性下注意力权重的差异,这可以作为显著的判别特征。最后,依据事件特征和句子特征的重要程度为其分配不同的权重比例,并将它们融合得到最终的句子表示。此外,文中还提出一个用于事件增强情感分析的数据集MEDS,其中每条句子都标有事件三元组表示和情感极性标签。研究表明,在自建的数据集中,所提模型优于现有的基线模型。 展开更多
关键词 事件型情感分析 表示学习 情感分析 图卷积神经网络 注意力机制
下载PDF
基于图卷积和注意力的方面级情感分类
14
作者 窦贤锐 李敏 赵晖 《计算机工程与设计》 北大核心 2023年第9期2657-2663,共7页
为解决图注意力网络对边信息的忽视和固定卷积层数的方法不能自适应获取情感词信息的问题,提出一种基于图卷积和注意力的方面级情感分类模型。加入句法依存边信息提高对不同句法连接词的区分度;一个迭代注意力机制被设计用于建立方面词... 为解决图注意力网络对边信息的忽视和固定卷积层数的方法不能自适应获取情感词信息的问题,提出一种基于图卷积和注意力的方面级情感分类模型。加入句法依存边信息提高对不同句法连接词的区分度;一个迭代注意力机制被设计用于建立方面词和句中所有词的关联关系,自适应选择全局词信息。模型在Twitter、Rest14和Rest16数据集上获得更好的性能。实验结果验证了该方法的有效性。 展开更多
关键词 情感分类 方面级情感分析 图卷积网络 观点词 依存树 注意力机制 门机制
下载PDF
基于字符归一化双投影互相关性匹配识别算法 被引量:8
15
作者 万金娥 袁保社 +1 位作者 谷朝 米尔沙力江.沙吾提 《计算机应用》 CSCD 北大核心 2013年第3期645-647,716,共4页
针对印刷体维吾尔文文字识别系统中的字符识别正确率较低这一难点问题,采用对字符图像进行横向扫描和纵向扫描生成行和列投影图,结合三级分类,将目标字符与对应分类中的字符的双投影图逐一归一化并进行相关性均值计算的方法,取均值最大... 针对印刷体维吾尔文文字识别系统中的字符识别正确率较低这一难点问题,采用对字符图像进行横向扫描和纵向扫描生成行和列投影图,结合三级分类,将目标字符与对应分类中的字符的双投影图逐一归一化并进行相关性均值计算的方法,取均值最大的字符作为最佳匹配识别结果,实现了对维文字符的识别。实验证明这种基于字符归一化双投影互相关性匹配识别算法方法抗干扰性强,简单易行,匹配精度高,使得印刷体维吾尔文字字符识别的正确率有了进一步提高。 展开更多
关键词 印刷体维吾尔文 双积分投影图 投影图归一化 互相关性 模板匹配识别
下载PDF
一种基于知识表示的多步攻击规划问题描述模型 被引量:4
16
作者 努尔布力 解男男 +2 位作者 刘志宇 胡亮 柴胜 《电子学报》 EI CAS CSCD 北大核心 2013年第6期1101-1107,共7页
网络入侵检测中,攻击的形式越来越多样化和复杂化,网络多步攻击成为当前攻击的主要形式.智能规划最早用于人工智能领域,将一个领域内的知识形成规划推理时的规划域,将待求解的问题对应于规划问题.将智能规划应用于多步攻击领域,用以对... 网络入侵检测中,攻击的形式越来越多样化和复杂化,网络多步攻击成为当前攻击的主要形式.智能规划最早用于人工智能领域,将一个领域内的知识形成规划推理时的规划域,将待求解的问题对应于规划问题.将智能规划应用于多步攻击领域,用以对多步攻击进行识别,并以此为基础,提出一种基于知识表示的多步攻击规划问题描述模型,用以提供解决复杂网络攻击数据的形式化描述问题的一种探索.实验中规划问题采用PDDL语言进行描述,对所提模型进行可用性验证. 展开更多
关键词 多步攻击 智能规划 安全规划问题 PDDL
下载PDF
基于语法语义知识的维吾尔文机构名识别 被引量:7
17
作者 麦合甫热提 米日姑.肉孜 +1 位作者 麦热哈巴.艾力 吐尔根.依布拉音 《计算机工程与设计》 CSCD 北大核心 2014年第8期2944-2948,共5页
为了提高维吾尔语中机构名的自动识别准确率,从维吾尔语的语言特点出发,对维吾尔语中机构名的组织结构进行了分类并将其形式化表示;根据此特征设计出有效地识别规则,创建了特征词库、地名库和修饰词库等知识库;设计并实现了基于状态转... 为了提高维吾尔语中机构名的自动识别准确率,从维吾尔语的语言特点出发,对维吾尔语中机构名的组织结构进行了分类并将其形式化表示;根据此特征设计出有效地识别规则,创建了特征词库、地名库和修饰词库等知识库;设计并实现了基于状态转移原理的高效识别算法。实验结果表明,该算法识别的F值达到83.05%,获得了较好结果。 展开更多
关键词 自然语言处理 命名实体识别 机构名识别 知识库 规则匹配
下载PDF
基于Android的维吾尔文词性标注、词干提取APP的开发与设计 被引量:2
18
作者 帕丽旦·木合塔尔 热依曼·吐尔逊 +1 位作者 买买提阿依甫 排孜拉·奴来海买提 《现代电子技术》 北大核心 2019年第18期139-142,146,共5页
在自然语言处理中词性标注和词干提取是最重要的任务.文中研究与实现基于Android的维吾尔文词性标注和词干提取APP,为维吾尔语自然语言处理工作开发出了快捷和方便的标注平台,目的是通过APP对大规模语料进行词性标注和词干提取,实现了... 在自然语言处理中词性标注和词干提取是最重要的任务.文中研究与实现基于Android的维吾尔文词性标注和词干提取APP,为维吾尔语自然语言处理工作开发出了快捷和方便的标注平台,目的是通过APP对大规模语料进行词性标注和词干提取,实现了广大学员通过一部Android系统的手机随时随地参与语料标注任务,从而完成了大规模语料的标注工作,将其应用到文本分析、机器翻译、语音合成、语音翻译等研究领域.该系统的实现为低资源少数民族智能化研究工作做出了贡献. 展开更多
关键词 安卓 词性标注 词干提取 维吾尔文 语料库 文本分析
下载PDF
维吾尔语多词表达抽取方法研究 被引量:3
19
作者 麦热哈巴.艾力 阿孜古丽.夏力甫 吐尔根.依布拉音 《计算机工程与应用》 CSCD 2014年第8期26-30,共5页
多词表达是特殊的语言现象,一般由多个词构成来表示一个意义,语料中常出现在一起。多词表达因是特殊的单元,其抽取在自然语言处理的很多领域有着非常重要的作用。讨论了目前常见的三种统计方法即互信息、对数似然比以及卡方等在维吾尔... 多词表达是特殊的语言现象,一般由多个词构成来表示一个意义,语料中常出现在一起。多词表达因是特殊的单元,其抽取在自然语言处理的很多领域有着非常重要的作用。讨论了目前常见的三种统计方法即互信息、对数似然比以及卡方等在维吾尔语多词表达抽取方面的影响。根据维吾尔语的特点,将词干作为一项特征加到抽取方法中。语料的选择上考虑了覆盖面及领域,并探讨了它们对抽取方法的影响。 展开更多
关键词 多词表达 互信息 对数似然比 卡方 维吾尔语
下载PDF
维吾尔文本转换国际音标系统设计与实现 被引量:2
20
作者 帕丽旦·木合塔尔 热依曼·吐尔逊 +1 位作者 吾守尔·斯拉木 买买提阿依甫 《信息通信》 2017年第5期97-99,共3页
实现了一套能将维吾尔文转换成国际音标的系统,主要包括:文本编辑、文本对应的语音文件播放以及维吾尔文到国际音标之间的转换功能,为维吾尔语自然语言和语音处理方面提供了一个有利的文字处理辅助工具,并满足了科研工作、教学活动以及... 实现了一套能将维吾尔文转换成国际音标的系统,主要包括:文本编辑、文本对应的语音文件播放以及维吾尔文到国际音标之间的转换功能,为维吾尔语自然语言和语音处理方面提供了一个有利的文字处理辅助工具,并满足了科研工作、教学活动以及语音学研究等各个领域的需求。 展开更多
关键词 维吾尔文 国际音标 文本转换
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部