本文介绍了新疆维吾尔自治区重点攻关课题信息交换用维吾尔文、哈萨克文、柯尔克孜文T rue T ype 4套字体12种字形的地方标准制定公布与研发情况。着重阐述课题研究中解决的有关字体字形标准、研究方法、技术路线、解决的技术难点、技...本文介绍了新疆维吾尔自治区重点攻关课题信息交换用维吾尔文、哈萨克文、柯尔克孜文T rue T ype 4套字体12种字形的地方标准制定公布与研发情况。着重阐述课题研究中解决的有关字体字形标准、研究方法、技术路线、解决的技术难点、技术创新点、成果形式及其推广应用情况等,对我国民文计算机字体字形标准制定与研制有一定借鉴作用。展开更多
针对目前少数民族语言方面热点关键词提取算法研究较少,而且精度和效率不高这一问题,提出一种哈萨克文网络热点关键词提取方法。将预处理后得到的文本利用多重因子加权改进的TF-IDF算法进行关键词提取,后续根据其位置和频率信息进行关...针对目前少数民族语言方面热点关键词提取算法研究较少,而且精度和效率不高这一问题,提出一种哈萨克文网络热点关键词提取方法。将预处理后得到的文本利用多重因子加权改进的TF-IDF算法进行关键词提取,后续根据其位置和频率信息进行关键词组配,得到候选热点关键词集合;结合TF-PDF算法和媒体关注度思想,构造关键词热度评分标准公式KHD(Keywords Hot Degree),实现对热点关键词的提取。实验结果证明此方法可行有效,并且在提取精度和效率上都有显著提高。展开更多
文摘本文介绍了新疆维吾尔自治区重点攻关课题信息交换用维吾尔文、哈萨克文、柯尔克孜文T rue T ype 4套字体12种字形的地方标准制定公布与研发情况。着重阐述课题研究中解决的有关字体字形标准、研究方法、技术路线、解决的技术难点、技术创新点、成果形式及其推广应用情况等,对我国民文计算机字体字形标准制定与研制有一定借鉴作用。
文摘针对目前少数民族语言方面热点关键词提取算法研究较少,而且精度和效率不高这一问题,提出一种哈萨克文网络热点关键词提取方法。将预处理后得到的文本利用多重因子加权改进的TF-IDF算法进行关键词提取,后续根据其位置和频率信息进行关键词组配,得到候选热点关键词集合;结合TF-PDF算法和媒体关注度思想,构造关键词热度评分标准公式KHD(Keywords Hot Degree),实现对热点关键词的提取。实验结果证明此方法可行有效,并且在提取精度和效率上都有显著提高。