自然语言处理算法的范式转换:统计真理与人类偏好被引量：1

Statistical Truth and Human Preferences:On the Paradigm-shift in NLP Algorithms

导出

摘要基于数据的深度学习方法在自然语言处理领域方兴未艾,但种种问题也开始显现。语言的经典的组合原则被打破,让机器“理解”语言变得不再重要,符号之间的黏性完全由样本统计决定,违背了人类语言理解和习得的主观经验。本文针对这一系列问题,详尽阐述了经典数字计算机的运算和决策过程,并对其处理部分模糊性问题时采取的策略进行简要介绍,指出即使是在统计学习过程中,人类偏好也无时无刻不在扮演着关键作用,规律性不可能无条件地从海量数据中自动浮现。逻辑学家和数据科学家有责任揭示这些主观偏好,这不仅是算法可解释性的外在需要,也是提高运算效率的正途。 Data based statistical learning as a method keep on gaining its momentum in NLP related fields.Yet by posing against our conventional understanding of language,the practice has greatly weakened the consistency of linguistics by disregarding semantics and the compositional nature of language.With a generalized description of statistical learning this paper tries to exhibit the disadvantages of replacing even pre-existing causation with co-relation as the final judgment in human reasoning.Since any statistical result always yields certain scale and dimension,which are purely preferential,we urge for a joint effort from logicians and data scientist to uncover the human input previously unrecognized in the learning process in language processing and alike.

作者林田李铁 LIN Tian;LI Tie(School of Law and Politics,Inner-Mongolia Normal University,Hohhot 011517,China;Department of Philosophy,Nanjing University,Nanjing 210023,China)

机构地区内蒙古师范大学法政学院南京大学哲学系

出处《系统科学学报》 CSSCI 北大核心 2021年第3期58-61,68,共5页 Chinese Journal of Systems Science

基金国家社科基金一般项目“延展心灵自然化的认知标志问题研究”(16BZX023) 教育部人文社科基金青年项目“认知心理学视域中的归纳逻辑前沿研究”(18YJC72040001)。

关键词因果联系偏好统计学习 causal relation preferences statistical learning

分类号 N941 [自然科学总论—系统科学]

引文网络
相关文献

参考文献3

1杨梅,王岩.语料库语言学研究述评[J].长春师范学院学报,2005,24(1):120-122. 被引量：4
2林田.人工神经网络的哲学问题[J].科学．经济．社会,2018,36(4):14-18. 被引量：1
3李伟,余森,门佳.浮点数存储精度丢失问题——由学生提问所引发的思考[J].濮阳职业技术学院学报,2015,28(3):151-153. 被引量：3

二级参考文献10

1[1]Thomas, J. and Short, M. (eds) Using Corpora for Language Research, London: Longman, 1996.
2[2]Lawler, John M. & Helen Aristar Dry (eds.) Using Computers in Linguistics: A Practical Guide. Routledge, 1998.
3[3]McEnery T& Wilson A. Corpus Linguistics Edinburgh University Press, 1996.
4[4]Leech, G. Corpus Annotation Schemes, Literary and Linguistic Computing 8 (4) : 275-81, 1992.
5[5]Kennedy, Graeme. An Introduction to Corpus Linguistics. Addison Wesley Longman, 1998.
6[7]桂诗春、杨惠中.中国英语学习者语料库[M].上海外语教育出版社,2003.
7郝丽萍.C语言浮点数探析[J].广州番禺职业技术学院学报,2010,9(2):56-59. 被引量：1
8张慧玲.浮点数到整型数转换的正确性问题[J].计算机应用与软件,2011,28(1):161-162. 被引量：3
9杜叔强,施武祖.浮点数用法分析[J].兰州工业高等专科学校学报,2012,19(3):51-53. 被引量：4
10陈天超,冯百明.单精度浮点数累加和误差研究[J].计算机应用,2013,33(6):1531-1533. 被引量：5

共引文献5

1毛文伟.关于语料库研究的若干理论思考[J].日语学习与研究,2008(3):27-31. 被引量：2
2董颖,刘日升,那春光.我国英语语料库计量研究综述[J].图书馆学刊,2011,33(1):126-129.
3肖红德.浮点类型有效位数计算与应用分析[J].软件导刊,2019,18(4):50-56. 被引量：3
4谭振江,刘佳琳,张耀允.大数运算的算法描述[J].吉林师范大学学报（自然科学版）,2019,40(3):102-108. 被引量：2
5李柳娜,张娜.语音语料库在语音教学中的作用研究[J].当代教育实践与教学研究（电子版）,2017,0(7X):51-52.

引证文献1

1陈素艳,魏屹东.系统视角下的多主体知识与行为的逻辑分析[J].系统科学学报,2023,31(1):13-18.

1贾思静,章甜,龙奉玺,唐东昕.《金匮要略》有关津液代谢证治在现代肿瘤中的运用[J].亚太传统医药,2021,17(4):174-176. 被引量：2
2郭晓斌.核心素养视域下中职物理实验改革探究[J].试题与研究,2021(3):166-167.
3樊子琪.“民族志”介入式书写--以彼得·海斯勒作品为例[J].名作欣赏（学术版）（下旬）,2021(8):173-174.
4孙云霞,任锡良,徐峥.标本放置时间对单采献血者血常规4项参数结果影响分析[J].中国血液流变学杂志,2021,31(1):116-117. 被引量：2
5张飞.口肌训练结合语言认知训练在语言发育迟缓患儿康复中的应用[J].医疗装备,2021,34(14):148-149. 被引量：5
6刘宏.四川山地乌骨鸡人工采精与授精操作[J].畜牧业环境,2021(13):51-51.
7龚新颍,黄晓波.所得税率及其变化对企业资本结构的影响[J].山东商业职业技术学院学报,2021,21(3):1-7.
8刘路.初中英语实施情境教学法的策略[J].试题与研究,2020(16):4-5.
9梁垚,唐学用.基于时序卷积网络与线性残差连接的光伏发电功率预测[J].应用数学进展,2021,10(7):2257-2267.
10衣娜娜,苏立娟,郑旭程,张敏,弓泓.内蒙古西部地区降水云宏观特征[J].干旱气象,2021,39(3):406-414. 被引量：5

系统科学学报

2021年第3期

浏览历史

内容加载中请稍等...

自然语言处理算法的范式转换:统计真理与人类偏好被引量：1

参考文献3

二级参考文献10

共引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

自然语言处理算法的范式转换:统计真理与人类偏好 被引量：1

参考文献3

二级参考文献10

共引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

自然语言处理算法的范式转换:统计真理与人类偏好被引量：1