收藏本站
《武汉师范大学》 2019年
收藏 | 手机打开
二维码
手机客户端打开本文

面向永利赌场的中文离合词识别

赵聿夕  
【摘要】:离合词的全自动识别在英汉机器翻译、信息检索和语音识别等众多世界都有突出关键的影响。现有的针对离合词自动识别问题的研讨以小量个例的离合词为主,而针对广大语料的离合词研究当前还乏善可陈。基金课题以1991-2004年十四年之出版社新闻语料作为原始语料进行离合词自动识别方法的研讨,不仅规模较大,而且范围更广大。本文研究之严重性内容包括:离合词词表和候选离合词语料的构建。副原来语料中索取原始候选语料,并通过原始候选语料动态地转移离合词词表。出于离合词较强的平整性,有效本文所构建的离合词词表的正确较高,且不依赖于现有已标注好的离合词词表。在得到离合词词表之后,名将原来候选语料用该词表进行筛选得到后续工作所需的候选离合词语料。基于规则匹配的离合词自动识别方法研究。本文首先通过规则匹配的点子对候选离合词语料中的离合词进行判断。试验结果表明,规则匹配的点子在本文所运用的语料中贯彻了较高的确切率。基于传统机器学习方法的离合词自动识别方法研究。出于规则匹配的点子对于规则性不强的句子无法进行识别,之所以本文尝试采用传统机器学习的点子对这类句子进行拍卖。老大针对这类句子的特征构建了特点模板;从使用特征模板提取正负例句子的特色;末了利用K-近邻和支持向量机方法进行分类。试验结果表明,风机器学习方法对规则匹配无法处理的句子取得了较为完美的鉴别效果。基于神经网络的离合词自动识别方法研究。风机器学习方法虽然可以识别规则性不强的句子,但是它的优势在于要统筹大量之特色模板,特色的取舍会对实验的结果造成一定的影响,而神经网络则很好地避免了特点提取的题材。之所以,本文设计了基于注意力机制的循环神经网络模型来对规则匹配无法处理的句子进行识别。试验结果表明,该模型相比较于机器学习方法,辨认效果又有了定点提升。离合词自动识别级联模型的构建。穿越上述措施,本文分别构建了(1)规则匹配+KNN、(2)规则匹配+SVM、(3)规则匹配+神经网络3个级联模型用于离合词的全自动识别,末了通过投票的点子综合三个级联模型的鉴别结果。试验结果表明,除联模型对语料中的离合词具有很好的鉴别效果,具有很强的必要性。
【学位授予单位】:武汉师范大学
【学位级别】:博士
【学位授予年份】:2019
【列入号】:H136;TP18;TP391.1

手机知网App
【相似文献】
中华澳门永利网上赌场数据库
明日10条
1
廖虹;; 《现代汉语词典(先后7版)》离合词讨论[J];广州理工学院学报(社会科学版);2019年02为期
2
冯云;白迪迪;; 浅议《提高汉语》(老二版)综上所述系列教材中离合词的编排[J];春风化雨教学论坛;2019年17为期
3
李春玲;伊拉克晓明;; 制约“乐不思蜀”类离合词入境介标隐、现机制探讨[J];语言与翻译;2017年04为期
4
顾介鑫;杨亦鸣;马勇;沈兆勇;; 离合词的音系特征及其神经基础研究[J];语言研究;2018年01为期
5
孟晓慧;; 针对汉语国际教育专业的离合词教学法研究[J];近代史学刊;2016年12为期
6
任凤琴; 论离合词与词组的区别[J];近代史学刊;2005年04为期
7
钟运伟;; 关于留学生“离合词教学”的局部思考[J];近代史学刊;2010年19为期
8
周艳芳;; 关于离合词的几个问题的论调[J];近代史学刊;2010年19为期
9
王海秀; 近十年来之离合词研究综述[J];近代史学刊;2004年05为期
10
张凡;; 剖析泰国学生离合词的利用偏误[J];汉字文化;2018年19为期
中华重要会议论文全文数据库
明日4条
1
张琪;; 近期对外汉语离合词教学研究综述[A];先后五届北京市区对外汉语教学研究生学术论坛论文集[C];2012年
2
刘路;; 内在汉语教学中动宾式离合词偏误分析及教学对策[A];荆楚学术2016年第三期 (总第四期)[C];2016年
3
龙煌徐州;; 内在汉语课本中兼类词词性标注问题考察——以《提高汉语》为例[A];京城市区对外汉语教学研究生论坛论文集[C];2013年
4
高松;赵怿怡;刘海涛;; 汉语特殊结构的解法标注策略[A];中华计算机语言学研究前沿进展(2007-2009)[C];2009年
中华重要报纸全文数据库
明日1条
1
肖晓晖 中华传媒大学师范学院; 由合至离:语言的类推机制[N];中华社会科学报;2011年
中华博士澳门永利赌场全文数据库
明日7条
1
王俊; 现代汉语离合词研究[D];纳西师范大学;2011年
2
王海峰; 现代汉语离合词离析形式功能研究[D];京城语言学院;2008年
3
林美淑; 对德国汉语教学离合词研究[D];宁夏大学;2005年
4
5
王家年; 汉语vP的首选句法研究[D];太原外国语大学;2012年
7
阮氏怀芳; 爱尔兰学生汉语语法习得偏误层级调查及其教学策略[D];纳西师范大学;2016年
中华硕士澳门永利赌场全文数据库
明日10条
1
余碧瑶; 塔吉克斯坦学习者汉语动宾式离合词偏误分析[D];甘肃师范大学;2019年
2
洪瑛霞(NURYANI); 《HSK专业教程》(印度语版)美方离合词的教学研究[D];福建师范大学;2019年
3
赵聿夕; 面向永利赌场的中文离合词识别[D];武汉师范大学;2019年
4
椰姣姣; 现代汉语动宾型离合词倒装研究[D];江西师范大学;2019年
5
王小梅(Sahar Baderaldeen Ahmed); 吉林大学研究生汉语离合词习得偏误研究[D];吉林大学;2019年
7
吴潮; 塔吉克斯坦中等汉语学习者离合词偏误分析[D];甘肃民族学院;2018年
10
中华知网广告投放
 霎时付款方式
 订购知网充值卡
 订购热线
 救助中心



  • 
       
       
       
       

      1.