维汉人名翻译中不雅字或OOV的前处理研究
其他题名Research on preprocessing methods of OOV or indecent words in Uyghur-Chinese name machine translation
阿里木·赛买提1; 沙丽瓦尔·阿里木; 吐尔根·依不拉音1; 段雪明3; 古丽尼格尔·阿不都外力1; 麦合甫热提1; 吾守尔·斯拉木1
2022-06-20
发表期刊东北师大学报(自然科学版)
ISSN1000-1832
卷号54期号:2页码:76-80
摘要针对维汉人名数据集稀少且难以获取等问题,提出了从常规维汉句对数据中通过Fast align对齐方法结合NER方法抽取维汉人名数据的方法.针对维吾尔人名翻译后易出现集外词(OOV)问题或不雅字、不恰当译文表示的问题,通过对维汉人名数据中汉语部分训练1—4阶N-Gram语言模型,根据语言模型对该数据进行打分后筛选出best-2结果,并结合了维汉字符级端到端的神经网络人名翻译模型.通过实验可发现,结合本文提出的前处理方法后的维汉人名翻译模型效果是BLEU提升了0.95分,并且不雅字或不恰当表示问题也得到了明显的改善.
关键词机器翻译 OOV 维汉人名 Fast align 字符级端到端的神经网络
DOI10.16163/j.cnki.dslkxb202012028
URL查看原文
收录类别中国科技核心期刊 ; 北大核心
语种中文
资助项目新疆维吾尔自治区重点实验室开放基金资助项目;国家语委科研项目;国家自然科学基金;
原始文献类型Periodical
文献类型期刊论文
条目标识符http://ir.library.ouchn.edu.cn/handle/39V7QQFX/25867
专题国家开放大学新疆分部
作者单位1.新疆大学信息科学与工程学院多语种信息技术实验中心,新疆乌鲁木齐830046;
2.新疆开放大学,新疆乌鲁木齐830049;
3.新疆科大讯飞信息科技有限责任公司,新疆乌鲁木齐830015
推荐引用方式
GB/T 7714
阿里木·赛买提,沙丽瓦尔·阿里木,吐尔根·依不拉音,等. 维汉人名翻译中不雅字或OOV的前处理研究[J]. 东北师大学报(自然科学版),2022,54(2):76-80.
APA 阿里木·赛买提.,沙丽瓦尔·阿里木.,吐尔根·依不拉音.,段雪明.,古丽尼格尔·阿不都外力.,...&吾守尔·斯拉木.(2022).维汉人名翻译中不雅字或OOV的前处理研究.东北师大学报(自然科学版),54(2),76-80.
MLA 阿里木·赛买提,et al."维汉人名翻译中不雅字或OOV的前处理研究".东北师大学报(自然科学版) 54.2(2022):76-80.
条目包含的文件
条目无相关文件。
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[阿里木·赛买提]的文章
[沙丽瓦尔·阿里木]的文章
[吐尔根·依不拉音]的文章
百度学术
百度学术中相似的文章
[阿里木·赛买提]的文章
[沙丽瓦尔·阿里木]的文章
[吐尔根·依不拉音]的文章
必应学术
必应学术中相似的文章
[阿里木·赛买提]的文章
[沙丽瓦尔·阿里木]的文章
[吐尔根·依不拉音]的文章
相关权益政策
暂无数据
收藏/分享
相关推荐
针对音变问题改进的维汉神经网络机器翻译鲁棒性方法研究
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。