维汉人名翻译中不雅字或OOV的前处理研究 | |
其他题名 | Research on preprocessing methods of OOV or indecent words in Uyghur-Chinese name machine translation |
阿里木·赛买提1; 沙丽瓦尔·阿里木; 吐尔根·依不拉音1; 段雪明3; 古丽尼格尔·阿不都外力1; 麦合甫热提1; 吾守尔·斯拉木1 | |
2022-06-20 | |
发表期刊 | 东北师大学报(自然科学版)
![]() |
ISSN | 1000-1832 |
卷号 | 54期号:2页码:76-80 |
摘要 | 针对维汉人名数据集稀少且难以获取等问题,提出了从常规维汉句对数据中通过Fast align对齐方法结合NER方法抽取维汉人名数据的方法.针对维吾尔人名翻译后易出现集外词(OOV)问题或不雅字、不恰当译文表示的问题,通过对维汉人名数据中汉语部分训练1—4阶N-Gram语言模型,根据语言模型对该数据进行打分后筛选出best-2结果,并结合了维汉字符级端到端的神经网络人名翻译模型.通过实验可发现,结合本文提出的前处理方法后的维汉人名翻译模型效果是BLEU提升了0.95分,并且不雅字或不恰当表示问题也得到了明显的改善. |
关键词 | 机器翻译 OOV 维汉人名 Fast align 字符级端到端的神经网络 |
DOI | 10.16163/j.cnki.dslkxb202012028 |
URL | 查看原文 |
收录类别 | 中国科技核心期刊 ; 北大核心 |
语种 | 中文 |
资助项目 | 新疆维吾尔自治区重点实验室开放基金资助项目;国家语委科研项目;国家自然科学基金; |
原始文献类型 | Periodical |
文献类型 | 期刊论文 |
条目标识符 | http://ir.library.ouchn.edu.cn/handle/39V7QQFX/25867 |
专题 | 国家开放大学新疆分部 |
作者单位 | 1.新疆大学信息科学与工程学院多语种信息技术实验中心,新疆乌鲁木齐830046; 2.新疆开放大学,新疆乌鲁木齐830049; 3.新疆科大讯飞信息科技有限责任公司,新疆乌鲁木齐830015 |
推荐引用方式 GB/T 7714 | 阿里木·赛买提,沙丽瓦尔·阿里木,吐尔根·依不拉音,等. 维汉人名翻译中不雅字或OOV的前处理研究[J]. 东北师大学报(自然科学版),2022,54(2):76-80. |
APA | 阿里木·赛买提.,沙丽瓦尔·阿里木.,吐尔根·依不拉音.,段雪明.,古丽尼格尔·阿不都外力.,...&吾守尔·斯拉木.(2022).维汉人名翻译中不雅字或OOV的前处理研究.东北师大学报(自然科学版),54(2),76-80. |
MLA | 阿里木·赛买提,et al."维汉人名翻译中不雅字或OOV的前处理研究".东北师大学报(自然科学版) 54.2(2022):76-80. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
查看访问统计 |
谷歌学术 |
谷歌学术中相似的文章 |
[阿里木·赛买提]的文章 |
[沙丽瓦尔·阿里木]的文章 |
[吐尔根·依不拉音]的文章 |
百度学术 |
百度学术中相似的文章 |
[阿里木·赛买提]的文章 |
[沙丽瓦尔·阿里木]的文章 |
[吐尔根·依不拉音]的文章 |
必应学术 |
必应学术中相似的文章 |
[阿里木·赛买提]的文章 |
[沙丽瓦尔·阿里木]的文章 |
[吐尔根·依不拉音]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
相关推荐 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论