一种东巴象形文字图像文档识别方法、装置、设备及介质
康厚良; 杨玉婷
2023-08-08
原始专利权人苏州市职业大学(苏州开放大学)
授权国家中国
摘要本申请公开了一种东巴象形文字图像文档识别方法、装置、设备及存储介质,涉及文档识别技术领域,包括:基于预设元素识别规则对东巴象形文字图像文档的当前图像文档页面进行识别得到文档元素集合;利用预设迭代投影算法对其中的正文文本进行投影并基于投影值进行分割得到文本段落;对其中满足预设字块距离条件的相邻字块进行合并得到第一处理后段落,并利用其中满足预设行高条件和预设投影值条件的像素行进行分割得到第二处理后段落;对第一处理后段落以及第二处理后段落进行合并以得到识别后文本行。这样一来,本申请首先对当前图像文档页面中的正文文本进行分割,并对得到的文本段落进行合并或二次分割,可以得到完整性好,独立性高的文本行。
申请日期2023-03-03
语种中文
专利状态实质审查
申请号CN202310195608.3
公开(公告)号CN116563865A
IPC 分类号G06V30/28 ; G06V30/148 ; G06V30/416 ; G06F16/532 ; G06F16/583
专利代理人薛娇
代理机构北京集佳知识产权代理有限公司
CPC分类号G06V30/293 ; G06V30/158 ; G06V30/416 ; G06F16/532 ; G06F16/5846 ; Y02D10/00
专利类型发明申请
文献类型专利
条目标识符http://ir.library.ouchn.edu.cn/handle/39V7QQFX/162493
专题国家开放大学江苏分部
作者单位苏州市职业大学(苏州开放大学)
第一作者单位国家开放大学江苏分部
推荐引用方式
GB/T 7714
康厚良,杨玉婷. 一种东巴象形文字图像文档识别方法、装置、设备及介质[P]. 2023-08-08.
条目包含的文件 下载所有文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
CN202310195608.3.PDF(5040KB)专利 开放获取CC BY-NC-SA浏览 下载
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[康厚良]的文章
[杨玉婷]的文章
百度学术
百度学术中相似的文章
[康厚良]的文章
[杨玉婷]的文章
必应学术
必应学术中相似的文章
[康厚良]的文章
[杨玉婷]的文章
相关权益政策
暂无数据
收藏/分享
相关推荐
东巴象形文字特征曲线提取算法研究
基于离散曲线演化的东巴象形文字特征曲线简化算法
东巴象形文字特征曲线简化算法研究
一种东巴字文档分割方法、装置、设备及存储介质
一种东巴结构型单素字识别方法、装置、设备及存储介质
一种东巴轮廓型单素字识别方法、装置、设备及存储介质
计算机科学与技术专业实践教学体系的现状及发展探索
文件名: CN202310195608.3.PDF
格式: Adobe PDF
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。