| 一种东巴象形文字图像文档识别方法、装置、设备及介质 |
| 康厚良; 杨玉婷
|
| 2023-08-08
|
原始专利权人 | 苏州市职业大学(苏州开放大学)
|
授权国家 | 中国
|
摘要 | 本申请公开了一种东巴象形文字图像文档识别方法、装置、设备及存储介质,涉及文档识别技术领域,包括:基于预设元素识别规则对东巴象形文字图像文档的当前图像文档页面进行识别得到文档元素集合;利用预设迭代投影算法对其中的正文文本进行投影并基于投影值进行分割得到文本段落;对其中满足预设字块距离条件的相邻字块进行合并得到第一处理后段落,并利用其中满足预设行高条件和预设投影值条件的像素行进行分割得到第二处理后段落;对第一处理后段落以及第二处理后段落进行合并以得到识别后文本行。这样一来,本申请首先对当前图像文档页面中的正文文本进行分割,并对得到的文本段落进行合并或二次分割,可以得到完整性好,独立性高的文本行。 |
申请日期 | 2023-03-03
|
语种 | 中文
|
专利状态 | 实质审查
|
申请号 | CN202310195608.3
|
公开(公告)号 | CN116563865A
|
IPC 分类号 | G06V30/28
; G06V30/148
; G06V30/416
; G06F16/532
; G06F16/583
|
专利代理人 | 薛娇
|
代理机构 | 北京集佳知识产权代理有限公司
|
CPC分类号 | G06V30/293
; G06V30/158
; G06V30/416
; G06F16/532
; G06F16/5846
; Y02D10/00
|
专利类型 | 发明申请
|
文献类型 | 专利
|
条目标识符 | http://ir.library.ouchn.edu.cn/handle/39V7QQFX/162493
|
专题 | 国家开放大学江苏分部
|
作者单位 | 苏州市职业大学(苏州开放大学)
|
第一作者单位 | 国家开放大学江苏分部
|
推荐引用方式 GB/T 7714 |
康厚良,杨玉婷. 一种东巴象形文字图像文档识别方法、装置、设备及介质[P]. 2023-08-08.
|
文件名:
|
CN202310195608.3.PDF
|
格式:
|
Adobe PDF
|
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论