| 一种东巴字文档分割方法、装置、设备及存储介质 |
| 杨玉婷; 康厚良
|
| 2023-08-08
|
原始专利权人 | 苏州市职业大学(苏州开放大学)
|
授权国家 | 中国
|
摘要 | 本申请公开了一种东巴字文档分割方法、装置、设备及存储介质,涉及文档识别技术领域,包括:利用预设投影算法对东巴字文档图像进行分割,得到分割后文档图像;在分割后文档图像中确定出若干个文字块和若干个空白间隔块,并确定为簇类样本;根据预设距离公式计算簇类样本之间的簇间距,并基于预设层次聚类条件对簇类样本进行合并,得到若干个合并后簇类;根据预设比例以及合并后簇类中簇类样本的数量将合并后簇类划分为目标簇和非目标簇;基于目标簇对应的特征值对分割后文档图像进行处理,以得到最终分割结果。这样一来,本申请可通过包含东巴文档格式特征的簇聚类结果对东巴文档图像处理,可以实现东巴文档的自适应分割,提升了分割效果。 |
申请日期 | 2023-05-15
|
语种 | 中文
|
专利状态 | 实质审查
|
申请号 | CN202310540883.4
|
公开(公告)号 | CN116563855A
|
IPC 分类号 | G06V30/148
; G06V30/18
; G06V30/19
; G06V30/41
; G06V30/226
|
专利代理人 | 万双艳
|
代理机构 | 北京集佳知识产权代理有限公司
|
CPC分类号 | G06V30/153
; G06V30/18
; G06V30/19173
; G06V30/19107
; G06V30/41
; G06V30/226
; Y02D10/00
|
专利类型 | 发明申请
|
文献类型 | 专利
|
条目标识符 | http://ir.library.ouchn.edu.cn/handle/39V7QQFX/162368
|
专题 | 国家开放大学江苏分部
|
作者单位 | 苏州市职业大学(苏州开放大学)
|
第一作者单位 | 国家开放大学江苏分部
|
推荐引用方式 GB/T 7714 |
杨玉婷,康厚良. 一种东巴字文档分割方法、装置、设备及存储介质[P]. 2023-08-08.
|
文件名:
|
CN202310540883.4.PDF
|
格式:
|
Adobe PDF
|
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论