一种东巴字文档分割方法、装置、设备及存储介质
杨玉婷; 康厚良
2023-08-08
原始专利权人苏州市职业大学(苏州开放大学)
授权国家中国
摘要本申请公开了一种东巴字文档分割方法、装置、设备及存储介质,涉及文档识别技术领域,包括:利用预设投影算法对东巴字文档图像进行分割,得到分割后文档图像;在分割后文档图像中确定出若干个文字块和若干个空白间隔块,并确定为簇类样本;根据预设距离公式计算簇类样本之间的簇间距,并基于预设层次聚类条件对簇类样本进行合并,得到若干个合并后簇类;根据预设比例以及合并后簇类中簇类样本的数量将合并后簇类划分为目标簇和非目标簇;基于目标簇对应的特征值对分割后文档图像进行处理,以得到最终分割结果。这样一来,本申请可通过包含东巴文档格式特征的簇聚类结果对东巴文档图像处理,可以实现东巴文档的自适应分割,提升了分割效果。
申请日期2023-05-15
语种中文
专利状态实质审查
申请号CN202310540883.4
公开(公告)号CN116563855A
IPC 分类号G06V30/148 ; G06V30/18 ; G06V30/19 ; G06V30/41 ; G06V30/226
专利代理人万双艳
代理机构北京集佳知识产权代理有限公司
CPC分类号G06V30/153 ; G06V30/18 ; G06V30/19173 ; G06V30/19107 ; G06V30/41 ; G06V30/226 ; Y02D10/00
专利类型发明申请
文献类型专利
条目标识符http://ir.library.ouchn.edu.cn/handle/39V7QQFX/162368
专题国家开放大学江苏分部
作者单位苏州市职业大学(苏州开放大学)
第一作者单位国家开放大学江苏分部
推荐引用方式
GB/T 7714
杨玉婷,康厚良. 一种东巴字文档分割方法、装置、设备及存储介质[P]. 2023-08-08.
条目包含的文件 下载所有文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
CN202310540883.4.PDF(4349KB)专利 开放获取CC BY-NC-SA浏览 下载
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[杨玉婷]的文章
[康厚良]的文章
百度学术
百度学术中相似的文章
[杨玉婷]的文章
[康厚良]的文章
必应学术
必应学术中相似的文章
[杨玉婷]的文章
[康厚良]的文章
相关权益政策
暂无数据
收藏/分享
相关推荐
试论魏书生语文教育思想及其现实意义
东巴象形文字特征曲线提取算法研究
基于离散曲线演化的东巴象形文字特征曲线简化算法
东巴象形文字特征曲线简化算法研究
一种东巴象形文字图像文档识别方法、装置、设备及介质
一种东巴结构型单素字识别方法、装置、设备及存储介质
一种东巴轮廓型单素字识别方法、装置、设备及存储介质
计算机科学与技术专业实践教学体系的现状及发展探索
文件名: CN202310540883.4.PDF
格式: Adobe PDF
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。