基于叠加编码的Web网页抓取路径损耗估计
邢计亮
2015-06-30
发表期刊科技通报
ISSN1001-7119
卷号31期号:06页码:181-183
摘要对Web网页抓取是实现Web文本特征数据检索的最佳方式,Web网页抓取路径损耗误差的优化估计可以提高对Web数据的挖掘性能。传统方法中,对Web网页抓取采用基于线性滤波检测的单模匹配抓取方法,受弱信号幅度和临界阈值约束,路径损耗较大,且无法有效实现路径损耗误差有效估计。提出一种基于叠加编码特征统计的Web网页抓取路径损耗误差估计算法。构建Web网页文本特征抓取的目标函数,进行Web网络路径损耗模型构建,设计叠加编码算法进行特征统计,得到Web网页抓取路径概念格。仿真实验表明,该算法能有效提高Web网页抓取路径损耗误差估计精度,进而提高了Web网页文本数据抓取的查准率和文本特征数据的挖掘性能。
关键词Web网页 文本特征 抓取路径 数据挖掘
DOI10.13774/j.cnki.kjtb.2015.06.061
URL查看原文
收录类别北大核心
语种中文
原始文献类型学术期刊
文献类型期刊论文
条目标识符http://ir.library.ouchn.edu.cn/handle/39V7QQFX/67375
专题国家开放大学河北分部
作者单位邢台广播电视大学
第一作者单位国家开放大学河北分部
第一作者的第一单位国家开放大学河北分部
推荐引用方式
GB/T 7714
邢计亮. 基于叠加编码的Web网页抓取路径损耗估计[J]. 科技通报,2015,31(06):181-183.
APA 邢计亮.(2015).基于叠加编码的Web网页抓取路径损耗估计.科技通报,31(06),181-183.
MLA 邢计亮."基于叠加编码的Web网页抓取路径损耗估计".科技通报 31.06(2015):181-183.
条目包含的文件
条目无相关文件。
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[邢计亮]的文章
百度学术
百度学术中相似的文章
[邢计亮]的文章
必应学术
必应学术中相似的文章
[邢计亮]的文章
相关权益政策
暂无数据
收藏/分享
相关推荐
如何在建设新农村形势下发展我国农村职业教育
基于WEB环境下的自主式学习研究
新农村建设中农村成人教育面临的问题和对策
教学活动中如何用情感促进学生认知的发展
开放教育计算机专业形成性考核构成模式改革浅探
浅谈开放教育导学课的设计与实施
Web瑕疵文本去除和有效词频估算方法研究
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。