| 基于叠加编码的Web网页抓取路径损耗估计 |
| 邢计亮
|
| 2015-06-30
|
发表期刊 | 科技通报
 |
ISSN | 1001-7119
|
卷号 | 31期号:06页码:181-183 |
摘要 | 对Web网页抓取是实现Web文本特征数据检索的最佳方式,Web网页抓取路径损耗误差的优化估计可以提高对Web数据的挖掘性能。传统方法中,对Web网页抓取采用基于线性滤波检测的单模匹配抓取方法,受弱信号幅度和临界阈值约束,路径损耗较大,且无法有效实现路径损耗误差有效估计。提出一种基于叠加编码特征统计的Web网页抓取路径损耗误差估计算法。构建Web网页文本特征抓取的目标函数,进行Web网络路径损耗模型构建,设计叠加编码算法进行特征统计,得到Web网页抓取路径概念格。仿真实验表明,该算法能有效提高Web网页抓取路径损耗误差估计精度,进而提高了Web网页文本数据抓取的查准率和文本特征数据的挖掘性能。 |
关键词 | Web网页
文本特征
抓取路径
数据挖掘
|
DOI | 10.13774/j.cnki.kjtb.2015.06.061
|
URL | 查看原文
|
收录类别 | 北大核心
|
语种 | 中文
|
原始文献类型 | 学术期刊
|
文献类型 | 期刊论文
|
条目标识符 | http://ir.library.ouchn.edu.cn/handle/39V7QQFX/67375
|
专题 | 国家开放大学河北分部
|
作者单位 | 邢台广播电视大学
|
第一作者单位 | 国家开放大学河北分部
|
第一作者的第一单位 | 国家开放大学河北分部
|
推荐引用方式 GB/T 7714 |
邢计亮. 基于叠加编码的Web网页抓取路径损耗估计[J].
科技通报,2015,31(06):181-183.
|
APA |
邢计亮.(2015).基于叠加编码的Web网页抓取路径损耗估计.科技通报,31(06),181-183.
|
MLA |
邢计亮."基于叠加编码的Web网页抓取路径损耗估计".科技通报 31.06(2015):181-183.
|
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论