| 基于Hadoop平台的并行化数据分类算法研究 |
| 黄黎; 顾筠
|
| 2014-07-25
|
发表期刊 | 制造业自动化
 |
ISSN | 1009-0134
|
卷号 | 36期号:14页码:5-9 |
摘要 | 随着云数据规模的急剧增长,传统的基于统计学和机器学习方法的数据分类算法在处理海量、异构和复杂的Web数据时面临系统扩展性的瓶颈。在云计算平台Hadoop上,实现数据分类中特征提取、特征分析和特征分类的MapReduce化处理。通过知识推理并行化特征构造,建立概念层次结构的特征度量,与分类算法的并行化处理进行融合,在真实数据集上进行验证,与传统算法组合在精度和时间开销上进行比较,实验表明该分类算法能获得更好的准确性和加速比,是一种有效的海量数据分类方法。 |
关键词 | 云计算
数据分类
Hadoop
并行计算
MapReduce
|
URL | 查看原文
|
收录类别 | 北大核心
|
语种 | 中文
|
资助项目 | 江苏省高校自然科学基金资助项目(13KJB510005);江苏开放大学、江苏城市职业学院“十二五”2013年度规划青年专项课题(13SEW-Q-055);江苏开放大学、江苏城市职业学院“十二五”2012年度规划重点课题(12SEW-Z-005)
|
原始文献类型 | 学术期刊
|
文献类型 | 期刊论文
|
条目标识符 | http://ir.library.ouchn.edu.cn/handle/39V7QQFX/142173
|
专题 | 国家开放大学江苏分部
|
作者单位 | 江苏开放大学信息工程系
|
第一作者单位 | 国家开放大学江苏分部
|
第一作者的第一单位 | 国家开放大学江苏分部
|
推荐引用方式 GB/T 7714 |
黄黎,顾筠. 基于Hadoop平台的并行化数据分类算法研究[J].
制造业自动化,2014,36(14):5-9.
|
APA |
黄黎,&顾筠.(2014).基于Hadoop平台的并行化数据分类算法研究.制造业自动化,36(14),5-9.
|
MLA |
黄黎,et al."基于Hadoop平台的并行化数据分类算法研究".制造业自动化 36.14(2014):5-9.
|
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论