基于Hadoop平台的并行化数据分类算法研究
黄黎; 顾筠
2014-07-25
发表期刊制造业自动化
ISSN1009-0134
卷号36期号:14页码:5-9
摘要随着云数据规模的急剧增长,传统的基于统计学和机器学习方法的数据分类算法在处理海量、异构和复杂的Web数据时面临系统扩展性的瓶颈。在云计算平台Hadoop上,实现数据分类中特征提取、特征分析和特征分类的MapReduce化处理。通过知识推理并行化特征构造,建立概念层次结构的特征度量,与分类算法的并行化处理进行融合,在真实数据集上进行验证,与传统算法组合在精度和时间开销上进行比较,实验表明该分类算法能获得更好的准确性和加速比,是一种有效的海量数据分类方法。
关键词云计算 数据分类 Hadoop 并行计算 MapReduce
URL查看原文
收录类别北大核心
语种中文
资助项目江苏省高校自然科学基金资助项目(13KJB510005);江苏开放大学、江苏城市职业学院“十二五”2013年度规划青年专项课题(13SEW-Q-055);江苏开放大学、江苏城市职业学院“十二五”2012年度规划重点课题(12SEW-Z-005)
原始文献类型学术期刊
文献类型期刊论文
条目标识符http://ir.library.ouchn.edu.cn/handle/39V7QQFX/142173
专题国家开放大学江苏分部
作者单位江苏开放大学信息工程系
第一作者单位国家开放大学江苏分部
第一作者的第一单位国家开放大学江苏分部
推荐引用方式
GB/T 7714
黄黎,顾筠. 基于Hadoop平台的并行化数据分类算法研究[J]. 制造业自动化,2014,36(14):5-9.
APA 黄黎,&顾筠.(2014).基于Hadoop平台的并行化数据分类算法研究.制造业自动化,36(14),5-9.
MLA 黄黎,et al."基于Hadoop平台的并行化数据分类算法研究".制造业自动化 36.14(2014):5-9.
条目包含的文件
条目无相关文件。
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[黄黎]的文章
[顾筠]的文章
百度学术
百度学术中相似的文章
[黄黎]的文章
[顾筠]的文章
必应学术
必应学术中相似的文章
[黄黎]的文章
[顾筠]的文章
相关权益政策
暂无数据
收藏/分享
相关推荐
基于实例学习和协同子集搜索的特征选择方法
一种基于时序行为的流过程协同重构算法
支持复杂社会网络演化的过程挖掘技术综述
基于世界知识的深网数据源增强分类模型
基于信息熵的网络课程学生分类模型研究
高职软件工程课堂有效教学初探
国际教学变革创新的演进脉络及内涵研究——基于英国开放大学《创新教学报告》的解读与启示
基于云安全架构的Android恶意软件静态检测方案
一种在数字图像相关法中应变场子区动态选择方法
一种在线教育投影仪防护机构
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。