基于词共现模型的垃圾邮件过滤方法研究
张燕平1; 史科1,2; 徐庆鹏1; 谢飞3
2009-11-15
发表期刊中文信息学报
ISSN1003-0077
摘要垃圾邮件过滤就是对邮件做出是垃圾或非垃圾的判断。传统的表示邮件的方法是在向量空间模型基础上通过信息增益等特征选择方法提取一部分词来表示邮件内容,存在语义信息不足的问题。该文提出一种将传统方法和词共现模型结合起来表示邮件特征的新方法,再采用交叉覆盖算法对邮件进行分类得到邮件分类器。实验表明,该文提出的邮件过滤算法与传统方法相比提高了过滤性能,词共现选择的维度要比传统方法选择的维度更具有代表性。
关键词计算机应用 中文信息处理 向量空间模型 垃圾邮件过滤 词共现模型 交叉覆盖算法
收录类别北大核心 ; CSCD
语种中文
资助项目国家重点基础研究973计划资助项目(2004CB318108,2007CB311003);国家自然科学基金资助项目(60675031);教育部社科研究基金青年资助项目(07JC870006)
原始文献类型学术期刊
文献类型期刊论文
条目标识符http://ir.library.ouchn.edu.cn/handle/39V7QQFX/94752
专题国家开放大学安徽分部
作者单位1.安徽大学计算智能与信号处理重点实验室;
2.安徽广播电视大学省直分校;
3.合肥工业大学
推荐引用方式
GB/T 7714
张燕平,史科,徐庆鹏,等. 基于词共现模型的垃圾邮件过滤方法研究[J]. 中文信息学报,2009.
APA 张燕平,史科,徐庆鹏,&谢飞.(2009).基于词共现模型的垃圾邮件过滤方法研究.中文信息学报.
MLA 张燕平,et al."基于词共现模型的垃圾邮件过滤方法研究".中文信息学报 (2009).
条目包含的文件
条目无相关文件。
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[张燕平]的文章
[史科]的文章
[徐庆鹏]的文章
百度学术
百度学术中相似的文章
[张燕平]的文章
[史科]的文章
[徐庆鹏]的文章
必应学术
必应学术中相似的文章
[张燕平]的文章
[史科]的文章
[徐庆鹏]的文章
相关权益政策
暂无数据
收藏/分享
相关推荐
多示例学习的示例权重算法
粗糙集中基于信息量的决策表属性约简算法
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。