基于类别的CHI特征选择方法
梁伍七; 李斌; 许磊
2015-09-20
发表期刊安徽广播电视大学学报
ISSN1008-6021
卷号No.170期号:03页码:124-128
摘要文本分类问题中,卡方特征选择是一种效果较好的特征选择方法。计算单词的卡方值时,先计算单词针对每个类别的卡方值,再通过类别概率将卡方值调和平均,作为单词相对于整个训练集合的卡方值,这种全局方法忽视了单词和类别间的相关性。针对这一问题,提出基于类别的卡方特征选择方法。基于类别的方法针对每个类别遴选特征词,特征词数量根据事先设定的阈值、类别的文档数和整个训练集合文档数计算得到,不同类别的特征空间可能包含相同的特征词。采用KNN分类方法,将基于类别的方法与全局方法进行比较,实验结果表明,基于类别的方法能够提高分类器的总体性能。
关键词文本分类 卡方 特征选择 特征词 KNN分类
DOI10.19371/j.cnki.issn1008-6021.2015.03.028
URL查看原文
语种中文
原始文献类型学术期刊
文献类型期刊论文
条目标识符http://ir.library.ouchn.edu.cn/handle/39V7QQFX/65800
专题国家开放大学安徽分部
作者单位安徽广播电视大学信息与工程学院
第一作者单位国家开放大学安徽分部
第一作者的第一单位国家开放大学安徽分部
推荐引用方式
GB/T 7714
梁伍七,李斌,许磊. 基于类别的CHI特征选择方法[J]. 安徽广播电视大学学报,2015,No.170(03):124-128.
APA 梁伍七,李斌,&许磊.(2015).基于类别的CHI特征选择方法.安徽广播电视大学学报,No.170(03),124-128.
MLA 梁伍七,et al."基于类别的CHI特征选择方法".安徽广播电视大学学报 No.170.03(2015):124-128.
条目包含的文件
条目无相关文件。
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[梁伍七]的文章
[李斌]的文章
[许磊]的文章
百度学术
百度学术中相似的文章
[梁伍七]的文章
[李斌]的文章
[许磊]的文章
必应学术
必应学术中相似的文章
[梁伍七]的文章
[李斌]的文章
[许磊]的文章
相关权益政策
暂无数据
收藏/分享
相关推荐
基于JDBC的Web应用程序数据库连接技术研究
基于翻转课堂的完全线上教学模式探索与实践——以Linux网络操作系统课程为例
基于JWT的分布式系统认证授权机制设计和实现
基于SOAP消息的WEB服务模型及其应用研究
数据挖掘中的模糊聚类分析及其应用
基于XML文档的数据绑定技术浅析
基于Web服务的分布式应用集成模型及其实现
番茄果实硬度与相关性状间的相关及通径分析
网上教学支持服务的研究实践及效果评价
基于对数似然比的中文文本分类特征选择研究
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。