基于改进K-均值的微博热点话题发现方法
陈阳键1; 温秋华2
2023-03-28
发表期刊太赫兹科学与电子信息学报
ISSN2095-4980
卷号21期号:03页码:378-383+391
摘要微博文本数据高维度、同义、多义特征明显,传统基于向量空间模型(VSM)联合K-均值的热点话题发现方法存在准确率低,计算复杂,聚类中心难以确定等问题。提出一种相关向量机(RVM)优化VSM的微博文本向量化方法,首先利用RVM的自适应特征选择能力对VSM特征向量进行降维,然后利用主成分分析(PCA)方法确定K-均值算法的初始聚类中心,进而采用K-均值算法得到聚类结果,最后根据微博转发、评论和高影响力用户数量定义热度指数,热度指数最大的话题即为当前热点话题。采用实际微博文本数据集开展实验,结果表明所提方法相对于2种传统方法的准确率分别提升7.3%和1.1%,实时性分别提升45%和53%。
关键词热点话题发现 向量空间模型 话题聚类 数据降维 微博
URL查看原文
语种中文
资助项目广东省广州市高校第九批教育教学改革基金资助项目(2017F10)
原始文献类型学术期刊
文献类型期刊论文
条目标识符http://ir.library.ouchn.edu.cn/handle/39V7QQFX/49121
专题国家开放大学广州分部
作者单位1.广州开放大学(广州市广播电视大学)数字化服务中心;
2.暨南大学信息科学技术学院
第一作者单位国家开放大学广州分部
第一作者的第一单位国家开放大学广州分部
推荐引用方式
GB/T 7714
陈阳键,温秋华. 基于改进K-均值的微博热点话题发现方法[J]. 太赫兹科学与电子信息学报,2023,21(03):378-383+391.
APA 陈阳键,&温秋华.(2023).基于改进K-均值的微博热点话题发现方法.太赫兹科学与电子信息学报,21(03),378-383+391.
MLA 陈阳键,et al."基于改进K-均值的微博热点话题发现方法".太赫兹科学与电子信息学报 21.03(2023):378-383+391.
条目包含的文件
条目无相关文件。
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[陈阳键]的文章
[温秋华]的文章
百度学术
百度学术中相似的文章
[陈阳键]的文章
[温秋华]的文章
必应学术
必应学术中相似的文章
[陈阳键]的文章
[温秋华]的文章
相关权益政策
暂无数据
收藏/分享
相关推荐
2013地平线报告高等教育版(上)
2013地平线报告高等教育版(下)
新媒体联盟2015地平线报告高等教育版
新媒体联盟2016地平线报告高等教育版
探讨云计算下音视频制作教学平台的运用
数字广播系统在学校的建设
电大课程的RPG游戏型课件的设计与思考
在中心城市广播电视大学中开展M-Learning的可行性研究
专题学习网站中思维导图式导学系统的设计
2014地平线报告高等教育版
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。