基于改进K-均值的微博热点话题发现方法 | |
陈阳键1; 温秋华2 | |
2023-03-28 | |
发表期刊 | 太赫兹科学与电子信息学报
![]() |
ISSN | 2095-4980 |
卷号 | 21期号:03页码:378-383+391 |
摘要 | 微博文本数据高维度、同义、多义特征明显,传统基于向量空间模型(VSM)联合K-均值的热点话题发现方法存在准确率低,计算复杂,聚类中心难以确定等问题。提出一种相关向量机(RVM)优化VSM的微博文本向量化方法,首先利用RVM的自适应特征选择能力对VSM特征向量进行降维,然后利用主成分分析(PCA)方法确定K-均值算法的初始聚类中心,进而采用K-均值算法得到聚类结果,最后根据微博转发、评论和高影响力用户数量定义热度指数,热度指数最大的话题即为当前热点话题。采用实际微博文本数据集开展实验,结果表明所提方法相对于2种传统方法的准确率分别提升7.3%和1.1%,实时性分别提升45%和53%。 |
关键词 | 热点话题发现 向量空间模型 话题聚类 数据降维 微博 |
URL | 查看原文 |
语种 | 中文 |
资助项目 | 广东省广州市高校第九批教育教学改革基金资助项目(2017F10) |
原始文献类型 | 学术期刊 |
文献类型 | 期刊论文 |
条目标识符 | http://ir.library.ouchn.edu.cn/handle/39V7QQFX/49121 |
专题 | 国家开放大学广州分部 |
作者单位 | 1.广州开放大学(广州市广播电视大学)数字化服务中心; 2.暨南大学信息科学技术学院 |
第一作者单位 | 国家开放大学广州分部 |
第一作者的第一单位 | 国家开放大学广州分部 |
推荐引用方式 GB/T 7714 | 陈阳键,温秋华. 基于改进K-均值的微博热点话题发现方法[J]. 太赫兹科学与电子信息学报,2023,21(03):378-383+391. |
APA | 陈阳键,&温秋华.(2023).基于改进K-均值的微博热点话题发现方法.太赫兹科学与电子信息学报,21(03),378-383+391. |
MLA | 陈阳键,et al."基于改进K-均值的微博热点话题发现方法".太赫兹科学与电子信息学报 21.03(2023):378-383+391. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
查看访问统计 |
谷歌学术 |
谷歌学术中相似的文章 |
[陈阳键]的文章 |
[温秋华]的文章 |
百度学术 |
百度学术中相似的文章 |
[陈阳键]的文章 |
[温秋华]的文章 |
必应学术 |
必应学术中相似的文章 |
[陈阳键]的文章 |
[温秋华]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
相关推荐 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论