中教数据库 > 河南科技大学学报(自然科学版) > 文章详情

分块主成分分析在文本特征抽取中的应用

更新时间:2015-11-10

【摘要】为了降低原始文本特征空间的维数,获得较高的分类精度与执行效率,对多种文本特征提取方法进行了研究,如卡方、互信息、信息增益、主成分分析(PCA)等。针对传统文本特征抽取方法存在的精度不高、执行效率低等问题,提出了一种基于分块主成分分析的文本特征提取算法。该算法通过K均值词聚类进行特征词分块,再对各分块实施PCA操作抽取出更具代表性的特征项,最后使用支持向量机分类器对文本进行分类。实验结果表明:分块主成分分析的分类指标Fβ=1达到了88.7%,执行时间为353s,能够有效提高文本分类精度与执行效率。

【关键词】

385 2页 免费

发表评论

登录后发表评论 (已发布 0条)

点亮你的头像 秀出你的观点

0/500
以上留言仅代表用户个人观点,不代表中教立场
相关文献

推荐期刊

Copyright © 2013-2016 ZJHJ Corporation,All Rights Reserved

京ICP备2021021570号-13

京公网安备 11011102000866号