当前位置:
首页> 改进朴素贝叶斯算法在文本分类中的应用
改进朴素贝叶斯算法在文本分类中的应用
时间:2023-03-26 04:11:02 下载该word文档
创新前沿TechnologyInnovationandApplication科技创新与应用2019年5期改进朴素贝叶斯算法在文本分类中的应用黄勇1,罗文辉1,张瑞舒2(1.武汉理工大学自动化学院,湖北武汉430063;2.武汉理工大学能动学院,湖北武汉430063)摘要:朴素贝叶斯算法是一种基于概率统计的分类算法,广泛应用于机器学习中分类问题的求解中。文本分类是自然语言处理和数据挖掘领域中的研究热点有着广泛的应用前景。朴素贝叶斯算法已经在文本分类中取得了较好的分类效果,但是由于文本词向量的特征向量维度高,很多分类算法的求解效率和准确率都不高。文章提出一种基于词向量间余弦相似度的改进朴素贝叶斯算法,有效的降低了特征向量的数据冗余和计算复杂性。特征向量;余弦相似度关键词:文本分类;朴素贝叶斯算法;中图分类号院TP391文献标志码院A文章编号院2095-2945渊2019冤05-0024-02datamining袁whichhasawiderangeofapplications.NaiveBayesalgorithmhasachievedgoodresultsintextclassification袁buttheefficiencyandaccuracyofmanyclassificationalgorithmsarenothighbecauseofthehighdimensionoftheEigenvectorofthetextKeywords:textclassification;NaiveBayesalgorithm;Eigenvector;cosinesimilarityclassificationproblemsin