聪明文档网

聪明文档网

最新最全的文档下载
当前位置: 首页> 改进朴素贝叶斯算法在文本分类中的应用

改进朴素贝叶斯算法在文本分类中的应用

时间:2023-03-26 04:11:02    下载该word文档
创新前沿TechnologyInnovationandApplication科技创新与应用20195进朴素贝叶斯算法文本中的应用11瑞舒21.武汉理工自动院,武汉4300632.武汉理工院,武汉430063叶斯一种统计的分类广泛应用于机分类问题。文本分类然语言据挖掘领的研究广泛的应用叶斯经在文本分类较好的分类是由于文本特征量维分类率和准确。文章提一种余弦的改进叶斯特征冗余算复特征余弦关键词文本分类;叶斯中图分类号TP391文献标志码A文章编号2095-2945201905-0024-02dataminingwhichhasawiderangeofapplications.NaiveBayesalgorithmhasachievedgoodresultsintextclassificationbuttheefficiencyandaccuracyofmanyclassificationalgorithmsarenothighbecauseofthehighdimensionoftheEigenvectorofthetextKeywordstextclassification;NaiveBayesalgorithm;Eigenvector;cosinesimilarityclassificationproblemsinmachinelearning.TextclassificationisaresearchhotspotinthefieldofnaturallanguageprocessingandAbstractNaiveBayesalgorithmisaclassificationalgorithmbasedonprobabilityandstatisticswhichiswidelyusedtosolvewordvector.InthispaperanimprovedNaiveBayesalgorithmbasedoncosinesimilaritybetweenwordvectorsisproposedwhichcaneffectivelyreducethedataredundancyandcomputationalcomplexityofEigenvectors.1概述在文本分类中,采用的主要文本技术进行文本的文本过分类进行文本类别的机分类算法都取得较好类效文本复杂分类效取得提高算法是在传统算法分类特分量之间相使分类的工程[1]是文本中于上文的系,之间的,分类增加的计参数考虑之间性,[2]选择大大简化分类过程。量特之间性程之间数简化文本大小简化分类程,提高分类效2向量余弦相似度改进朴素贝叶斯算传统算法Pyi|x=Px|yiPyi/Px1x分类特y为分类类别为分类别为定各性是的,Px|yiPyi=Pa1yiPa2yiPamyiPyi=Pyix=a1a2a3……amx的构m在改进型中考虑的有性对分类影响因每个分量中设影响因子当相两项影响的计复杂性。基于量余的改进Px|yiPyi=Pa1yi12Pa2yiijPamyiPyi=ij[01]为特两项特ij1影响ij[01cosij=xixj|xi||xj|分类算法简化y=argmaxPyiijj=1Pajyimj=1Pajyim2Pyiijj=1Pajyim3453分类使用谷歌训练的开量模型,用开IMDB、文本对改进型进行分类IMDB包含50000严重下转271989-作者简介汉族,研究研究方向为机据挖掘-24-
20195TechnologyInnovationandApplication科技创新与应用众创空间具有智能性和先进性为文献保技术实项目教学的仪器是不满足文献保验项目整合与创新的,为此,面需要公共大数据充分整合的信息管理综合仪器为文献保验项目适应数字的实验项目供平台文献保传统验项目的专业仪器4.3,为文献保验项目实践性很强文献保技术本身就是一门跨领域、信息技课程领域涉及理、化学、术等,时对实践要求高。此,纯粹的实仪器是不满足文献保学的实教学需求加强为文献保教学支撑为一种优[8]。一档案文献保学的理论课及相关档案实践的实践校内教学实践验跨领域的教学队伍档案文献古籍信息技术公数据恢复相关实践文献保大文献保验环平台在实践中实上接24化的[3]数据用于训练25000和用于效果25000条评训练试集50%评价50%评价深度习框架TensorFlowKeras。实为文数据导入理、转换输出始化、代、Keras素贝叶斯[4]在此基础了改进法模传统朴素贝叶斯试集效果如下所示:1朴素贝叶斯算法IMDB测试据集上分类结果在实中生为文献保技术实验项目创新发展了内参考文献[1]张美芳.我国档案保护技术学可持续发展若干思考[J].档案学通讯2008168-71.通讯2016372-76.[2]赵淑梅.数字时代我国档案保护技术学学科发展走向[J].档案学[3]李泽锋.档案保护技术学教学内容体系的重构优化——78.[4]方凌超.翻转在档案保护技术实验教学中的应用研体档案、光盘档案保护谈起[J].档案学通讯2013175-140-43.[6]任越倪丽娟.档案学专业科教课程体系改革的设想——以黑龙江大学档案学专业科课程体系改革[J].档案学研2006238-41.张美芳.档案保护技术实验教程[M].北京[7]唐跃进,国人民大[J].档案学通讯2018476-80.[5]吴晓红.档案保护实验教学改革探索[J].实验技术与管理2013学出版社2013.[8]马丽华.高校产学研项目实践中的档案管理[J].案,20131157.2朴素贝叶斯算法IMDB测试据集上分类结果迭代次数准确率(%时间(s3005002000300050000.610.70.820.90.9879173139迭代次数准确率(%时间(s3005002000300050000.60.650.790.850.94811203548传统中存在的数据大、存在的问题示复率低问题量之改进朴素贝叶斯降低的数据计算通过改进效果参考文献好好.朴素贝叶斯算法进与应用[J].[1]孟令军测控技术,201602.邹显春.基于Word2Vector的一文档量表示[J].[2]朱磊算机科学,201643614-217.陆玉吕.贝叶斯[3]田凤占贝叶斯网络与数据采掘sisoffeaturepoolinginvisualrecognition.InProceedingsofthe[J].算机科学,2005271069-72.[4]Y.-L.BoureauJ.PonceandY.LeCun.Atheoreticalanaly27thInternationalConferenceonMachineLearningICML-10pages111-1182010.传统朴素贝叶斯和改进朴素贝叶斯法模在实中的改进朴素贝叶斯精度大大降低的计算4结束语传统朴素贝叶斯在文问题-27-
  • 29.8

    ¥45 每天只需1.0元
    1个月 推荐
  • 9.9

    ¥15
    1天
  • 59.8

    ¥90
    3个月

选择支付方式

  • 微信付款
郑重提醒:支付后,系统自动为您完成注册

请使用微信扫码支付(元)

订单号:
支付后,系统自动为您完成注册
遇到问题请联系 在线客服

常用手机号:
用于找回密码
图片验证码:
看不清?点击更换
短信验证码:
新密码:
 
绑定后可用手机号登录
请不要关闭本页面,支付完成后请点击【支付完成】按钮
遇到问题请联系 在线客服