基于微博的社会舆情研判与预警体系构建
作者:张利民 邹姝阳
来源:《卷宗》2013年第10期
摘 要:本研究以新浪微博为主要舆情采集平台,对微博系统内海量信息进行日常性和持续性的抓取、跟踪与搜集。本论文针对微博信息传播特点,充分利用网络信息挖掘技术、计算机中文信息处理技术、数据挖掘技术等应用技术,研究微博舆情监测关键技术及实施方案,力求构建适应微博特点的网络舆情预警机制。
关键词:微博;舆情;研判;预警
1 引言
近年来我国各类突发事件频发,社会稳定性显著降低,这不仅直接导致社会经济生活及人身财产安全的重大损失,也极大地危害到社会的稳定与发展。中国社科院在其出版的《社会蓝皮书》一书中,将微博定义为"杀伤力最强的舆论载体",体现了微博舆论的强大影响力。
本研究来源于北京市大学生科研创新项目《基于微博的社会舆情研判与预警》的子项目,试图以新浪微博为对象,研究微博舆情监测关键技术及实施方案,具体内容包括:博文自动抽取、中文分词、文档清洗(去停用词)、中文计算机表达、文档情感倾向判别、意见领袖识别、综合舆情判断等内容。
2 研究过程
2.1 微博数据的自动获取
网络舆情数据获取是网络舆情分析的前提。面对互联网的海量信息,迫切需要一种技术来帮助人们自动从网络上获取相关信息,从而可以极大地提高人们获取信息的速度和广度。网络爬虫(WEB Crawler)是搜索引擎的重要组成部分之一,其作用是为搜索引擎从网络中下载所需的网页。相比网络爬虫,新浪微博的开放API接口可以更加简洁的获取相应的数据,本研究即采用新浪微博的API接口作为数据挖掘工具。
① OAUTH认证:使用新浪API前首先须完成用户认证。新浪微博API采用OAUTH认证为用户提供了一个安全的、开放而又简易的标准。
¥29.8
¥9.9
¥59.8