随着移动互联网、物联网等新技术的迅速发展,人类进入数据时代。大数据带来的信息风暴正深刻改变我们的生活、工作和思维方式,对网络舆情管理也带来深刻影响。根据中国互联网络信息中心(CNNIC)第41次《中国互联网络发展状况统计报告》显示,截至2017年12月,我国网民规模达7.72亿,普及率达到55.8%,超过全球平均水平4.1个百分点,超过亚洲平均水平9.1个百分点。伴随着高歌猛进地互联网化,以微博、微信为代表的网络社区成为了新的最重要的舆论场。2018年1月份,微信月活跃人数为9.04亿人次,微博也实现了月活用户3.7亿人次。
面对错综复杂的舆论阵地,红麦舆情监测产业是信息服务行业在大数据时代的又一轮升级产业。迭代优化后的版本具有更强大的网页内容抓取与语义分析能力,对互联网上相关舆情的实时监控和深度分析, 为舆情分析者全面掌握舆情动态、助力更良性的社会化营销与公关管理。红麦自2008年成立至今,经过10年时间的技术、监测资源、分析经验积淀,凝练成为行业经典,主要体现在一下三个方面:
在技术方面,舆情监测系统成功迭代4个大版本,产品在长期的不断试错和实战中不断完善,确保产品上至整体架构、下至每个功能细节的设计均经过认真推敲,并以最佳的解决方案予以实现。
监测资源方面,监测站点已涵盖20余万个。同时,抓取解析规则也在主流网站历年的改版中不断完善,确保兼容性的同时,抓取信息的乱码率、抓取边角信息概率以及得到显著控制。通过对主流站点反爬虫规则的多年测试,目前系统可以规避绝大多数主流站点的反爬虫规则,全年主流站点禁止访问概率几乎为0%。此外,通过长周期的数据量统计,红麦将各类媒体进行了科学的分级机制,根据各自媒体的不同权重和不同活跃时段,进行合理的抓取频次管理,确保在相同硬件配置情况下,最大程度提高抓取信息量,避免系统资源浪费和数据遗漏。
在语义分析方面,利用10年的存量数据,通过词频统计、拟合检验等技术的反复演算,红麦拥有较为完备、结构合理的正负面情感词判断体系,词库分为公共、行业、客户专属3个等级。每个词语的正负面情感得分、前缀否定词等都经过反复的验算和资深关键词工程师的校验,确保新客户初步磨合后,判断准确率平均达到80%以上,在无人工干预的情况下仍处于业内较高水平。此外,经过对10年历史数据的海量验算,红麦可以实现基于自然句语义的情感分析判断,系统可以通过解析句子主语及其前后修饰成分,理解该篇文章相对于指定主题对象的情感倾向。
首家具有完善的舆情管理体系的舆情一体化解决方案的供应商–红麦公司借助大数据得到了更为准确可视化的测量和呈现。为政府、大型国企、知名互联网公司以及公关公司等百余客户提供优质的舆情监测服务,反馈良好,验证了红麦舆情监测系统的可靠性、易用性。在未来,红麦将更好的利用大数据拓宽和加深舆情引导和研究的广度和深度,为企业提供更优质的服务。