【摘 要】 在移动互联网环境下,利用文本挖掘和搜索引擎技术,通过前端内容的自动采集处理、对敏感词进行过滤,并且进行智能聚类分类、主题检测、专题聚焦、统计分析,实现质检执法各部门对各自相关网络舆情关注的需要,支持形成质检信息分析报告,从而为决策层全面掌握信息动态、做出正确舆论引导提供分析依据。 【关键词】 移动互联网 质检执法 舆情信息 聚类分析 1 引言 随着当今信息化技术的不断发展,移动互联网已经成为人们日常生活的必不可少的组成部分。依托十多年数字化进程中积蓄的能量,大量网络化信息从PC互联网向移动互联网快速迁移,与移动智能终端同步渗透到国民经济各个领域和日常生活之中。在庞大的互联网体系之中,网络舆情是人们关于社会中各种现象、问题所表达的信念、态度、意见和情绪等表现的总和,特别是关系到城市安全、供热锅炉和压力管线等特种设备的质检信息采集和聚类分析技术。如何正确采集供热锅炉和压力管线等特种设备的运行数据和情景现实,及时通知质检等相关部门,早发现、早治理,对维护城市安全具有重大意义。因此,亟待利用移动互联网技术,构建基于移动互联网的质检信息采集与聚类分析技术平台,为我国城市安全管理、质检领域热力锅炉和其它特种设备管理提供智能高效的信息化支撑服务。 2 智能计算技术的质检信息监控 2.1 移动互联网的质检信息来源 移动互联网的质检信息来源的选择对于以后的质检信息挖掘研究至关重要,只有准确地把握质检信息的最初来源,才可能获得更为全面的质检信息。目前,质检信息主要的来源有政府网站,如新华网、人民网等;新闻及网络媒体站点,如光明日报、新浪等;微博、微信、论坛、博客、百度贴吧,如强国论坛、天涯、新浪博客、中国博客网、高校贴吧等。 2.2 移动互联网的质检信息采集 移动互联网的质检信息采集主要是运营方搜索引擎Web信息采集,通过Web页面之间的链接关系,利用网络爬虫从Web页面上自动获取质检信息相关信息,并且随着链接不断向整个Web页面扩展的过程。 2.3 移动互联网的质检信息预处理 移动互联网的质检信息预处理主要是对采集到的质检信息网页进行初步的加工和处理,为后继的质检信息分析奠定基础。主要涉及信息过滤、关键信息抽取、自动摘要等核心技术。 2.4 移动互联网的质检信息分析 移动互联网的质检信息分析是指对从移动互联网中所采集到的反映质检信息的新闻、评论等信息素材进行分类、聚类、倾向性分析等,根据质检信息分析评价指标的结果,确认其可信度和有效性,然后对质检信息主题重新组织信息,经过分类和处理后生成有针对性的质检信息。 2.5 移动互联网的质检信息处理 移动互联网的质检信息处理包括质检信息预警、质检信息报告和质检信息引导。首先根据分析统计得到的相关质检信息,根据相关质检信息预警指标,实施报警和预测,然后向质检部门汇报总结后的质检信息,从而为质检信息工作者的决策提供服务。 |