基本功能:
1)舆情数据采集子系统
舆情数据采集子系统的数据采集对象主要是互联网网站和网页,数据源主要有两种,一是通过指定范围的网站对其进行抓取采集,支持新闻、博客、论坛采集;另一种是通过baidu、google、搜狗等搜素引擎根据关键词进行全网的数据采集。在单服务器状态下,支持对1000个以上的站点/栏目进行采集监控。
在数据采集过程中,包含了对于正文内容的自动识别、自动去除广告及干扰信息、文章去重与相似度分析、自动生成摘要和关键词等多项中文语言处理技术。
此外,数据采集子系统还能够针对网页中的图片、文档资源文件进行采集下载,具有生成网页图片和快照、实现网站自动登录、利用代理服务器下载、JS 自动识别判断、分布式采集等多项功能。
在舆情数据采集子系统中采用了模版技术,系统内置数百个网站的模版,使得用户的配置过程相当简便,采集配置简单、易学;采集界面可视化、人性化。
此外,我们还通过人工收集报纸、标语、短信、电子邮件、QQ群等各种资讯信息进行汇总,作为线上信息的补充。
2)舆情数据处理子系统
舆情数据处理子系统主要是针对采集子系统采集的数据进行整理、处理。主要功能包括:
舆情数据管理:包括对于数据的整理、编辑、删除、新增等维护工作,支持通过关键词的自动分类,支持无限极分类体系。
门户信息配置:系统可以自动生成前端门户平台的信息,管理员也可以通过后台配置将需要重点呈现的信息置于门户中去,同时,管理员也可以对门户的一些频道、热词、专题进行管理和设置。
简报管理模块:通过设置舆情简报模版,可以按天、按月、自动生成舆情简报,也可以手动选择信息生成简报,同时对于已生成的简报提供可视化的编辑界面,用户可以编辑撰写。
3)舆情数据分析子系统
舆情分析子系统功能分为统计和分析两部分。
统计主要是对于舆情内容的统计,信息站点分布统计、时间统计、具有折线图、柱状图、饼图多种表现方式。
舆情分析功能包括,自动聚类、热词发现;正负面信息研判;事件发展趋势分析;热点人名、地名分析;
4)舆情门户展示子系统
舆情门户应用子系统是根据客户的行业特点与行业需求,定制的一个舆情展示、呈现平台,通过该平台可以将舆情系统中收集到的信息、分析结果、生成的简报、以图文方式进行展现,提供给用户和各级领导浏览、下载。