
- 以关键字元搜索为基础的全网采集
直接输入关键字后,系统后台自动在主流的搜索门户上进行元搜索,元搜索获取的结果页面可以直接被采集下来,在采集的过程中,根据预设模版进行内容、标题或者您感兴趣的信息项的自动解析和提取。
- 全网采集支持的搜索门户
全网采集支持的搜索门户包括但不限于人民搜索、盘古搜索、Baidu博客、Baidu新闻、Baidu网页、Baidu贴吧、Baidu知道、天涯问答、奇虎论坛、奇虎博客、新浪爱问(iAsk)、天涯来吧、有道新闻、Yahoo网页、Sogou新闻、Google博客、Google网页等,系统可以根据用户需求、用户选择、搜索门户的发展随时进行调整或扩充。
- 具备定向采集系统具有的中文分词、智能处理等其它功能
全网采集下来的数据也可以进行内容关键词/特证词提取、内容摘要自动形成、不同精度的内容去重等中文智能处理功能。
- 支持用户的采集编辑加工发布
全网采集的数据量相对较大,如果用户需要筛选或编辑加工,可以通过系统的采编功能予以实现。
- 支持第三方发布接口
采集下来的数据,可以通过第三方发布接口直接发布到内外网上。
- 可以与WebNews互联网舆情监控系统、WebCraft信息情报数据库系统等我们开发的其他系统无缝集成
WebNews互联网舆情监控系统、WebCraft信息情报数据库系统等是我们开发的其他系统,这里就不展开介绍。