联索 IFACE信息搜集系统是高度可定制、可管理的网络信息智能化采集与处理的服务器软件。实时监控、采集、分类和整理Web内容,高效处理和下载网页、图片、视频等网络数据,有效提高网络信息获取和利用的效率,降低信息采集成本。适用于各行业企业、政府、教育机构等开展信息采集监控、网络舆情、竞争情报、网络资源利用等应用需要。

系统优势

  • 定向采集
  • 用户可随时指定要监测和搜集的信息来源,例如企业内部数据库,外部信息提供商的数据库、互联网公共信息等。
  • 覆盖全面
  • 无遗漏抓取所关注的行业和主题的网络信息。
  • 支持新闻网站、传统媒体网络版、搜索引擎网站、博客、社区、BBS等,处理信息格式包括网页、视频、图片、RSS、数据库、文件等。
  • 高智能
  • 利用自然语言内容分析技术,自动生成标签关键词以及关联概念;自动查找和匹配重复内容; 自动计算和统计热点内容。
  • 系统自动化运行,对每日的最新信息及时捕获,无需用户干预。
  • 高性能
  • 分钟级的信息更新效率,新鲜信息即刻获得。
  • 多线程架构,单机日均百万条的网页采集速度。
  • 分布式并行采集,满足大规模应用对大量网络信息监控、采集和管理的要求。
  • 易利用
  • 采集信息经过结构化和规范化处理,保存于数据库中,便于网络数据的再利用。
  • 基于标准Web和数据库接口,易于集成各种内容管理系统(CMS),可轻松实现跨平台的二次开发与系统集成。
主要功能
  • 信息采集
  • 灵活设置信息搜集的目标内容和范围,随意设置和更改搜集的目标网站。
  • 随意设置网页信息采集的抓取深度,信息扫描间隔,线程数量等。
  • 可以动态监测信息变化并预警;
  • 对采集内容及效率进行自动统计,以图表形式展现采集状态及结果。
  • 信息自动识别和提取
  • 灵活定义和设置需要提取的信息单元和数据属性项,例如产品名称、型号、规格、价格等。
  • 自动识别网页内容及其信息单元。支持图片提取,支持视频下载,数据表格提取。
  • 数据清洗与整合
  • 具有强大的数据挖掘处理能力,丰富的数据清洗整合功能,对于抓取的信息单元和内容,可自动完成很多重要信息的自动处理。
  • 智能处理复杂的网页链接关系和结构关系,例如:上下级链接,分页信息等。
  • 内容库管理
  • 对搜集的信息可进行整理,数据导出可选择存入数据库或文件系统,可人工处理;
  • 采集结果具有丰富的导出接口,便于第三方系统的利用。
  • 对采集内容库可以单篇或者批量进行添加、编辑修改和删除。
  • 用户管理
  • 支持多用户身份认证,支持多用户帐号及用户组管理
  • 支持用户及用户组的功能授权,各种系统功能可以独立授权,自由分配给不同用户使用。
  • 支持采集内容的授权访问,采集内容可分配给不同用户进行访问和管理。
运行要求

操作系统:Microsoft® Windows® XP/2003/ Windows Server 2003

浏览器:Internet Explorer® 6.0以上

硬件:x86兼容处理器,CPU主频2GHz或更快;推荐多核心或多处理器;内存512 MB以上,推荐1GB以上; 可用硬盘空间5GB以上,USB端口或并口。

网络连接:搜集互联网信息,需要能访问互联网。



联索 IFACE信息搜集系统使用方便,系统管理采用基于Web的远程管理,授权用户通过IE浏览器完成采集任务,无需客户端部署。
联索 IFACE信息搜集系统,可以进行个性化的系统设置,支持自定义内容格式扩展插件,支持当前及未来的可扩展性需求。