联索 IFACE信息搜集系统是高度可定制、可管理的网络信息智能化采集与处理的服务器软件。实时监控、采集、分类和整理Web内容,高效处理和下载网页、图片、视频等网络数据,有效提高网络信息获取和利用的效率,降低信息采集成本。适用于各行业企业、政府、教育机构等开展信息采集监控、网络舆情、竞争情报、网络资源利用等应用需要。
系统优势
- 定向采集
- 用户可随时指定要监测和搜集的信息来源,例如企业内部数据库,外部信息提供商的数据库、互联网公共信息等。
- 覆盖全面
- 无遗漏抓取所关注的行业和主题的网络信息。
- 支持新闻网站、传统媒体网络版、搜索引擎网站、博客、社区、BBS等,处理信息格式包括网页、视频、图片、RSS、数据库、文件等。
- 高智能
- 利用自然语言内容分析技术,自动生成标签关键词以及关联概念;自动查找和匹配重复内容; 自动计算和统计热点内容。
- 系统自动化运行,对每日的最新信息及时捕获,无需用户干预。
- 高性能
- 分钟级的信息更新效率,新鲜信息即刻获得。
- 多线程架构,单机日均百万条的网页采集速度。
- 分布式并行采集,满足大规模应用对大量网络信息监控、采集和管理的要求。
- 易利用
- 采集信息经过结构化和规范化处理,保存于数据库中,便于网络数据的再利用。
- 基于标准Web和数据库接口,易于集成各种内容管理系统(CMS),可轻松实现跨平台的二次开发与系统集成。
主要功能
- 信息采集
- 灵活设置信息搜集的目标内容和范围,随意设置和更改搜集的目标网站。
- 随意设置网页信息采集的抓取深度,信息扫描间隔,线程数量等。
- 可以动态监测信息变化并预警;
- 对采集内容及效率进行自动统计,以图表形式展现采集状态及结果。
- 信息自动识别和提取
- 灵活定义和设置需要提取的信息单元和数据属性项,例如产品名称、型号、规格、价格等。
- 自动识别网页内容及其信息单元。支持图片提取,支持视频下载,数据表格提取。
- 数据清洗与整合
- 具有强大的数据挖掘处理能力,丰富的数据清洗整合功能,对于抓取的信息单元和内容,可自动完成很多重要信息的自动处理。
- 智能处理复杂的网页链接关系和结构关系,例如:上下级链接,分页信息等。
- 内容库管理
- 对搜集的信息可进行整理,数据导出可选择存入数据库或文件系统,可人工处理;
- 采集结果具有丰富的导出接口,便于第三方系统的利用。
- 对采集内容库可以单篇或者批量进行添加、编辑修改和删除。
- 用户管理
- 支持多用户身份认证,支持多用户帐号及用户组管理
- 支持用户及用户组的功能授权,各种系统功能可以独立授权,自由分配给不同用户使用。
- 支持采集内容的授权访问,采集内容可分配给不同用户进行访问和管理。
运行要求
操作系统:Microsoft® Windows® XP/2003/ Windows Server 2003
浏览器:Internet Explorer® 6.0以上
硬件:x86兼容处理器,CPU主频2GHz或更快;推荐多核心或多处理器;内存512 MB以上,推荐1GB以上; 可用硬盘空间5GB以上,USB端口或并口。
网络连接:搜集互联网信息,需要能访问互联网。
联索 IFACE信息搜集系统使用方便,系统管理采用基于Web的远程管理,授权用户通过IE浏览器完成采集任务,无需客户端部署。
联索 IFACE信息搜集系统,可以进行个性化的系统设置,支持自定义内容格式扩展插件,支持当前及未来的可扩展性需求。