联索文档格式转换器
产品简述
为结构化数据或者非结构化数据,统一信息接口提供一个灵活的模块化系统框架,将各种内容的文件格式、及其它应用系统的数据,转换成联索专业搜索系统内部的数据索引格式,从而支持丰富的信息来源,并随需扩充新的信息源而不影响现有系统。
接口类型
  • 网页数据接口:信息搜集组件将各种复杂的网页数据作为系统默认支持的数据格式,包括:Html、XML、RSS等;
  • 文档数据格式接口:支持MS Office Word/Excel/Powerpoint/RTF,Adobe PDF,文本文件等常用办公文档格式,容易扩充支持;
  • 关系型数据库接口:基于标准的ODBC和JDBC,支持MS SQL Server、Oracle、MySQL、DB2等主流数据库。
  • 应用系统接口:支持特定应用系统的数据接口,便于定制。
产品特性
  • 支持多语言:包括简体中文、繁体中文、英文、日文、韩文等60多种语言。
  • 数据来源丰富:面向互联网、内部网、数据库、文档库、多媒体内容库系统,与联索专业搜索产品无缝集成,提供企业级网络数据清洗的解决方案。
  • 全面支持各种复杂网页类型:包括Html、RSS、ASP、ASPX、JSP、PHP等各种静态和动态网页。