联索自动分类组件
产品简述
  • 基于联索BackMind语义计算技术,自动分类组件是支持联索专业搜索软件的自然语言处理工具,提供了自动分词、自动分类、 核心词抽取、自动摘要、语义指纹等核心功能及其相关管理工具。
  • 该产品模块作为联索专业搜索软件的可选模块进行安装,并与专业搜索软件的其他功能协同工作。
产品特性
  • 准确性高:具有自动学习与优化的自动分词、核心词提取功能。
  • 灵活通用:支持使用自定义的词库及分类标准,便于修改和优化。
  • 性能优异:支持实时高速分词、自动核心词提取以及自动摘要的生成,满足大规模信息内容加工、处理的要求。
产品功能
综合利用多种文本挖掘及自然语言处理技术,采用高性能的分析处理算法,对搜索引擎的准确性、智能性、自动化等多方面提供了 强大支持。
  • 自动分词
  • 利用自然语言处理技术,并结合可动态优化的专业词典库,对文章进行自动分词。可自动识别新词,包括中外人名、产品名称 、型号等。支持自然语言搜索。
  • 关键词提取
  • 自动分析文章要点,提取关键词;
  • 自动统计当前业内热门关键词。
  • 自动摘要
  • 自动根据文本内容生成摘要;
  • 支持根据用户搜索请求进行实时动态摘要生成。
  • 语义指纹
  • 对文本内容进行语义分析,生成具有独特标识性的指纹码,支持高速大规模文档比对与查重。
  • 自动分类
  • 可自定义的多维分类标准,支持对搜集内容的自动分类,并给出相似度得分。
  • 关联概念
  • 对给定文本内容进行关联性分析,并自动提示相关概念及热点关键词,例如相关人物、相关企业、相关产品、相关行业等的关 联信息。