综合利用多种文本挖掘及自然语言处理技术,采用高性能的分析处理算法,对搜索引擎的准确性、智能性、自动化等多方面提供了
强大支持。
- 自动分词
- 利用自然语言处理技术,并结合可动态优化的专业词典库,对文章进行自动分词。可自动识别新词,包括中外人名、产品名称
、型号等。支持自然语言搜索。
- 关键词提取
- 自动分析文章要点,提取关键词;
- 自动统计当前业内热门关键词。
- 自动摘要
- 自动根据文本内容生成摘要;
- 支持根据用户搜索请求进行实时动态摘要生成。
- 语义指纹
- 对文本内容进行语义分析,生成具有独特标识性的指纹码,支持高速大规模文档比对与查重。
- 自动分类
- 可自定义的多维分类标准,支持对搜集内容的自动分类,并给出相似度得分。
- 关联概念
- 对给定文本内容进行关联性分析,并自动提示相关概念及热点关键词,例如相关人物、相关企业、相关产品、相关行业等的关
联信息。