智能全文搜索系统充分利用Java的跨平台特性,可运行于Windows、UNIX等各种平台下,实现智能分词、智能索引、分类聚类、个性化搜索等功能。能够对文本、HTML、OFFICE文档、PDF等多种文件和数据库内容进行搜索。相关检索结果反馈能够根据用户对检索引擎的命中结果的判别执行更加符合用户意图的查询,且支持非结构化文件和关系数据库的全文检索,可满足各种类型用户对全文检索的需求,并且可针对门户网站集群垂直搜索。
产品功能
信息采集:实现对各WEB页面的批量采集的系统工具,支持对各类格式信息的采集。
智能数据处理:对采集的信息进行加工处理,分词索引、内码转换、自动分类、自动过滤、自动重排、关联分析等。
智能检索:系统采用智能分词技术和语义索引技术,支持各类检索方式,大大提高了信息搜索的查全率和查准率,实现智能化的精确检索。
产品优势
强大的信息采集能力
全文检索系统是以先进的搜索技术为核心,并针对专业用户所要求的搜索深度深、采集精度高和抓取速度快等进行了专门的优化,采用了分布式多线程并发指令执行体系结构,能够采集多种动态和静态网页类型、多种文档、数据库类型,同时网页实时增量采集技术实现分秒监测网站信息变化动态,使网站随时获取最新的信息资源。
全面的检索功能
全文检索系统可实现全文检索,支持同义词检索、支持自定义用户词典,模糊检索,相关检索等,为用户提供最为适当的检索结果。
精确的检索结果
全文检索系统采用智能中文切词技术,避免中文检索的歧义与多义现象,同时采用相关性算法对网页进行排序,保证检索相关性最高的页面放在最前面。
快速的检索响应
全文检索系统可实现以每秒上百次的并发检索支持,保证全面快速的响应用户检索需求。