垂直搜索引擎开发销售
技术介绍
模块包括采集、分词、索引、搜索、显示。实现搜索结果的准确、快速、显示更友好。
1、采集
功能:将网页内容下载并索引保存到本地磁盘。
分两种方式:
1.对于通用网站,使用多线程递归调用,同时进行分词和索引。
2. 对于个性网站,使用vb程序,将网页保存到硬盘,然后调用分词索引程序。
以上两种方式,使用数据库保存采集历史信息,可设置网站的更新时间,及是否更新、更新次数等等标记。文件格式可以扩展,包括doc,xls,ppt,xml,txt等。
2、分词 (重点)
功能:对网页内容进行合理的分词。
特点:15万词库,使用反向、正向混和分词,使分词的准确性大大提高。并设计了针对搜索引擎的扩展分词系统,支持人名、数字等。
3、索引
功能:使用dotlucene 提供的功能将网页内容以结构化方式保存在硬盘上,以备索引。
特点:文件大小在5K-400K之间,全部索引,速度在5-10万文件/小时
4、搜索
功能:根据用户输入的信息,快速准确的返回相关信息。
特点:根据用户输入信息,分解,并返回准确的信息。支持 “不包括 ”查询,支持 特定分类查询,扩展后,可以 支持 时间段查询 等其他高级查询,可以支持Ajax ,动态返回用户目前搜索的关键词的结果。当搜索本地无结果时,返回采集的通用数据。
5、显示
功能:将搜索结果中包括关键词的内容高亮显示,并可以手工定制搜索结果。
特点:将Highlighter.Net代码依照分词方式进行比较大的修改,使支持大数据文本,显示速度提高,用户体验较好。
系统要求:
window 2000/window 2003
MS SQLserver 2000/MySQL
查询速度:
80万以下数据返回时间在1秒左右,具体情况视机器配置决定。
销售价格:
垂直搜索引擎定制开发,起价2万,源代码价格面议。
功能演示
1.关键词高亮

2.拼写检查

3.相关词提示

4.快捷关键词提示

5.自定义结果

带笑脸的为手工定制结果
演示地址:http://www.zihuo.net/search.aspx?tp=5&wd=%E5%AF%B9%E8%AE%B2%E6%9C%BA
上一篇:网络营销顾问咨询服务
