看客网

看客网 » 互联网动态 » 业界动态
更多

详细内容 在线投稿

龙8国际注册

热度42票  浏览316次 时间:2018年10月12日 11:45
① 文本采集
搜索引擎爬虫组件:用来发现和抓取信息源,将抓取的信息源中的文档转换为文本或某种数据形式,然后存储到搜索引擎数据库中。
② 文本转换
解析器组件:用来处理文本转换,比如分词、停止词去除、词干提取、超龙8国际官方网站提取等。
③ 索引的创建
搜索引擎需要先文档,对文档进行加权,倒排,索引分派等。
用户交互
用户在搜索引擎窗口中只需要输入查询词,然后就可以一键显示结果。但搜索引擎需要接受这些查询词,进行分词处理、词干提取、去停用词等查询转换操作,筛选出与查询词相关的结果。
⑤ 排序
通过一定的排序算法,将已经得到的相关结果进行索引排序。
⑥ 评价
通过大量日志为参考数据,对页面排名进行调整,合肥育婴师培训从而改善搜索引擎系统带给用户的搜索体验。
顶:2 踩:3
对本文中的事件或人物打分:
当前平均分:-0.93 (14次打分)
对本篇资讯内容的质量打分:
当前平均分:-1.17 (12次打分)
【已经有11人表态】
4票
感动
1票
路过
1票
高兴
1票
难过
1票
搞笑
1票
愤怒
1票
无聊
1票
同情