http://www.cczero.cn

seo基础-蜘蛛查询系统运行内部规则

查询系统:
  搜索词处理:1.中文分词、2.去停止词 “的”、3.指令处理,“与”逻辑、4.拼写错误矫正、5.整合搜索触发
  文件匹配:找到符合用户搜索词“与”逻辑的所有页面子集
  初使子集的选择:选出页面权重较高的一个子集,再对子集中的页面进行相关性计算
seo基础-蜘蛛查询系统运行内部规则
相关性计算:
  1.关键词常用程度
  2.词频及密度
  3.关键词位置及形式:标题标签、strong、黑体、H1
  4.关键词距离
  5.链接分析及页面权重,锚文字,锚文字周围的文字
  6.排名过滤和调整:惩罚算法过滤作弊嫌疑及降权页面
  7.排名显示:抓取到的TD标签信息,动态生成页面摘要,因为相关性
  8.搜索缓存:搜索引擎会把最常见的搜索词存入缓存,只计算前1000名/100页
查询及点击日志
1.用户: ip地址、搜索的关键词、搜索时间、点击了解了哪些结果页面
2.搜索引擎:搜索结果质量、调整搜索算法、预期搜索趋势

责任编辑:cczero

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。