http://www.cczero.cn

seo基础-百度蜘蛛信息处理及倒序索引系统

蜘蛛进入网站后做的事项:
提取关键词
  1.代码去噪
  2.去除非正文关键词(导航栏、页面共享的公共区域)
  3.去除停用词“的”“在”“与”“及”
消除重复与转载网页:重复要低于70%
seo基础-百度蜘蛛信息处理及倒序索引系统
 
重要信息分析
1.H标签
2.strong标签,重要性仅次于H标签
3.meta标签
4.黑体
5.关键词密度
6.内链描文本

网页重复度分析:外链指向该网页所传递的权重数值
单个网页:
1.转载、2.时间、3.更新、4.链入、5.br权重、6.专业性(关键词单一)、7.重要标签应用、8.关键词密度、9.网页层级、10.网页架构、11.文件形式 
网站:1.所有内容2.架构3.相似度4.相关度
正面索引:根据重要性整理出有效重要的关键词,根据规则删掉剩下的词
倒排索引:根据关键词整理出其关键词的排名系数进行排名
TDK中T不能够改,D和K是可以改的,但不可太频繁。


责任编辑:cczero

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。