什么是SEO
SEO就是站点维护人员切实做好站点内容、架构、外链等等工作,减少搜索引擎的工作量,降低搜索引擎工作难度,使搜索引擎能够更加容易的抓取网站页面,提取页面内容。
为什么做SEO
增加站点页面收录量;提升站点页面排名;改善网站用户体验;最终达到拦截流量的目的
关键字优化=SEO?
网站页面排名通过关键字排名体现,而关键字排名前后又是网站SEO的关键,因此造成了SEO就是关键字优化的误会。实际上SEO不仅仅是做关键字优化,还包括网站架构调整、网站内容策划、网站界面设计、站外内容建设等等,纯粹靠文字内容为主的关键字设置优化是无法达到SEO优化的效果。
搜索引擎工作原理
抓取
搜索引擎收录站点页面,搜索引擎的蜘蛛通过站点链接入口抓取并存储站点页面,链接入口通过蜘蛛自行爬取或者站长主动提交获得,一般蜘蛛更多青睐自行爬取到的链接入口,这也是外链建设的目的。
蜘蛛爬取方式
深度优先
广度优先
影响蜘蛛爬取的因素
1、站点页面的权重
权重决定蜘蛛深入爬取页面层级,权重越高收录页面层级越深。
2、页面内容更新频率
更新频率影响蜘蛛抓取频率,更新越快、更新量越大,蜘蛛爬取频率越快,收录时间越短,收录概率越大。
3、导入链接
高质量的众多导入链接是蜘蛛了解及爬取网站页面的入口,链接质量越高、数量越多,蜘蛛进入站点页面爬取的机会越多。
4、与首页距离
越近越容易被爬取收录
5、URL结构
短的、层次低的URL会被认定是站点最有价值的页面,同时关键字拼音命名的URL也对排名具有良好的效果。
搜索引擎对数据的预处理
1、提取页面的文字,蜘蛛首选站点页面文字内容,对其他页面构成元素如图片标签、锚链接文字等等也是提取里面的文字信息。
2、中文分词,对文字内容做分词,如“233网校”,分为“233”和“网校”两个词。分词是根据词典或者搜索数据统计分析做出的匹配,词典不作说明。主要是搜索数据统计分析,出现频率最多的搜索词就认定为一个词。
3、去停止词
顾名思义,就是去除废话,无效的词语,如去掉“啊”等语气助词或者转折词等等,因此网页内容需要谨慎使用这些词语。
4、去除噪声
去除页面上一些无效内容,里面有一个需要编辑注意,一个网站大面积重复出现的内容都会被认定为无效内容。
5、去重
此处针对伪原创很重要,去重主要是说搜索结果中会出现很多同一内容的页面,搜索引擎会对这些页面做筛选区分,最终选出质量较高、原创的页面展现给搜索的网友。中间的算法比较复杂,只要明白简单的段落顺序打乱或者加一些语气助词是无效的。影响算法的因素主要是站点权重、内容特征关键词重复、内容发布时间(之前是收录时间)、页面内容关键词设置等。
6、索引
该过程是搜索引擎会记录页面内容关键词,根据关键词对页面做分类筛选,当网友搜索关键词的时候就会自动调用匹配该关键词的页面内容。关键词记录是通过分析页面头部代码中的关键词出现次数、频率、出现位置(黑体、H标签(此处需要解释吗)、锚文字)、位置等
7、连接关系计算
关键词排名因素都包括链接流动信息,链接流动信息包括页面内部链接指向那些页面、页面有哪些导入链接、链接的锚文字是什么。这些链接通过复杂的指向关系形成了链接权重,可以将之看成PR或者BR(实际上不完全是)。
8、内容质量
判定的标准主要是内容质量及页面链接质量。页面质量包括页面打开速度、页面内容排版、页面内容质量、页面语法等。链接质量包括导入链接质量和导出链接质量。
搜索词排名相关性
1、搜索词出现频率,首先搜索词匹配出现频率较低的搜索词。
2、词频及密度,如果正常情况下,页面出现搜索词密度越大,频率越高越认为与搜索词关联性越高。
3、关键词位置及形式,关键词应该出现的几个地方,标题、HEAD代码、H1代码,关键词在正文中用黑体标注效果更好。
4、关键词距离,如二级建造师,如果页面内容中没有二级建造师这个词语,而是分开为二级和建造师两个词语,那么这两个词语距离越近越认为相关性更大。
5、链接分析及页面权重,最重要的是锚文字(需要解释吗),页面越多出现搜索词为主的锚文字导入链接,说明相关性越强。
排名过滤
简单说就是惩罚,惩罚经常遇到的情况有,同一页面大量同一指向链接、页面大量人工堆砌关键词、页面内容与关键词毫无关联等,惩罚一般是排名押后、取消收录等。
站点关键词选取
关键词选取标准(站点为例子)
站点需求
需求分析:二级建造师用户分析、二级建造师搜索关键词数据分析、二级建造师设置关键词排名、时间节点的分析。误区:长尾关键词切勿放在首页关键词里面,而是放入到内页更合适。如2015年二级建造师考试报名条件、2015年北京二级建造师考试报名等等。二级建造师的主关键词建议使用二级建造师考试、2015年二级建造师报名等。
内容相关
与页面内容有较大相关性,比如二级建造师考试报名关键词出现的页面最好是标题、描述、正文的文字内容都包含有较多的该关键词,描述可以出现三个左右的关键词。
搜索指数和收录量
查询关键词的搜索指数,选取指数居中但是收录量较低的词条做重点的关键词建设,通过这类关键词的数量积累获得拦截流量的增长。
站点关键词排名情况
对站点排名靠前的关键词做好日常性维护(需要详细说明吗),对于第二页及之后的关键词,搜索指数又还可以的,重点建设,包括内链、外链、页面代码写入等。
关键词挖掘办法
关键词挖掘工具分析
通过爱站等关键词追词工具对网站关键词进行分析,如排名、密度、出现页面等等,挖掘长尾关键词。
此外还有通过CNZZ的站点流量分析,通过分析站点流量来源中的搜索关键词,了解站点用户搜索习惯,发现新的关键词,调整页面关键词设置。
关键词优化
页面代码优化
页面代码优化主要是指页面的HEAD代码、H代码以及网站图片等其他标签代码里面加入关键词,头部代码主要是标题、关键词、描述三个,标题一般是一句通顺有阅读价值的语句,对整个页面内容做一个介绍;关键词则是为该页面设置的关键词;描述则是页面内容的摘要,一般该页面设置关键词在描述里面出现三次左右比较合理。H代码是页面的H1、H2代码等等,H代码是针对蜘蛛做告知作用,告知蜘蛛此部分的重要性,H1下是最重要的,依次递减,此方法适用于专题策划。网站图片标签除了做图片内容补充说明外,还能提高页面关键词密度及增加图片被收录的概率,图片说明要是一句完整意思清晰的语句,关键词则合理的锲入在其中,整个页面多图标签建议采用不同的图片标签说明。
页面文字内容优化
文字内容优化指页面标题、摘要、正文等文字内容,通过合理的内容写作,有效的提高内容关键词密度;同时在内容排版上突出关键词权重,如分段短标加入关键词,并加粗;内容页面用列表形式展示同一关键词或者相关性很高的其他内容标题等等;关键词做分词处理,如二级建造师考试报名入口可以拆分为二级建造师考试和报名入口两个词出现在内容中几次。
页面链接优化
链接优化分为内链优化和外链优化。内链优化指做指向链接是指向同一域名下的链接优化,内链优化有几个误区,页面大量复制同一指向链接、页面链接大量同一锚文本、仅仅为了链接数量而设置链接,出现大量与页面内容没有相关性的指向链接。
内链优化比较正确的做法,指向链接与页面有关(最好是与关键词有关);指向链接数量较多但不出现重复链接;指向链接尽量是权重高及层级浅的页面。同时在站点内部应该有大量的其他页面导出链接设置为该页面的地址
外链优化主要是做站点域名之外的站点链接建设,如网站友链互换,站外锚文本链接,站外文本链接等。做外链建设尽量推广站内深层级页面地址,不要全部都是首页地址(权重传递及蜘蛛爬取)。