深圳seo优化公司梳理下SEO基本常识
一、SEO定义
Search Engine Optimization(全称)也即搜索引擎优化,就是从搜索引擎上获得流量的技术。搜索引擎的主要工作包括:通过了解搜索引擎的工作原理掌握如何在网页流中爬取网页、如何进行索引以及如何确定某一关键词排名位置从而对网页内容进行科学的优化,使其符合用户浏览习惯的同时提高排名与网站访问量,最终获得商业化能力的技术。
二、 搜索引擎工作原理
主要有三段工作流程:爬行抓取、预处理、服务输出。
1、爬行抓取
主要功能是对网页进行抓取,目前有三种爬行抓取方法。
批量收集:对互联网上只要是存在链接的网页都收集一遍,耗时较长,在几周左右,缺点是增加了额外的带宽消耗,时效性也不高。增量收集:在原有已收集的网页基础上搜索新增加的网页,变更上次收集之后有改变的页面,删除收集重复和不存在的网页。站长通过工具向搜索引擎主动提交网站,这种方法的响应速度比较慢,主流上还是提倡让搜索引擎蜘蛛主动来爬取。
2、常见蜘蛛
搜索引擎蜘蛛是搜索引擎的一个自动程序,作用是访问互联网上的网页、图片、视频等内容,建立索引库,seo工具一般用法为spider+URL这里的URL是搜索引擎的痕迹,可以通过查看服务器里的日志里是否有该URL,同时还能查看一些列属性。
3、 爬行策略
深度优先爬行:沿着一条线抓取下去,知道最后,然后返回到另一条线,广度优先爬行:在一个页面发现多个链接后,把所有层的链接抓取一遍,然后再沿着第二层、第三层。
4、 预处理
也即对抓取回来的数据进行一个索引工作,其中包括多个流程,在后台提前完成。
5、 关键词提取
将HTML、JS、CSS等标签&程序去除,提取用于排名的有效文字。
6、去除停用词
即反复出现的无用词,如:“得、的、地、啊、阿、再”等。
7、分词技术
是中文搜索引擎特有的技术支持,中文不同于英文单词与单词之间用空格分隔,因此搜索引擎必须把整个句子切割成小单元词。
8、消除噪声
消除网页上各种广告文字、图片、登录框、版权信息等对搜索引擎无用的东西。
9、分析网页建立倒排文件
正向索引:把页面转换为一个关键词组合,同时记录每一个关键词在页面上的出现频率、出现次数、格式、位置,使每一个页面都可以记录为一串关键词组合,其中每个关键词的词频、格式、位置等权重信息也都记录在案。倒排索引:正向索引不可以直接用于排名,倒排索引以关键词为索引
10、 链接关系计算
计算出页面上有哪些链接指向哪些其他页面,每个页面有哪些导入链接,链接使用了什么锚文本等,Google推出的PR是代表之一。
三、网站分类目录
是人为编辑的搜索结果,将互联网上的网站收集整理在一起,按照不同的分类或者主题放在相应的目录中,多靠人为提交。
四、 关键词
一般指用户在搜索框中自定义输入的信息,按照概念可以分为:目标关键词、长尾关键词、相关关键词;按页面上分,可以为首页、栏目页、内容页关键词;按目的来分可以分为直接性、营销性关键词
五、权重和PR值(PageRank)
PR值是谷歌搜索引擎用来衡量网页重要性的一种方法,也是其判断一个网站好坏的重要标准之一,更大的影响因素为是否拥有大量的高质量外链。
网站权重是指网站与网站在搜索引擎眼中的分级制“待遇”表现,是搜索引擎中的一个综合表现指标,决定因素有:外部链接的导入、稳定的高质量内容和结构清晰的网站结构等。
要注意区分这是两个不同的概念
六、白帽SEO和黑帽SEO
七、锚文本、外链、内链、单向链接、双向链接、导出链接、导入链接