中文意译为“搜索引擎优化”。SEO是指通过站内优化比如网站结构调整、网站内容建设、网站代码优化等及站外优化,比如网站站外推广、网站品牌建设等,使网站满足搜索引擎收录排名需求,在搜索引擎中提高关键词排名,从而把精准用户带到网站,获得免费流量,产生直接销售或品牌推广。
白帽SEO(WhitehatSEO)
白帽SEO是一种公正的手法,是使用符合主流搜索引擎发行方针规定的SEO优化方法。它与黑帽SEO相反。白帽SEO一直被业内认为是最佳的SEO手法,它是在避免一切风险的情况下进行操作的,同时也避免了与搜索引擎发行方针发生任何的冲突,它也是SEOer从业者的最高职业道德标准。
黑帽SEO(BlackhatSEO)
笼统的说,所有使用作弊手段或可疑手段的,都可以称为黑帽SEO,比如说垃圾链接,隐藏网页,桥页,关键词堆砌等。黑帽SEO获利主要的特点就是短平快。这种针对搜索引擎漏洞而采用的作弊方法,随时会因为搜索引擎算法的改变而面临惩罚。
灰帽SEO(GreyhatSEO)
所谓灰帽SEO灰帽,即是指介于白帽与黑帽之间的中间地带,相对于白帽而言,会采取一些取巧的方式来操作,这些行为因为不算违规,但同样也不遵守规则,是为灰色地带。
SEM是由英文Search
EngineMarketing缩写而来,
百度竞价排名(BaiduBid)
供应方平台(SSP:Sell-SidePlatform)
数据管理平台(DMP:Data-ManagementPlatform)
实时竞价(RTB:RealTimeBidding)
应用商店搜索优化(ASO:AppStoreOptimization)
ASO是“应用商店搜索优化”的简称。ASO(AppStoreOptimization)就是提升你APP在各类APP电子市场排行榜和搜索结果排名的过程。类似移动APP的SEO优化。
基于位置的服务(LBS:LocationBasedService)
每点击成本(CPC:CostPerClick)
每销售成本(CPS:CostPerSales)
这种方式的特点是按用户使用时长或使用周期计费,可以从根本上杜绝刷流量、激活作弊,是最真实的、有效的营销方式之一。
按事件成本(CPA:CostPerAction)
每千人成本(CPM:CostPerMille)
每回应成本(CPR:CostPerResponse)
每用户平均收入(ARPU:AverageRevenuePerUser)
日活跃用户数量(DAU:DailyActiveUser)
投资回报率(ROI:ReturnOnInvestment)
投资回报率(ROI)=年利润或年均利润/投资总额×100%,通常用于评估企业对于某项活动的价值,ROI高表示该项目价值高。
二、展现样式
整合搜索
整合搜索即内容搜索、图片、视屏搜索等搜索结果整理在一起,在搜索引擎的显示区块内显示出来。
站点子链
框计算
富摘要
数据标注
知心搜索
百度付费样式(略)
三、工作原理
全文搜索引擎(FullTextSearchEngine)
元搜索引擎(METASearchEngine)
目录搜索引擎
目录搜索引擎虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息。该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更新不及时。如早期的雅虎、搜狐。而现在的hao123导航网站虽然功能相近,但严格意义上来说并不算目录搜索引擎,仅仅是按目录分类的网站链接列表而已。
网页蜘蛛(Spider)
网页蜘蛛(又被称为网络爬虫,网络机器人,搜索引擎蜘蛛),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。
蜘蛛陷阱(Spidertrap)
“蜘蛛陷阱”是阻止蜘蛛程序爬行网站的障碍物,通常是那些显示网页的技术方法,目前很多浏览器在设计的时候考虑过这些因素,所以可能网页界面看起来非常正常,但这些蜘蛛陷阱会对蜘蛛程序造成障碍,如果消除这些蜘蛛陷阱,可以使蜘蛛程序收录更多的网页。
抓取频次
搜索请求(Query)
搜索请求,又被称作搜索查询,指用户在搜索引擎键入某个关键词搜索并试图取得返回结果的过程。搜索请求代表查询者的搜索意图。
索引(Index)
站点索引量
站点中有多少页面可以作为搜索候选结果,就是一个网站的索引量。
站点内容页面需要经过搜索引擎的抓取和层层筛选后,方可在搜索结果中展现给用户。页面通过系统筛选,并被作为搜索候选结果的过程,即为建立索引。
目前site语法的数值是索引量估算值,比较不准。推荐站长们使用我们的新工具,同时我们也正在努力改进site语法。
收录
指搜索引擎把网站索引到自己的数据库中,常见的搜索引擎收录有百度收录、谷歌收录、搜狗收录、有道收录、雅虎收录、夸搜收录、泽许收录等。用户可以通过搜索引擎提交入口提交网站吸引蜘蛛抓取页面,或通过外部链接吸引搜索引擎访问网站页面,当搜索引擎认为页面符合收录标准时,就会收录于网站页面。
建库
无效收录
底层库
排名(Ranking)
在搜索引擎里输入一个关键字,通常得到很多搜索结果,这些搜索结果的排名有先后之分,这就是搜索引擎排名。
自然排名
网页快照
搜索引擎在收录网页时,对网页进行备份,存在自己的服务器缓存里,当用户在搜索引擎中点击“网页快照”链接时,搜索引擎将Spider系统当时所抓取并保存的网页内容展现出来,称为“网页快照”。
网站权重(PageStrength)
网站权重是指搜索引擎给网站(包括网页)赋予一定的权威值,对网站(含网页)权威的评估评价。一个网站权重越高,在搜索引擎所占的份量越大,在搜索引擎排名就越好。其中有几点需要注意:1、权重不等于排名
2、权重对排名有着非常大的影响3、整站权重的提高有利于内页的排名。
*误区:例如人们经常讨论的百度权重其实并不是百度官方给出的概念,而是爱站、站长工具等网站推出的针对网站关键词排名预计给网站带来流量,划分等级0-10第三方网站欢迎度评估数据。
网站降权(Rightdown)
利用搜索引擎策略缺陷,以恶意手段获取与网页质量不符排名,而引发搜索结果和用户体验下降的行为都会被搜索引擎视为作弊行为,作弊应为按照“轻者轻罚,重者重罚”原则:对用户体验及搜索结果质量影响不大的,去除作弊部分所获权值,对用户体验及搜索结果质量影响严重的,去除作弊部分所获权值并降低网站权重,直至彻底清理出搜索结果。
K站
Alexa排名
它是指网站的世界排名,主要分为综合排名和分类排名,Alexa提供了包括综合排名、到访量排名、页面访问量排名等多个评价指标信息,大多数人把它当作当前较为权威的网站访问量评价指标。
网站PR值(PageRank)
PageRank,网页排名,又称网页级别、Google左侧排名或佩奇排名,是一种由搜索引擎根据网页之间相互的超链接计算的技术(级别从1到10),而作为网页排名的要素之一,以Google公司创办人拉里·佩奇(LarryPage)之姓来命名。
*2014谷歌官方宣布放弃PR
robots.txt
Robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫排除标准”(RobotsExclusionProtocol),网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。
网站地图(sitemap)
网站地图,又称站点地图。一般有两种常用的格式,一种是xml格式的,一种是html格式。其中html多为静态页面,用于给用户展示,帮助用户更好地在网站搜索需要的内容。而xml格式多用于提交给搜索引擎,供搜索引擎抓取网页页面。
沙盒效应(Sandbox)
搜索引擎结果页面(SERP:Searchengineresultspage)
SERP是为特定搜索显示的列表或结果,SERP有时候定义为搜索引擎结果的安排(placement),根据本系列的目的,我将其称为页面而不是安排,在SEO领域中,在SERP中取得良好的表现就是一切。
搜索引擎垃圾技术(SPAM:StupidPersonAdvertisingMethod)
搜索引擎垃圾技术是利用不道德的技巧去提高自己搜索引擎上的排名。不诚实的网站管理员就是利用这样的手段去欺骗搜索引擎从而获得较高的排名。这样的做法会让你的网站在短期内排名得到提高,但是后果却是十分严重的。有可能导致搜索引擎把你的网站从他的数据库里永久删除!
四、网站建设
互联网数据中心(IDC:InternetDataCenter)
数据中心不仅是一个网络概念,还是一个服务概念,它构成了网络基础资源的一部分,提供了一种高端的数据传输服务和高速接入服务。数据中心提供给用户综合全面的解决方案,为政府上网、企业上网、企业IT管理提供专业服务。
互联网服务提供商(ISP:InternetServiceProvider)
互联网服务提供商,即向广大用户综合提供互联网接入业务、信息业务、和增值业务的电信运营商。如中国电信、中国联通等互联网运营单位及其在各地的分支机构和下属的组建局域网的专线单位。
电信与信息服务业务经营许可证(ICP:InternetContentProvider)
网络内容服务商英文为
InternetContentProvider
网站备案
网站备案是指向主管机关报告事由存案以备查考。行政法角度看备案,实践中主要是《立法法》和《法规规章备案条例》的规定。网站备案的目的就是为了防止在网上从事非法的网站经营活动,打击不良互联网信息的传播,如果网站不备案的话,很有可能被查处以后关停。
云服务器(ECS:ElasticComputeService)
是一种简单高效、处理能力可弹性伸缩的计算服务,其管理方式比物理服务器更简单高效。用户无需提前购买硬件,即可迅速创建或释放任意多台云服务器。
虚拟专用服务器(VPS:Virtualprivateserver)
VPS是虚拟服务器,每个VPS都可分配独立公网IP地址、独立操作系统、独立超大空间、独立内存、独立CPU资源、独立执行程序和独立系统配置等。
*云服务器简单一点说,就是由超级计算机上划分出的虚拟机。本质上和传统VPS主机一样,都属于虚拟机,不同点在于,云主机是以超级计算机为物理支持,而VPS主机则是单台服务器为物理支持。所以云服务器可以弹性计算,随时升级,而VPS有独立的内存和硬盘,也有独立的带宽和IP。
虚拟专用网络(VPN:VirtualPrivateNetwork)
VPN,虚拟专用网络,等于在你的电脑和你公司的VPN服务器之间建立了一条你专用的“隧道”,“隧道”不需要物理(就是实物)链路,所以“虚拟”。你用账号密码登陆后就和你公司的内网建立了安全的连接(别人看不到传输的内容,所以很安全),然后就可以在你的电脑上使用公司内网,像在公司一样办公了。
*多用于翻墙。
内容分发网络(CDN:ContentDeliveryNetwork)
CDN的全称是ContentDeliveryNetwork,即内容分发网络。其基本思路是尽可能避开互联网上有可能影响数据传输速度和稳定性的瓶颈和环节,其目的是使用户可就近取得所需内容,解决Internet网络拥挤的状况,提高用户访问网站的响应速度。
*几乎所有的大型网站都在用CDN,看看他们在搜索引擎中的表现就可以知道不会任何的负面影响了。但我们建议站长尽量选择技术成熟的CDN服务商,某些CDN服务商会导致网站在某些地区访问不稳定,可能会影响Baiduspider的抓取。
Whois
简单说,whois就是一个用来查询域名是否已经被注册,以及注册域名的详细信息的数据库(如域名所有人、域名注册商)。
域名(DomainName)
域名是由一串用点分隔的名字组成的Internet上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位(有时也指地理位置,地理上的域名,指代有行政自主权的一个地方区域)。域名是一个IP地址上有“面具”。
*搜索引擎对.cn.org.com没有偏好。
首选域
首选域是您希望搜索引擎用来将您的网页编入索引的域(有时也指规范域),就是网站首选的域名。比如:一个站点有两个域名:www.***.com.,***.com。那么搜索引擎默认以为,这两个域名是指向同一个网站的。在搜索引擎收录和展示稳定下来后,它会选择其中一个域名来展示给用户,那么这个域名就叫做首选域(基本等同主域名)。
顶级域名
域名由两个或两个以上的词构成,中间由点号分隔开,最右边的那个词称为顶级域名。
*一般来说,可以粗暴的认为域名中没有“.”,为顶级域名,有几个“.”代表为几级域名。
DNS解析(DNSanalysis)
人们习惯记忆域名,但机器间互相只认IP地址,域名与IP地址之间是多对一的关系,一个ip地址不一定只对应一个域名,且一个域名只可以对应一个ip地址,它们之间的转换工作称为域名解析,域名解析需要由专门的域名解析服务器来完成,整个过程是自动进行的。
域名解析(Domainnameresolution)
域名解析是把域名指向网站空间IP,让人们通过注册的域名可以方便地访问到网站的一种服务。IP地址是网络上标识站点的数字地址,为了方便记忆,采用域名来代替IP地址标识站点地址。域名解析就是域名到IP地址的转换过程。域名的解析工作由DNS服务器完成。
*举例,你进一个高级小区访问一个朋友,在门口你问保安我的朋友小明在哪儿。保安告诉你,在C座,这就叫“DNS解析”。当然,你的朋友小明早就告诉C座的看门大爷,如果有找小明的就让他来908室。这就叫“域名解析”。
A记录
将域名指向一个IPv4地址(例如:10.10.10.10),需要增加A记录。如百度IP地址为123.125.114.144,这是需要网民输入baidu.com就能访问到IP地址,则需要增加A记录。
CNAME记录(别名记录)
如果将域名指向一个域名,实现与被指向域名相同的访问效果,需要增加CNAME记录。如需要达到浏览器输入baidu.com和www.baidu.com相同效果,则需要CNAME记录。
泛解析(泛域名解析)
泛解析即所有子域名均被解析到统一地址,如zhidao.baidu.com和news.baidu.com全部指向www.baidu.com,则使用泛解析。
网络地址(URL)
统一资源定位符是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它。
*你可以说“百度的域名是baidu.com”,不能说“百度知道的域名是zhidao.baidu.com”,应该说“百度知道的网址(URL)是zhidao.baidu.com”
超文本传输协议(HTTP:HyperTextTransferProtocol)
HTTP是一个客户端和服务器端请求和应答的标准(TCP)。客户端是终端用户,服务器端是网站。通过使用Web浏览器、网络爬虫或者其它的工具,客户端发起一个到服务器上指定端口(默认端口为80)的HTTP请求。(我们称这个客户端)叫用户代理(user
agent)。应答的服务器上存储着(一些)资源,比如HTML文件和图像。(我们称)这个应答服务器为源服务器(originserver)。
HTTPS(HTTPS:HypertextTransferProtocoloverSecureSocketLayer)
它是一个安全通信通道,它基于HTTP开发,用于在客户计算机和服务器之间交换信息。它使用安全套接字层(SSL)进行信息交换,简单来说它是HTTP的安全版。
HTTP状态码
HTTP状态码(HTTPStatusCode)是用以表示网页服务器HTTP响应状态的3位数字代码。
*HTTP状态码只是网页服务器的响应状态,而不代指某个网页。一般来说可以认为2**(请求成功);3**
(重定向);4**
(网页请求错误);5**(服务器错误)。其中,常见状态码为:200:正常访问;301:永久转向;302:暂时转向;404:文件不存在;502:服务器错误。
SSL证书
SSL证书是数字证书的一种,类似于驾驶证、护照和营业执照的电子副本。因为配置在服务器上,也称为SSL服务器证书。
SSL
证书就是遵守SSL协议,由受信任的数字证书颁发机构CA,在验证服务器身份后颁发,具有服务器身份验证和数据传输加密功能。如果您的网站使用
(SSLCertificates),并显示了签章(SecuredSeal),您的客户就知道他们的交易安全可靠,并且充分信赖您的网站。
内容管理系统(CMS:ContentManagementSystem)
指的是用来创建和管理网站软件,目前大部分网站都是CMS系统管理、数据库驱动的动态页面。
开放式分类目录(DMOZ:OpenDirectoryProject)
DMOZ网站是一个著名的开放式分类目录(OpenDirectoryProject),之所以称为开放式分类目录,是因为DMOZ不同于一般分类目录网站利用内部工作人员进行编辑的模式,而是由来自世界各地的志愿者共同维护与建设的最大的全球目录社区。
WordPress
WordPress是一种使用PHP语言开发的博客平台,用户可以在支持PHP和MySQL数据库的服务器上架设属于自己的网站。也可以把WordPress当作一个内容管理系统(CMS)来使用。
镜像网站(克隆网站)
指一个或多个域名不同,但内容完全相同的网站。大多情况下,站长出于正优化,如负载均衡,以及某些被墙网站在国内能正常访问的手法称为镜像网站;为了负作弊,如黑帽SEO复制多个网站,意图获取更多排名等手段为克隆网站。
超文本标记语言(HTML:HyperTextMarkupLanguage)
“超文本”就是指页面内可以包含图片、链接,甚至音乐、程序等非文字元素。超文本标记语言的结构包括“头”部分(英语:Head)、和“主体”部分(英语:Body),其中“头”部提供关于网页的信息,“主体”部分提供网页的具体内容。
网站日志(weblog)
客户端缓存(cookie)
浏览器用来存储网页需要记住信息的方法,例如,一个网页能够存储你访客名字在Cookie中,这样每次当他们再来的时候,他们的名字就能够出现在他们浏览器中你网站的首页上。
服务器缓存(session)
五、页面优化
网页导航
面包屑导航
分隔符
分隔符的使用是为了让搜索引擎能够正确识别以英文形式命名的URL中的关键字,我们需要使用相应的符号对词组之间的单词进行分隔,常见的分隔符包括:空格“”、横杠“-”、下划线”_”、逗号“,”及加号“+”等。
网站TDK
标题标签(TitleTag)
在Html的Head标签内被用来定义页面文档的标题。做SEO不优化标题标签,绝对是不可饶恕的低级错误,因为搜索引擎索引到的内容标题往往是网页Title的内容,想要有好的排名就必须多推敲Title,合理分配Title的关键词,让Title标签里面拥有最为核心的关键词。
描述标签(DescriptionTag)
Description标签一般出现在页面头部的meta标签中,主要用于概括或描述页面的内容。页面的Description标签可以较详细地告诉搜索引擎这个页面是关于什么的。一个页面的Title标签可能是几个单词或短语,而与Title标签有所不同,页面的Description标签则是一两句话或一个简短的段落。
关键词标签(KeywordsTag)
网站的首页关键词至关重要。首页网站关键词代表了网站主题内容,内页和栏目页的关键词一般紧扣页面主题,代表的是当前页面或者栏目内容的主体。
*keywords已经对搜索引擎排名没有任何作用了。
图片提示标签(AltTag)
alt标签实际上是网站上图片的文字提示。不好的习惯是每张图片都没有alt标签。而不可取的是,对于每个标签都采用关键词堆砌,这样就有可能会导致被视为Spam垃圾网站。
*Alt标签并不能提高关键词密度。
H标签()
加粗标签()
加重语气标签()
标签是权重标签中的代表,在搜索引擎中能够得到的高度重视。通过应用到你想强调的文本或者关键词中,这部分内容将会得到读者和搜索引擎的重视。
Metarobots标签
*noindex与nofollow是属于Metarobots标签的一个属性,robots.txt是一个协议文件。此外,如果您使用了robots.txt文件拦截此网页,我们也无法看到此标记。
Nofollow属性
Nofollow标签的作用有两方面,简单的说,一是不给链接投票,降低此链接的权重,二是使添加nofollow的部分内容不参与网站排名,便于集中网站权重,减少权重的分散。
规范网址标签(Canonical)
对一组内容完全相同或高度相似的网页,通过使用Canonical标签可以告诉搜索引擎哪个页面为规范的网页,能够规范网址并避免搜索结果中出现多个内容相同或相似的页面,帮助解决重复内容的收录问题,避免网站相同内容网页的重复展示及权重的分散,提升规范网页的权重,优化规范网页的排名。使用样式:
*百度会根据网页内容实际情况考虑Canonical标签中推荐的网页,但不保证完全遵守该标签。
绝对路径
绝对路径是指文件在硬盘上真正存在的路径。例如c:/website/img/photo.jpg。
相对路径
所谓相对路径,就是相对于自己的目标文件位置。例c:/website/img/photo.jpg中“../img/photo.jpg”就是相对路径。
*代码中使用绝对路径还是相对路径,一般看网站是否存在大量二级域名,如果存在的话,做相对路径一定要小心了,避免死链接。如果没有二级域名,做相对路径的好处大于绝对路径。但有一点,正文中的内部链接不管任何时候一定要用绝对路径(抄袭问题)。
关键词(keywords)
一个特定的词或者短语,搜索营销人员希望搜索者来经常输入作为搜索请求。
长尾关键词(LongTailKeyword)
长尾关键词(LongTail
Keyword)是指网站上非目标关键词但也可以带来搜索流量的关键词。
长尾关键词的特征是比较长,往往是2-3个词组成,甚至是短语,如“今天中午吃什么比较好”、“明天下班去哪里玩儿”等,搜索量非常少,并且不稳定。长尾关键词带来的客户,转化为网站产品客户的概率比目标关键词高很多,因为长尾词的目的性更强。
伪原创
锚文本(AnchorText)
锚文本又称锚文本链接,是链接的一种形式,和超链接类似,超链接的代码是锚文本,把关键词做一个链接,指向别的网页,这种形式的链接就叫作锚文本。
关键词密度(keyworddensity)
关键词密度(KeywordDensity)与关键词频率(KeywordFrequency)所阐述的实质上是同一个概念,用来量度关键词在网页上出现的总次数与其他文字的比例,一般用百分比表示,相对于页面总字数而言,关键词出现的频率越高,关键词密度也就越大。
*传说中的关键词密度3%-7%最好并不绝对,只要密度合理即可。
关键词堆积(keywordloading,keywordstuffing)
停止词(stopword)
消除噪声
信噪比(Text/HTMLratio)
网页信噪比是指一个网页上的文字内容与html代码的比率。从搜索引擎的原理来讲,其抓取系统首先是将整个网页下载下来,然后将里面的文字内容提取出来,经过分析去除html格式,清除噪音,然后分词,最后存入索引库。在这个过程中,搜索引擎也会经过去噪的过程,很明显,网页信噪比越高,搜索引擎抓取的效率就会越高,搜索引擎蜘蛛每天需要处理很多的数据,如何能够快速的提取网页的主题信息是个十分重要的任务。
隐藏文字(hiddentext)
网页劫持(PageHijacking)
页面劫持是一种SEO作弊手法,指的是黑帽SEO使用各种手段,将本来应该访问页面A的用户,转向到另一个页面B。302转向就是经常被用来实现页面劫持的手段。作弊者在自己的网站页面A上做302转向到其他网站上的页面B。由于误判,搜索引擎把页面A当作原始页面,在搜索引擎排名中出现。用户点击结果A后,作弊者在A网站上通过程序把用户转向到完全无关的(通常是成人内容、赌博、卖各种违禁药品等的网站)页面。页面劫持实际上是利用了其他网站上的高质量内容,却把用户劫持到自己的作弊网站上。
着陆页(LandingPage)
桥页(doorwaypages)
桥页也叫:门页、跳页、过渡页,通常是用软件自动生成大量包含关键词的网页,然后从这些网页做自动转向到主页。目的是希望这些以不同关键词为目标的桥页在搜索引擎中得到好的排名。当用户点击搜索结果的时候,会自动转到主页。
favicon
所谓favicon,即Favorites
Icon的缩写,顾名思义,便是其可以让浏览器的收藏夹中除显示相应的标题外,还以图标的方式区别不同的网站。常用的Favicon.ico图标有3种16×16、32×32、48×48。最简单的方法就是将制作好的favicon文件命名为favicon.ico然后上传到网站的根目录下。
六、百度搜索引擎算法
绿萝算法(2013年2月19日上线)
该算法主要打击买卖链接的行为,包括超链中介、出卖链接、购买链接等超链作弊行为。该算法的推出有效制止恶意交换链接,发布外链的行为,有效净化互联网生态圈。
石榴算法(2013年5月17日上线)
绿萝算法2.0(2013年7月1日上线)
冰桶算法(2014年8月30日上线)
冰桶算法2.0(2014年11月18日上线)
冰桶算法3.0(2016年7月15日上线)
原创星火计划(2013年5月15日)
算法内容:打击抄袭复制等行为,鼓励原创优质内容,推出的首次与有优质原创能力的网站合作,如内容最新来自首发站点,首发站点优先获得排名。现该算法已升级,可直接让技术做好主动推送功能,如是原创内容,记得做标识。
原创星火计划2.0(2015年12月17日)
百度星火计划所服务的原创内容,需要遵守星火计划原创规范,按照规范要求在原创内容中进行标识,同时使用百度站长平台提供的链接提交-主动推送方式进行提交。
天网算法(2016年8月10日)
七、链接建设
内链(Internallinks)
内链,顾名思义就是在同一网站域名下的内容页面之间的互相链接(自己网站的内容链接到自己网站的内部页面,也称之为站内链接)。合理的网站内链接构造,能提高搜索引擎的收录与网站权重。
外链(Externallinks)
外链也叫做“导入链接(inboundLinks)”是指通过其他网站链接到你的网站的链接。
反链
对某个网页文档来说,所有来自其他文档指向自己的链接都叫“反向链接”。一个网页文档的反向链接越多,说明这个文档的“知名度”或“支持率”越高。
*如有三个页面,站内页A,站内页B,站外页C,则反链=C→A或B→A;外链=C→A;内链=C→A。
死链(DeadLink)
导出链接(outboundlinks)
单向链接(one-waylink)
链接到一个网页的超链接,而没有相应链接回到原来的网页。
隐藏链接(hiddenlink)
隐藏链接也叫做“黑链”,指的是正常的链接通过一些方法,如:把链接放入js代码中,使用display:none等等。隐藏链接和隐藏文字(hiddentext)相似,但是区别是把关键词放在链接里面,而这个链接也是用户所看不到的。
链轮(LinkWheels)
SEO链轮是指通过在互联网上建立大量的独立站点网站或是在各大门户网站上开设博客,这些独立站点网站或是博客群通过单向的、有策略、有计划的紧密的链接到一个要优化的目标主网站(或主关键词);举例以ABCDE
站群
页面劫持(PageHijacking)
页面劫持是一种SEO作弊手法,指黑帽SEO将本来应该访问的页面A的用户转向到另一个页面B。其中302转向经常被用来实现页面劫持的手段,作弊者在自己的网站页面A上做302转向到其他网站上的页面B,由于某种原因,搜索引擎把页面A当做原始页面,在搜索引擎排名中出现,用户点击结果A后,作弊者在A网站上通过程序把用户转向到完全无关的页面上。
空链接()
空链接是未指派的链接。空链接用于向页面上的对象或文本附加行为。
锚点链接
静态URL
动态URL
URL又称动态页面,动态链接,即指在URL中出现“”这样的参数符号,并以aspx、asp、jsp、php、perl、cgi为后缀的url。
*一般情况下,看链接有无参数即可判断是动态还是静态。另外,目前普遍认为静态页面对SEO的效果优于动态页面,但是谷歌官方曾建议不要讲动态URL静态化,因为目前搜索引擎的抓取参数已经完全没问题,而且动态URL中的参数也有助于搜索引擎识别页面内容,利于搜索引擎理解网页。所以具体是使用静态还是动态URL各位自己斟酌即可,不必为了静态而静态。
伪静态
*在SEO方面,伪静态和静态页面的功能是相同的,但是伪静态本质上还是动态页面,所以消耗资源是和动态页面一样的,而且因为Rewrite服务器还需要消耗额外的资源。
八、数据分析
PV(访问量:PageView)
即页面浏览量或者点击量,用户每次对网站的访问均被记录1次。用户对同一页面的多次访问,访问量值累计。一个PV即电脑从网站下载一个页面的一次请求。当页面上的JS文件加载后,统计系统才会统计到这个页面的浏览行为,有如下情况需注意:1.用户多次打开同一页面,浏览量值累计。2.如果客户端已经有该缓冲的文档,甚至无论是不是真的有这个页面(比如JavaScript生成的一些脚本功能),都可能记录为一个PV。但是如果利用网站后台日志进行分析,因为缓存页面可能直接显示而不经过服务器请求,那么不会记录为一个PV。
UV(独立访客:UniqueVisitor)
IP(网络之间互连的协议:InternetProtocol)
IP可以理解为独立IP的访问用户,指1天内使用不同IP地址的用户访问网站的数量,同一IP无论访问了几个页面,独立IP数均为1。但是假如说两台机器访问而使用的是同一个IP,那么只能算是一个IP的访问。
新独立访客(NewUniqueVisitor)
字面意思,新独立访客就是首次访问网站的独立访客,同样以cookie为依据来进行判断。用新独立访客/独立访客比率判断网站是否符合规划好的增长引擎,新用户的涌入及老用户的粘性。
访问次数(Visit)
人均浏览页数
平均每个独立访客产生的PV。人均浏览页数=浏览次数/独立访客。体现网站对访客的吸引程度。一般情况下,资讯栏目肯定比企业战士栏目输出的PV要多。所以分析该指标时,一定要追踪到不同的子栏目,找到峰值。
平均访问深度
平均每次访问(会话)产生的PV。平均访问深度=浏览次数/访问次数。体现网站对访客的吸引程度。
平均访问时长
跳出率(BounceRate)
也被称为“蹦失率”,表示仅浏览了1个页面就离开网站的访问(会话)次数占总访问次数的比率。跳出率=跳出次数/访问次数。跳出率是反映网站流量质量的重要指标,跳出率越低说明流量质量越好,用户对网站的内容越感兴趣,网站的营销功能越强,这些用户越可能是网站的有效用户、忠实用户。
对于单页营销的网站来说,跳出率只能是100%,因为用户只有一个页面可以访问,所以单页营销网站不必考虑这个指标。在百度搜索推广中跳出率和平均访问时长可以反映出推广关键词的选择是否精准,创意的撰写是否优秀,着陆页的设计是否符合用户体验。
*淘宝中有一个“跳失率”的概念,通俗的说就是从你的页面跳转到到其他店铺的页面,说明你的产品没另一家的好。而你店铺的A宝贝跳到B宝贝不算跳失率。注意区分。
退出率(ExitRate)
退出率=该页退出的的页面访问数/进入该页的页面访问数=退出PV/进入PV。
*例如,10个visits来到a页面——5个visits直接离开,3个visits去b页面(2个visits去c页面然后直接离开)。
b页面的3个visits有2个visits返还a页面最终从a页面离开。则计算a页面的于BounceRate和ExitRate
分别就是(5/10)*100%和(5+2/10+2)*100%
二跳率
当用户从外部链接到达网站时,被称为第一次跳转,如果用户再点击某一链接或按钮从而进入网站深层页面,则被称为“二跳”,外部来的用户中进行了二跳的用户的比例被称为“二跳率”。例如,100人进入网站,85人浏览了更多页面,则“二跳率”为85%。
搜索词
指用户在搜索引擎中搜索的关键词,通过这些关键词到达了你的网站。
热点图
热点图功能记录页面访客的鼠标点击行为,通过颜色区分不同区域点击热度。从热点图的点击轨迹看用户首先点击哪块区域,这点很重要。这些地方可以放置一些对用户有价值的内容供用户阅读,可以更好的控制跳出率。
转化目标
转化目标,也叫做转化目标页面或目标页面,指商户希望访客在网站上完成的任务,如注册、下订单、付款等所需访问的页面。
转化路径
转化路径报告提供了访客在目标的各个步骤上的访问行为数据。假如设定“一次咨询”即为转化目标,其目标路径为首页→关于我们→点击咨询按钮为一次转化路径,那么当网站访问用户照此路径操作后,网站后台统计该转化路径次数加一。
页面转化
页面类型的转化是指访客访问了您期望他浏览的页面,如注册提交后出现的“注册成功”页面,您可以将到“注册成功”的网址输入到页面转化设置中,百度统计能够为您统计“注册成功”的注册量。
事件转化
元素、AJAX
嵌入式元素以及视频播放等这些都是事件,百度统计可以对其进行跟踪。事件转化可以帮助您了解您网站上的用户操作情况,如某个按钮的点击次数、某个表单的提交次数或文档的下载次数。您可以在转化设置中,定义您需要跟踪的事件目标,将其作为转化来统计。
转化率
转化率指在一个统计周期内,完成转化行为的次数占推广信息总点击次数的比率。计算公式为:转化率=(转化次数/点击量)×100%。例如:10名用户看到某个搜索推广的结果,其中5名用户点击了某一推广结果并被跳转到目标URL上,之后,其中2名用户有了后续转化的行为。那么,这条推广结果的转化率就是
(2/5)×100%=40%。
抵达率
访问某网站的抵达率=访问次数/点击次数。抵达率过低,则说明较多点击未能抵达网站,需要查看网站url是否正常打开,速度是否够快。
页面流失率
流失率指对指定路径对应的步骤而言,访客从该步骤进入到下一条步骤的过程中流失的比例。计算公式为:本步骤的流失率=[(本步骤的进入次数-下一步骤的进入次数)/本步骤的进入次数]×100%
用户流失率
九、其他
BadCase
新闻源
自适应网页设计(AdaptiveWebDesign)
自适应网页设计指能使网页自适应显示在不同大小终端设备上新网页设计方式及技术。
工具条(Toolbar)
安装在浏览器上的插件,提供一些搜索引擎或其他附加功能。用户可以在工具条上的搜索框内输入关键词直接搜索,而不必访问搜索引擎网站。几乎所有搜索引擎都开发了工具条供用户下载使用。
Unicode
Unicode(统一码、万国码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。
*目前百度对unicode编码只支持utf-8。
百度十一位
百度排名11位是指你的站点中流量不错的主要关键词(有些流量的,排名前几位的)百度排名从首页或第一位被固定在第二页的第一位(即第11位),且不止一个词,存在多个关键词同时掉到11位,期间无论是百度更新还是其他的站排名上升下降,关键字排名总是第11位或者之后(在11位-13位之间变化)。