每个网页都需要有合适的标题,网站首页标题建议使用站点名称或者站点代表的公司、机构名称;其余的内容页面,标题建议做成与正文内容的提炼和概括,建议格式“页面标题_站点名称”,这可以让您的潜在用户通过搜索引擎结果中的标题快速访问到您的页面。
充分利用网站首页或者频道首页的description标签,提供此网页内容的概括说明,形式为
网站应该有明晰的导航和层次结构,网站上重要的网页,应该能从网站比较浅层的位置找到,确保每个页面都可以通过至少一个文本链接到达。
为用户提供包含指向网站重要部分的链接的站点地图。如果站点地图中包含的链接数量过多,您应将该站点地图分成多个网页。
考虑用户可能使用什么字词来查找您的网页,并在网站中包含这些文字。
检查连接是否损坏,确保HTML格式正确,保证用户能够到达每一个网站中的页面。
尽量使用文字而不是图片、flash、Javascript等来显示重要的内容或链接,如果必须对文字性内容使用图片,请考虑使用“ALT”属性来加入一些描述性的文字。
尽量少使用frame和iframe框架结构,通过iframe显示的内容可能会被丢弃
如果网站采用动态网页,减少参数的数量和控制参数的长度将有利于收录。
网站改版或者网站内重要页面链接发生变动时,应该将改版前的页面301永久重定向到改版后的页面。
谨慎加入频道共建、内容联盟等不能产生或很少产生原创内容的计划,除非您能为内容联盟创造原创的内容。
搜狗会尽量收录提供不同信息的网页,如果您网站上相同的内容可以通过不同形式展现(如论坛的简版页面、打印页),可以使用robots.txt禁止spider抓取您不想向用户展现的形式,这也有助于节省您的带宽。
1.sogouspiderUser-Agent字段是什么?
Sogouwebspider和Sogouinstspider
请注意,根据标准,ua区分大小写。
2.sogouspider访问我的网站过快怎么办?
sogouspider对于同一个IP地址的服务器主机,只建立一个连接,抓取间隔速度控制在几秒一次。一个网页被收录后,最快也要过几天以后才会去更新。如果持续不断地抓取您的网站,请注意您的网站上的网页是否每次访问都产生新的链接。
3.sogouspider喜欢收录什么样的页面?
内容优良而独特的页面,如果您的页面内容和互联网上已存在的其他页面有高度的相似性,可能不会被sogouspider收录。
链接层次较浅的页面,过深的链接层次,尤其是动态网页的链接,会被丢弃而不收录。
如果是动态网页,请控制一下参数的数量和URL的长度。搜狗更偏好收录静态网页。
重定向次数越多的页面,越有可能被sogouspider丢弃。
4.sogouspider如何反应我网站上页面的更新?
5.如何让sogouspider不抓我的网站?
sogouspider支持robots协议,您可以在网站的根目录放置robots.txt。
6.为什么我的网站已经加了robots.txt,还能在搜狗搜索出来?
7.我希望我的网站内容被搜狗索引但不被保存快照,我该怎么做?
8.sogouspider会封锁那些网站?
作弊网站
内容低劣的网站
违反国家政策和法律的网站
9.如何让sogouspider解除对我网站的封锁?
1.如何让我的网站(独立网站或者blog)被搜狗收录?
搜狗会收录符合用户搜索体验的网站和网页。
搜狗的网页收录机制,只和网页价值有关,与搜狗推广等商业因素没有任何关联。
2.如何查看我的网站是否被搜狗收录?site语法看到的结果数是不是收录的真实数量?
站长常常会告知我们搜索结果不显示他们的网站,但其实这些网站仍然收录在搜索结果当中。要判断搜狗是否已经收录您的网站,可以通过执行site语法查看,直接在搜狗搜索框中输入site:您的域名,如site:www.sogou.com,如果可以查询到结果,那您的网站就已经被搜狗收录。site语法得到的搜索结果数,只是一个估算的数值,仅供参考。
3.如何让我的网页不被搜狗收录?
您可以设置一个Robots文件以限制您的网站全部网页或者部分目录下网页不被搜狗收录。
4.为什么我的网站内一些不设链接的私密性网页,甚至是需要访问权限的网页,也会被搜狗收录?
sogouspider对网页的抓取,是通过网页与网页之间的链接实现的。
网页之间的链接类型,除了站点内部的页面链接之外,还有不同网站之间的互相链接。因此,某些网页即便通过您的网站内部链接无法访问到,但是,如果别人的网站上有指向这些页面的链接,那么这些页面还是会被搜索引擎所收录。
搜狗Spider的访问权限,和普通用户是一样的。因此,普通用户没有权限访问的内容,Spider也没有权限访问。之所以看上去某些访问权限限制内容被搜狗收录,原因有两点:
A.该内容在Spider访问时是没有权限限制的,但抓取之后,内容的权限发生了变化。
B.该内容有权限限制,但是由于网站安全漏洞问题,导致用户可以通过某些特殊路径直接访问。而一旦这样的路径被公布在互联网上,则Spider就会循着这条路径抓出受限内容。
5.为什么我的网站收录数量越来越少?
您的网站所在的服务器不稳定,sogouspider在检查更新时抓取不到网页而被暂时去除。
您的网站不符合用户的搜索体验。
6.我的网页为什么会从搜狗搜索结果中消失?
搜狗并不允诺所有网页都可从搜狗搜索到。
A.您的网页不符合用户的搜索体验
B.您的网站所在服务器不稳定,被搜狗暂时性去除,稳定之后,问题会得到解决
C.您的网页内容有不符合国家法律和法规规定的地方
D.其他技术性问题
以下的说法是错误的和毫无根据的:
A.参与了搜狗推广但未续费,会从搜狗搜索结果中消失
C.与搜狗旗下网站产生了竞争,会从搜狗搜索结果中消失
D.从搜狗获得的流量太大,会从搜狗搜索结果中消失
7.什么样的站点会受到搜狗欢迎?
站点应该是面向用户的,而不是面向搜索引擎的。一个受到用户欢迎的站点,最终也会受到搜索引擎欢迎;反过来,如果你的站点做了很多针对搜狗的优化,但却给用户带来大量负面体验,那么,你的站点最终肯定会受到搜狗的处罚。
搜狗更喜欢有原创内容的网页,而不是简单抄袭和采集互联网上已有内容的网页。对于已经被重复了千百遍的内容,搜狗可能会不予收录。
A.对方的站点在他那个领域是否是高质量的?站长间所谓的流量以及排名,很多都是用欺骗手段获取的,无法保持长久。
B.对方要求的链接名称是否和对方网站地位相称?用一个涵盖范围广泛的关键词来做一个内容非常局限的网站的链接名称,很可能会使你的网站受到负面影响。
经常保持内容更新。经常有新内容产生的站点,搜狗会注意到,并且大力欢迎,而且会频繁造访。
8.我的网站更新了,可是搜狗收录的内容还没更新怎么办?
9.为什么我的网站在搜狗收录的数量和其他搜索引擎相比相差很多?
通常情况下,这是正常的现象,不同的搜索引擎判断网页价值的算法不同。
搜狗的目标是为每个查询词返回最匹配的结果。搜索索引会随着互联网内容的增添或者修改不断发生变化,而且我们的排名算法也在实时更新,因此,搜索结果中网址的排名可能会发生变化。
如果您的网站已经和网络上其他网站建立起可靠的链接,那么,我们在下次抓取时便会再次添加您的网站,但是我们无法保证某一网页总是获得特定的良好的排名。
如果您网站在搜索结果中的排名与之前相比落差很大,请参考以下指南以确定问题:
A.查看您的robots.txt文件,检查您有没有拦截sogouspider访问自己网站上的任何网址或目录。
B.查看您的网站结构并确保其易于访问,大多数搜索引擎是基于文本的。如果您使用JavaScript、DHTML、图片或富媒体(例如Silverlight)来创建导航和链接,那么,sogouspider在抓取您的网站时可能会遇到问题。请确保您的内容是可以读取的文本内容,以便用户和sogouspider能够更加容易地对您的网站进行访问。
D.确保您的内容具有实用性。我们建议您仔细考虑如何尽可能为用户带来最佳的体验。
1.我的网站首页被收录了,但搜索网站名称却排不到第一位,怎么办?
2.搜索某关键词,我的网页在搜狗搜索结果的排序短期内变化剧烈,这正常吗?
通常情况下,这是正常的变化。一般来说,有三类原因导致排序发生变化:
A.特定关键词所涉及的您的网页发生了变化
B.特定关键词所涉及的其他网页发生了变化
C.搜狗的排序算法发生了变化
3.搜索某关键词,我的网页在搜狗的排序位置,和在其他搜索引擎的差异非常大,这正常吗?
通常情况下,这是正常的现象。因为不同搜索引擎的算法,都是不同的。
4.我请一些“SEO”来为我的网站或者网页做优化,会有什么后果?
5.竞争对手是否能够对我的网站排名照成负面影响?
6.sogouRank是什么?
www.sohu.com和sohu.com网页评级不一样:www.sohu.com和sohu.com是两个不同的URL,虽然他们可能指向同一个页面(也就是通常所说的重定向),但是他们本身可能具有不同的内涵,因此,www.sohu.com和sohu.com被作为不同的网页来评级的,以便给您推荐更核心更优质的页面。同时,这也提示您,在对外推广的时候,尽量使用一致的URL写法,以获得更高的网页评级。
如何提升网页评级:为了提高您的页面的评级,您需要努力提升页面品质,让更多同领域的高评级站点来链接您的页面。同时您需要慎用您的对外链接,尤其是对低质量站点的链接(如果链接到垃圾站点,将极有可能降低您的网页评级)。
更新频率:网页评级和链接数据每周自动更新一次。
1.搜狗对作弊网站的定义
作弊网站是指在网页设计中,为了提升网页在搜索引擎中的排序,设计者采用的一系列欺骗搜索引擎的做法,主要表现是普通用户看到的页面与搜索引擎抓取到的内容不一致。
A.隐藏文本或链接。在网页中插入了搜索引擎可识别但用户看不见的文本内容或链接。包括使用与背景色相同或十分接近的文本或链接文字、超小号文字、文字隐藏层、页面底部下出现的多余内容、滥用图片ALT等;
C.恶意互换链接。在网页中互相建立大量指向对方网站的链接。
D.欺骗性重定向、欺骗性更换网页内容。故意制造大量链接指向某一网址或者使用跳转域名欺骗用户进入与搜狗描述不相符的网站。
E.建立大量镜像网站。复制网站或网页的内容并分配以不同域名和服务器,欺骗搜索引擎对同一页面内容进行多次索引。
G.页面有链接指向作弊网站的,可能会被视为作弊网站。
2.搜狗对作弊网站的处罚
搜狗反作弊系统会实时监控作弊网站,并根据作弊等级对作弊网站进行相应的处罚。
常见处罚:降低网站在搜狗的整体排名;
一般处罚:仅索引正常网页比如首页,其他网页不予收录;
严厉处罚:包含非法内容及恶意程序、用户集中投诉的网站,搜狗将拒绝收录整个网站。
3.如何举报作弊网站
打击作弊网站,提升搜索品质,搜狗感谢您的参与!
4.如何申请解除处罚
解除处罚的网站一旦被发现再次作弊,将会受到更为严厉的处罚。
需要说明的是,搜狗技术和产品部门只对用户搜索体验负责。以下的说法都是错误的和毫无根据的:
B.我给搜狗若干钱,就可以重新被收录
C.我认识搜狗的某某人,就可以重新被收录
1.什么是网站“被黑”
2.如何知道是否“被黑”
A.分析系统日志、服务器日志,检查自己站点的页面数量、流量等是否有异常波动,是否存在异常访问或操作日志
B.检查网站文件是否有不正常的修改,尤其是首页等重点页面
C.网站页面是否引用了未知站点的资源(图片、JS等),是否被放置了外站的异常链接
D.检查网站是否有不正常增加的文件或目录
E.检查网站目录中是否有非管理员打包的网站源码、未知txt文件等
3.如何处理“被黑”
如果您的网站被黑或者感染了恶意软件,则应该迅速采取措施进行修复,搜狗建议您进行以下步骤:
避免问题扩大:
A.立即关停自己的网站以避免感染其他网站(如果您有权访问自己的服务器则最好将其配置为返回503状态代码);
B.与自己的网络托管商联系了解是否已经采取措施解决问题;
评估损失:
A.使用最新的扫描程序扫描您的计算机,找出任何可能由黑客添加的恶意代码。请务必扫描所有内容,而不是仅扫描基于文本的文件,因为恶意内容往往会嵌入图片中。
B.删除被黑的网页或网址。这样可防止系统向用户提供被黑的网页。
如果您还有其他网站,请检查它们是否也已被黑。
清理自己的网站:
申请解除屏蔽:
4.如何防止“被黑”
A.定期检查服务器日志等方式发现问题,检查是否有可疑的针对非前台页面的访问;
B.经常检查网站文件是否有不正常的修改或者增加;
D.修改开源程序关键文件的默认文件名,作弊者通常通过程序自动扫描某些特定的文件是否存在来判断是否使用了某套程序;
E.修改默认管理员用户名,提高管理后台的密码强度,使用字母、数字以及特殊符号多种组合的密码;
F.关闭不必要的服务以及端口;
G.关闭或者限制不必要的上传功能;
H.设置防火墙等安全措施;
I.若问题反复出现,建议重新安装服务器操作系统,并重新上传备份的网站文件;
J.缺乏专业维护人员的网站,建议向专业安全公司咨询;
网站已经更改,删除过时信息:
我想从搜索结果中彻底删除某个网页:
为确保永久删除您的内容,请进行以下某项操作。如果您没有进行相应操作,那么您的网站稍后可能会重新显示在搜索结果中。
A.如果网页已不存在,请确保服务器返回404(未找到)或410(不存在)。这样可让搜狗知道该网页已不存在,无需再在搜索结果中显示。
B.如果网页仍存在,但您不想让其显示在搜索结果中,请使用robots.txt阻止sogouspider进行抓取。请注意,在通常情况下,即使您已通过robots.txt禁止抓取某个网址,但如果我们在其他网站中发现该网址,仍会将相应网页编入索引。
此外,如果要从搜索结果中删除非HTML格式的文件(例如可下载的PDF),则您或网站站长应确保从服务器中删除该文件。
我想从搜索结果中删除整个网站或某个目录的内容:
如果您是网站拥有者,则需要在验证网站所有权后申请删除整个网站或目录。
为确保永久删除您的目录或网站,请使用robots.txt阻止抓取工具访问该目录(如果要删除的是网站,则应阻止抓取工具访问您的整个网站)。我们建议您在请求删除目录前或请求删除后不久执行该操作。否则,您的内容稍后可能会重新显示在搜索结果中。仅返回404HTTP状态代码还不够,因为可能出现这样一种情况:即某个目录返回了404状态代码,却仍然分发其中的文件。通过使用robots.txt禁止抓取目录,可确保将目录的所有子项也一并排除。
完成上述某步操作后,您就可以发出删除请求,从搜索结果中删除相应目录及其所有内容。
如果您不是网站拥有者,请通过网站联系网站管理员,要求他通过以上步骤进行删除。搜狗没有权利控制互联网中的内容。