网站打开全过程,从输入url到页面打开的过程

当我们开始在浏览器中输入网址的时候,浏览器其实就已经在智能的匹配可能得url了,他会从历史记录,书签等地方,找到已经输入的字符串可能对应的url,然后给出智能提示,让你可以补全url地址。对于google的chrome的浏览器,他甚至会直接从缓存中把网页展示出来,就是说,你还没有按下enter,页面就出来了。

1、请求一旦发起,浏览器首先要做的事情就是解析这个域名,一般来说,浏览器会首先查看本地硬盘的hosts文件,看看其中有没有和这个域名对应的规则,如果有的话就直接使用hosts文件里面的ip地址。

3、查询你输入的网址的DNS请求到达本地DNS服务器之后,本地DNS服务器会首先查询它的缓存记录,如果缓存中有此条记录,就可以直接返回结果,此过程是递归的方式进行查询。如果没有,本地DNS服务器还要向DNS根服务器进行查询。

4、根DNS服务器没有记录具体的域名和IP地址的对应关系,而是告诉本地DNS服务器,你可以到域服务器上去继续查询,并给出域服务器的地址。这种过程是迭代的过程。

5、本地DNS服务器继续向域服务器发出请求,在这个例子中,请求的对象是.com域服务器。.com域服务器收到请求之后,也不会直接返回域名和IP地址的对应关系,而是告诉本地DNS服务器,你的域名的解析服务器的地址。

6、最后,本地DNS服务器向域名的解析服务器发出请求,这时就能收到一个域名和IP地址对应关系,本地DNS服务器不仅要把IP地址返回给用户电脑,还要把这个对应关系保存在缓存中,以备下次别的用户查询时,可以直接返回结果,加快网络访问。

下面这张图很完美的解释了这一过程:

1、递归解析

当局部DNS服务器自己不能回答客户机的DNS查询时,它就需要向其他DNS服务器进行查询。此时有两种方式,如图所示的是递归方式。局部DNS服务器自己负责向其他DNS服务器进行查询,一般是先向该域名的根域服务器查询,再由根域名服务器一级级向下查询。最后得到的查询结果返回给局部DNS服务器,再由局部DNS服务器返回给客户端。

2、迭代解析

我们在前面有说到根DNS服务器,域DNS服务器,这些都是DNS域名称空间的组织方式。按其功能命名空间中用来描述DNS域名称的五个类别的介绍详见下表中,以及与每个名称类型的示例

当一个网站有足够多的用户的时候,假如每次请求的资源都位于同一台机器上面,那么这台机器随时可能会蹦掉。处理办法就是用DNS负载均衡技术,它的原理是在DNS服务器中为同一个主机名配置多个IP地址,在应答DNS查询时,DNS服务器对每个查询将以DNS文件中主机记录的IP地址按顺序返回不同的解析结果,将客户端的访问引导到不同的机器上去,使得不同的客户端访问不同的服务器,从而达到负载均衡的目的例如可以根据每台机器的负载量,该机器离用户地理位置的距离等等。

请求方法URI协议/版本

请求头(RequestHeader)

请求正文

下面是一个完整的HTTP请求例子:

GET/sample.jspHTTP/1.1Accept:image/gif.image/jpeg,*/*Accept-Language:zh-cnConnection:Keep-AliveHost:localhostUser-Agent:Mozila/4.0(compatible;MSIE5.01;WindowNT5.0)Accept-Encoding:gzip,deflateusername=jinqiao&password=1234注意:最后一个请求头之后是一个空行,发送回车符和换行符,通知服务器以下不再有请求头。

1.请求的第一行是“方法URL议/版本”:GET/sample.jspHTTP/1.1

2.请求头(RequestHeader)

Accept:image/gif.image/jpeg.*/*Accept-Language:zh-cnConnection:Keep-AliveHost:localhostUser-Agent:Mozila/4.0(compatible:MSIE5.01:WindowsNT5.0)Accept-Encoding:gzip,deflate.3.请求正文请求头和请求正文之间是一个空行,这个行非常重要,它表示请求头已经结束,接下来的是请求正文。请求正文中可以包含客户提交的查询字符串信息:

username=jinqiao&password=1234—知识扩展—1.TCP三次握手第一次握手:客户端A将标志位SYN置为1,随机产生一个值为seq=J(J的取值范围为=1234567)的数据包到服务器,客户端A进入SYN_SENT状态,等待服务端B确认;

第二次握手:服务端B收到数据包后由标志位SYN=1知道客户端A请求建立连接,服务端B将标志位SYN和ACK都置为1,ack=J+1,随机产生一个值seq=K,并将该数据包发送给客户端A以确认连接请求,服务端B进入SYN_RCVD状态。

第三次握手:客户端A收到确认后,检查ack是否为J+1,ACK是否为1,如果正确则将标志位ACK置为1,ack=K+1,并将该数据包发送给服务端B,服务端B检查ack是否为K+1,ACK是否为1,如果正确则连接建立成功,客户端A和服务端B进入ESTABLISHED状态,完成三次握手,随后客户端A与服务端B之间可以开始传输数据了。

如图所示:

《计算机网络》第四版中讲“三次握手”的目的是“为了防止已失效的连接请求报文段突然又传送到了服务端,因而产生错误”

假设不采用“三次握手”,那么只要server发出确认,新的连接就建立了。由于现在client并没有发出建立连接的请求,因此不会理睬server的确认,也不会向server发送数据。但server却以为新的运输连接已经建立,并一直等待client发来数据。这样,server的很多资源就白白浪费掉了。采用“三次握手”的办法可以防止上述现象发生。例如刚才那种情况,client不会向server的确认发出确认。server由于收不到确认,就知道client并没有要求建立连接。”。主要目的防止server端一直等待,浪费资源。

第一次挥手:Client发送一个FIN,用来关闭Client到Server的数据传送,Client进入FIN_WAIT_1状态。

第二次挥手:Server收到FIN后,发送一个ACK给Client,确认序号为收到序号+1(与-SYN相同,一个FIN占用一个序号),Server进入CLOSE_WAIT状态。

第三次挥手:Server发送一个FIN,用来关闭Server到Client的数据传送,Server进入LAST_ACK状态。

第四次挥手:Client收到FIN后,Client进入TIME_WAIT状态,接着发送一个ACK给Server,确认序号为收到序号+1,Server进入CLOSED状态,完成四次挥手。

这是因为服务端在LISTEN状态下,收到建立连接请求的SYN报文后,把ACK和SYN放在一个报文里发送给客户端。而关闭连接时,当收到对方的FIN报文时,仅仅表示对方不再发送数据了但是还能接收数据,己方也未必全部数据都发送给对方了,所以己方可以立即close,也可以发送一些数据给对方后,再发送FIN报文给对方来表示同意现在关闭连接,因此,己方ACK和FIN一般都会分开发送。

301和302状态码都表示重定向,就是说浏览器在拿到服务器返回的这个状态码后会自动跳转到一个新的URL地址,这个地址可以从响应的Location首部中获取(用户看到的效果就是他输入的地址A瞬间变成了另一个地址B)——这是它们的共同点。

他们的不同在于。301表示旧地址A的资源已经被永久地移除了(这个资源不可访问了),搜索引擎在抓取新内容的同时也将旧的网址交换为重定向之后的网址;

302表示旧地址A的资源还在(仍然可以访问),这个重定向只是临时地从旧地址A跳转到地址B,搜索引擎会抓取新的内容而保存旧的网址。SEO302好于301

网站调整(如改变网页目录结构);

网页被移到一个新地址;

网页扩展名改变(如应用需要把.php改成.Html或.shtml)。

这种情况下,如果不做重定向,则用户收藏夹或搜索引擎数据库中旧地址只能让访问客户得到一个404页面错误信息,访问流量白白丧失;再者某些注册了多个域名的网站,也需要通过重定向让访问这些域名的用户自动跳转到主站点等。

当一个网站或者网页24—48小时内临时移动到一个新的位置,这时候就要进行302跳转,而使用301跳转的场景就是之前的网站因为某种原因需要移除掉,然后要到新的地址访问,是永久性的。

清晰明确而言:使用301跳转的大概场景如下:

域名到期不想续费(或者发现了更适合网站的域名),想换个域名。

在搜索引擎的搜索结果中出现了不带www的域名,而带www的域名却没有收录,这个时候可以用301重定向来告诉搜索引擎我们目标的域名是哪一个。

空间服务器不稳定,换空间的时候。

后端从在固定的端口接收到TCP报文开始,它会对TCP连接进行处理,对HTTP协议进行解析,并按照报文格式进一步封装成HTTPRequest对象,供上层使用。

一些大一点的网站会将你的请求到反向代理服务器中,因为当网站访问量非常大,网站越来越慢,一台服务器已经不够用了。于是将同一个应用部署在多台服务器上,将大量用户的请求分配给多台机器处理。

此时,客户端不是直接通过HTTP协议访问某网站应用服务器,而是先请求到Nginx,Nginx再请求应用服务器,然后将结果返回给客户端,这里Nginx的作用是反向代理服务器。同时也带来了一个好处,其中一台服务器万一挂了,只要还有其他服务器正常运行,就不会影响用户使用。

通过Nginx的反向代理,我们到达了web服务器,服务端脚本处理我们的请求,访问我们的数据库,获取需要获取的内容等等,当然,这个过程涉及很多后端脚本的复杂操作。由于对这一块不熟,所以这一块只能介绍这么多了。

客户端本来可以直接通过HTTP协议访问某网站应用服务器,网站管理员可以在中间加上一个Nginx,客户端请求Nginx,Nginx请求应用服务器,然后将结果返回给客户端,此时Nginx就是反向代理服务器。

经过前面的6个步骤,服务器收到了我们的请求,也处理我们的请求,到这一步,它会把它的处理结果返回,也就是返回一个HTPP响应。

HTTP响应与HTTP请求相似,HTTP响应也由3个部分构成,分别是:

状态行

响应头(ResponseHeader)

响应正文

格式:HTTP-VersionStatus-CodeReason-PhraseCRLF例如:HTTP/1.1200OK

状态描述:状态描述给出了关于状态代码的简短的文字描述。比如状态代码为200时的描述为ok

状态码:状态代码由三位数字组成,第一个数字定义了响应的类别,且有五种可能取值,如下:

1xx:信息性状态码,表示服务器已接收了客户端请求,客户端可继续发送请求。

100Continue

101SwitchingProtocols

2xx:成功状态码,表示服务器已成功接收到请求并进行处理。

200OK表示客户端请求成功

204NoContent成功,但不返回任何实体的主体部分

206PartialContent成功执行了一个范围(Range)请求

3xx:重定向状态码,表示服务器要求客户端重定向。

301MovedPermanently永久性重定向,响应报文的Location首部应该有该资源的新URL

302Found临时性重定向,响应报文的Location首部给出的URL用来临时定位资源

303SeeOther请求的资源存在着另一个URI,客户端应使用GET方法定向获取请求的资源

304NotModified服务器内容没有更新,可以直接读取浏览器缓存

307TemporaryRedirect临时重定向。与302Found含义一样。302禁止POST变换为GET,但实际使用时并不一定,307则更多浏览器可能会遵循这一标准,但也依赖于浏览器具体实现

4xx:客户端错误状态码,表示客户端的请求有非法内容。

400BadRequest表示客户端请求有语法错误,不能被服务器所理解

403Forbidden表示服务器收到请求,但是拒绝提供服务,通常会在响应正文中给出不提供服务的原因

404NotFound请求的资源不存在,例如,输入了错误的URL

5xx:服务器错误状态码,表示服务器未能正常处理客户端的请求而出现意外错误。

500InternelServerError表示服务器发生不可预期的错误,导致无法完成客户端的请求

响应头部:由关键字/值对组成,每行一对,关键字和值用英文冒号”:”分隔,典型的响应头有:

包含着我们需要的一些具体信息,比如cookie,html,image,后端返回的请求数据等等。这里需要注意,响应正文和响应头之间有一行空格,表示响应头的信息到空格为止,下图是fiddler抓到的请求正文,红色框中的:响应正文:

在浏览器没有完整接受全部HTML文档时,它就已经开始显示这个页面了,浏览器是如何把页面呈现在屏幕上的呢?不同浏览器可能解析的过程不太一样,这里我们只介绍webkit的渲染过程,下图对应的就是WebKit渲染的过程,这个过程包括:

解析html以构建dom树->构建render树->布局render树->绘制render树

浏览器在解析html文件时,会”自上而下“加载,并在加载过程中进行解析渲染。在解析过程中,如果遇到请求外部资源时,如图片、外链的CSS、iconfont等,请求过程是异步的,并不会影响html文档进行加载。

解析过程中,浏览器首先会解析HTML文件构建DOM树,然后解析CSS文件构建渲染树,等到渲染树构建完成后,浏览器开始布局渲染树并将其绘制到屏幕上。这个过程比较复杂,涉及到两个概念:reflow(回流)和repain(重绘)。

DOM节点中的各个元素都是以盒模型的形式存在,这些都需要浏览器去计算其位置和大小等,这个过程称为relow;当盒模型的位置,大小以及其他属性,如颜色,字体,等确定下来之后,浏览器便开始绘制内容,这个过程称为repain。

页面在首次加载时必然会经历reflow和repain。reflow和repain过程是非常消耗性能的,尤其是在移动设备上,它会破坏用户体验,有时会造成页面卡顿。所以我们应该尽可能少的减少reflow和repain。

当文档加载过程中遇到js文件,html文档会挂起渲染(加载解析渲染同步)的线程,不仅要等待文档中js文件加载完毕,还要等待解析执行完毕,才可以恢复html文档的渲染线程。因为JS有可能会修改DOM,最为经典的document.write,这意味着,在JS执行完成前,后续所有资源的下载可能是没有必要的,这是js阻塞后续资源下载的根本原因。所以我明平时的代码中,js是放在html文档末尾的。

其实这个步骤可以并列在步骤8中,在浏览器显示HTML时,它会注意到需要获取其他地址内容的标签。这时,浏览器会发送一个获取请求来重新获得这些文件。比如我要获取外图片,CSS,JS文件等

这些地址都要经历一个和HTML读取类似的过程。所以浏览器会在DNS中查找这些域名,发送请求,重定向等等…

不像动态页面,静态文件会允许浏览器对其进行缓存。有的文件可能会不需要与服务器通讯,而从缓存中直接读取,或者可以放到CDN中

超级蜘蛛查网站仅提供域名或网站等基础信息批量查询服务,使用本工具从事的任何行为均不代表本站的意志,与本站立场无关。

THE END
1.已完成网页自动跳转其他网站Linux面板问题描述:刚刚设置好的宝搭面板,现在绑定有二个网站。不加证书ssl可以正常访问到页面,在网站前面加了https://www.bt.cn/bbs/thread-141243-1-3.html
2.点击链接,结果跳转到另外一个网页fpc点击链接,结果跳转到另外一个网页 问题描述:点击一个网站的链接,打开新页面结果跳转到垃圾广告页面 ,点击企业官网后,并没有跳转到企业官网,而是跳转到一个澳门赌场的页面,但是直接在浏览器输入网址访问是可以正常访问的。 经过排查发现是,企业官网被注入了一段js代码,点击查看源代码截图如下:https://www.cnblogs.com/fpcing/p/7650991.html
3.浏览器打开网页后总是自动跳转到另一个网站求解决浏览器打开网页后总是自动跳转到另一个网站求解决: 当您在使用浏览器打开网页时,如果总是自动跳转到另一个网站,这通常是由于浏览器设置问题、恶意软件或广告插件等引起的。为了解决这一问题,您可以尝试以下几种方法:1. 检查浏览器设置:请确保您的浏览器设置没有错误https://www.autocms.cn/a/sdlm5v9d.html
4.打开网页一直被跳转到另外一个网站是怎样回事2. 清除浏览器缓存:有时候浏览器缓存中的文件会导致页面被误判跳转到其他网站。清除浏览器缓存可以解决https://ask.zol.com.cn/x/25569200.html
5.excel链接到另一个sheet页excel链接怎么自动跳转网页插入链接是excel中非常实用的一个功能,只需要点击链接字符,就能打开外部的网页、文件夹或其他的sheet表格。链接在简化表格展示空间的同时,还能够添加丰富的数据信息。今天,小编就以excel链接到另一个sheet页,excel链接怎么自动跳转网页这两个问题为例,向大家科普一下,excel中链接功能的使用方法。 https://www.officesoftcn.com/excel/office-uaishr.html
6.使用华为浏览器打开一个网页就会跳转到一个应用界面?A.我们要坚决改善社会治安,治理脏乱环境,创建更多的文明城镇。 B.我们如不搞改革、不坚持开放政策我们的战略目标就不可能实现。这是一个我们必须通过的关。 C.我们要形成我市独特的经济开发格局:旅游搭台,经贸唱戏。 D.我们要积极鼓励社会力量办学,以调动各方面的办学积极性。We should develop our city'https://www.shuashuati.com/ti/affa7231914449efb468831af7fe2dc4.html
7.电脑启动时自动跳转至网页游戏广告界面(电脑开机自动打开网页游戏)2、网站被劫持,设置了网站跳转。具体原因网站做了跳转,直接从原网页跳转到另外一个网页。网站被人种了木马,自动跳转到其他网页。电脑中了木马,木马使你打开的网页跳转到另外的网页。解决的方法:打开浏览器设置选项,清空用户的缓存文件和cookies。 3、第一考虑是否有修改web.config文件自动跳转,如果不是就考虑是被黑了https://www.kangle.im/post/31579.html
8.手机开网页总是跳转到别的页面(解决手机浏览器跳转问题)癞蛤蟆问题手机开网页总是跳转到别的页面怎么办? 这个问题可能是由于浏览器被恶意软件感染或者设置不当而导致的。以下是一些可能的解决方法 1. 清理浏览器缓存和历史记录 有时候浏览器缓存或者历史记录中会留下一些问题,清理浏览器缓存和历史记录可能会解决这个问题。在手机浏览器的设置中找到“清除缓存”和“清除历史记录”https://new.91laihama.com/taobaozx/61672.html
9.已解决:一打开网页就跳转另一个网站怎么办?网址访问时发生跳转,一般有两类情况,一类是程序设置不当,另一类是黑客恶意攻击。对于不同的情况,需要采取不同的措施予以解决。阿里云北京分销伙伴万维景盛小编为您分享一打开网页就跳转另一个网站怎么办的具体方法。 第一类情况,需要检查网站域名是否解析正确,错误的解析可能导致域名指向了错误的服务器,在错误的服务器https://www.wanweiwang.cn/FAQ/view/1078.html
10.a标签跳转到另一个页面?Worktile社区本文将详细介绍HTML中的标签以及如何使用它来跳转到另一个页面。我们将重点讨论以下三个方面:1、标签的基本概念和属性;2、使用标签实现页面跳转的具体示例;3、标签的一些常见用法和注意事项。在示例部分,我们将展示如何通过设置href属性来创建链接,并实现从一个页面跳转到另一个页面。 1、标签的基本概念和https://worktile.com/kb/p/64624
11.网页打开自动跳转另一个网页怎么办网页劫持怎么解决为什么打开一个新网页,却不能跳转到新打开的网页,还要自己动手在按上面的标签才能,十分不便,小编以兼容性好的360浏览器为例,教大家设置选项,解决这个问题。 在JSP中使用jsp forward Action来实现页面的跳转功能。 语法:jsp:forward page={relativeURL|%= expression %}/ 或jsp:forward page={relativeURL|%= exprehttps://blog.itpub.net/69989348/viewspace-2743653/
12.JavaScript打开URLjavascript打开另一个网页并输入JavaScript打开URL javascript打开另一个网页并输入 在WEB页面中,我们实现页面跳转的方法通常是用LINK,BUTTON LINK ,IMG LINK等等,由用户点击某处,然后直接由浏览器帮我们跳转。 但有时候,需要当某事件触发时,我们先做一些操作,然后再跳转,这时,就要用JAVASCRIPT来实现这一跳转功能。https://blog.51cto.com/u_16099226/9242892
13.火狐保存的网页标签在被打开时跳转到了一个不知名的网页CSDN问答为您找到火狐保存的网页标签在被打开时跳转到了一个不知名的网页相关问题答案,如果想了解更多关于火狐保存的网页标签在被打开时跳转到了一个不知名的网页 web安全 技术问题等相关问答,请访问CSDN问答。https://ask.csdn.net/questions/7503519
14.网站优化步骤和技巧,怎么做网站SEO的方法?(2024更新)7. 开启图片格式(Webp)转化,压缩图片,提高网页加载速度 8. 安装网站SSL证书,从Http跳转到Https 9. 设置好网站地图和robots.txt文件 谷歌技术SEO主要是在建站阶段,确保我们能拥有一个符合谷歌SEO标准的网站架构,这是一个优秀外贸网站的基础。这里有更详细的如何做好外贸网站的技巧:外贸建站指南:10步搭建优秀外贸网站https://www.globalsir.com/blog_detail.php?id=134
15.关于PDF里面总是弹出网页的解决办法第一篇:关于PDF里面总是弹出网页的解决办法 我们总是遇到打开PDF就总自动弹出网页,甚至看着就会弹出网页,非常的讨厌,那是因为PDF设置了允许访问网址,我也是出现此情况,所以百度里面去搜但是发现没有找到答案,所以就自己动手解决了,以下是我的解决方案。1:首先打开编辑=》首选项https://www.wendangwuyou.com/meiwen/syw/87279.html
16.域名怎么跳转到另外一个网站?常见网页跳转方法和特点对比网站运营过程中经常有一个网页跳转另外一个网页,一个域名跳转另外一个域名的需求。本文给出以下几种不同的方法,并简要概括一下他们的特点和操作方法。 一、301/302重定向 在web server设置301/302重定向,可以实现域名和网页的跳转。表现为在浏览器地址栏输入一个网址,跳转到另外一个网址,是可以看到网址的变化的,https://www.jianshu.com/p/66fa72097b88
17.打开很多网页都直接跳转到一个小说网页关闭JavaScript后就不跳了IE不会跳转 就360会跳转 修复了也没用 有点时候白天不会跳转 但是绝大多数 都会跳到这个小http://bbs.360.cn/thread-16005970-1-1.html