• Web基础与HTTP协议


    目录

    一、域名概述

    1、域名和IP地址简介

    二、域名服务与注册

    1、域名

    2、域名服务

    3、域名注册

    三、网页的概念

    HTML概述

    标签

    四、Web概述

    Web1.0 vs Web2.0

    Web1.0

    Web2.0

    静态网页与动态网页

    1.静态网页

    2.动态网页

    3.动态网页语言

    五、HTTP协议概述

    1、HTTP协议简介

    两者对比:

    2、HTTP协议的版本

    HTTP1.0和HTTP1.1之间的区别

    3、HTTP请求格式

    GET方式

    POST 请求方式

    区别

    六、HTTP状态码

    HTTP常见状态码

    HTTP请求流程分析

    常见响应头


    一、域名概述

    1、域名和IP地址简介

    网络上交互是基于TCP/IP协议的,每个主机在逻辑上有一个唯一位置标识(地址),物理地址为NAC地址。
    为了保证地址唯一性,用户协议向特地的机构申请注册,分配IP地址网络中的地址有两套方案: IP地址系统、域名地址系统。
    而由于IP是由32位二进制数字标识,不方便记忆,所以、以IP地址为基础发展出了符号化地址来代替解决方案,也是是域名。

    • 域名的概念

      • IP地址不易记忆
    • 早期使用Hosts文件解析域名

        1. /etc/hosts#配置文件
        2. IP地址 主机名/域名 ……#组成Hosts文件
      • 主机名称重复

      • 主机维护困难

    • DNS (Domain Name System 域名系统)

      • 分布式的数据库
      • 有层次性地

    • 域名空间结构

      • 根域
      • net
      • 顶级域
        • 组织域
        • 国家/地区域名
    • 二级域名

    • FQDN=主机名.DNS后缀

    二、域名服务与注册

    1、域名

    标识一组主机并提供它们的有关信息的树形结构(主要确定了根在哪,就可以确定每个分支)

    根域:以".”为开始域名空间结构(从右往左看)根域位于域名空间最顶层,一般用一个".”表示。基础单位,除了根域其他都只有一个上级域,有o或多个子域,同层域不可重复的子域或域名

    顶级域:一般代表一种类型的组织机构或国家地区(主要有此两种类型构成),如net(网络公司)、com(商业)、org(民间团体组织)、edu(教育)、gov(政府)、mil(军事)、cn(中国)、jp(日本)、hk(中国香港)

    二级域:也叫子域用来标明顶级域内的一个特定的组织,国家顶级域下面的二级域名由国家网络部门统一管理,如 .cn顶级域名下面设置的二级域名: .com.cn、.net.cn、 .edu.cn …

    主机:主机位于域名空间最下层,就是一台具体的计算机,如

    www、mail、都是具体的计算机名字,可用www.sina.com.cn.、mail.sina.com.cn、来表示,这种表示方式称为FQDN(完全合格域名),也是这台主机在域名中的全名

    2、域名服务

    分布式,每台主机维护一个部分,保持和维护域名空间的程序,响应解析器的请求

    方向:解析端(客户端)向DNS服务器发出请求的设备

    3、域名注册

    • 域名注册是Internet中用于解决地址对应问题的一种方法
    • 遵循先申请先注册原则
    • 域名注册步骤

    三、网页的概念

    • 网页

      • 纯文本格式文件
      • 编写语言为HTML
      • 在用户的浏览器中被"翻译"成网页形式显示出来
    • 网站

      • 由一个一个页面构成的,是多个网页的结合体
    • 主页

      • 打开网站后出现的第一个网页称为网站主页(或首页)
    • 域名

      • 浏览网页时输入的网址
    • HTTP

      • 用来传输网页的通信协议
    • URL

      • 是一种万维网寻址系统
    • HTML

      • 用来编写网页的超文本标记语言
    • 超链接

      • 超链接是将网站中不同网页链接起来的功能
    • 发布

      • 将制作好的网页上传到服务器供用户访问的过程

    HTML概述

    • HTML超文本标记语言
      • Hyper Text Markup Language
      • 网页的"源码"
    • 浏览器:“解释和执行” HTML源码的工具

    HTML文档的结构

    • HTML网页
      • 头部部分
        • 标题部分
        • 主体部分
        • 网页内容,包括文本、图像等
    1. 我的第一个网页
    2. #标签内容
    3. #主题代码部分
    4. Hello World!

    标签

    标签描述
    title定义了文档的标题
    base定义了页面链接标签的默认链接地址
    link定义了一个文档和外部资源之间的关系
    meta定义了 HTML 文档中的元数据
    script定义了客户端的脚本文件
    style定义了 HTML 文档的样式文件
    table定义一个表格
    tr定义了表格中的一行
    td定义了表格中某一行的一列
    img定义了一个图像
    a定义了一个超链接
    p定义了一行
    br定义了换行
    font定义了字体

    四、Web概述

    • Web (World Wide Web)即全球广域网,也称为万维网
    • 一种分布式图形信息系统。
    • 建立在Internet上的一种网络服务

    Web1.0 vs Web2.0

    Web1.0

    • 以编辑为特征,网站提供给用户的内容是编辑处理后的,然后用户阅读
      网站提供的内容
    • 这个过程是网站到用户的单向行为

    Web2.0

    • 更注重用户的交互作用,用户既是网站内容的消费者(浏览者),也是
      网站内容的制造者
    • 加强了网站与用户之间的互动,网站内容基于用户提供,网站的诸多功
      能也由用户参与建设,实现了网站与用户双向的交流与
    • Web2.0特征
      • 用户分享、以兴趣为聚合点的社群、开放的平台,活跃的用户

    静态网页与动态网页

    1.静态网页

    在网站设计中,纯粹HTML格式的网页通常被称为"静态网页",静态网页是标准的HTML文件,它的文件扩展名是.htm、.html。静态网页是网站建设的基础,早期的网站一般都是由静态网页制作的。静态网页也可以出现各种动态的效果,如.GIF格式的动画、FLASH、滚动字幕等。这些"动态效果"只是视觉上的,与下面将要介绍的动态网页是不同的概念。

    2.动态网页

    所谓的动态网页,是指跟静态网页相对的一种网页编程技术。静态网页,随着HTML代码的生成,页面的内容和显示效果就基本上不会发生变化了一除非是修改页面代码。而动态网页则不然,页面代码虽然没有变,但是显示的内容却是可以随着时间、环境或者数据库操作的结果而发生改变的。动态网页URL的后缀不是.htm、.html、.shtml、.xml等静态网页的常见网页制作格式,而是以.aspx、.asp、.jsp、. php、.perl、.cgi等形式为后缀,并且在动态网页网址中有一个标志性的符号"?"。

    动态网页是基本的html语法规范与Java、PHP、C#等高级程序设计语言、数据库编程等多种技术的融合,以期实现对网站内容和风格的高效、动态和交互式的管理。因此,从这个意义上来讲,凡是结合了HTML以外的高级程序设计语言和数据库技术进行的网页编程技术生成的网页都是动态网页。

    3.动态网页语言

    早期的动态网页主要采用通用网关接口CGI (Common Gateway Interface) 技术,虽然CGI技术已经发展成熟而且功能强大,但由于编程困难、效率低下、修改复杂,所以有逐渐被新技术取代的趋势。

    五、HTTP协议概述

    1、HTTP协议简介

    ①HTTP(超文本传输协议HyperText Transfer Protocol)协议是互联网上应用最为广泛的一种网络协议,它是基于TCP协议的应用层传输协议,简单来说就是客户端和服务端进行数据传输的一种规则。

    ②HTTP/HTTPS是应用层上的协议,建立在传输层TCP之上,客户端通过与服务端进行TCP连接(三次握手),之后发送HTTP请求与接收HTTP响应都是通过访问Socket接口来调用TCP协议实现

    ③HTTP 是一种无状态 (stateless) 协议, HTTP协议本身不会对发送过的请求和相应的通信状态进行持久化处理(存储,保存)。这样做的目的是为了保持HTTP协议的简单性,从而能够快速处理大量的事务, 提高效率。然而,在许多应用场景中,我们需要保持用户登录的状态或记录用户购物车中的商品。由于HTTP是无状态协议,所以必须引入一些技术来记录管理状态,例如Cookie。

    ④cookie和session都为了实现的是http的短期的持久化(内存/缓存方式,查询快、效率比较高),cookie是缓存在用户端(client)浏览器中的(默认缓存一天),当下次客户端通过同一个浏览器访问客户端的时候,会优先读取cookie中的缓存信息,向服务端进行请求,同时服务端收到客户端请求的时候,读取到cookie文件,知道客户端之前找的是服务器A处理的任务,为了省事儿,省资源,干脆直接讲请求直接再交给服务器A处理。

    两者对比:

    • cookie 省服务器性能
    • session 更安全 

    2、HTTP协议的版本

    HTTP 0.9已过时

    HTTP 1.0(完善的请求、响应模型 并且协议补充(完整) get post head方法)

    HTTP 1.1(新增五种请求方式:OPTIONS PUT DELETE TRACE CONNECT)

    HTTP 2.0

    HTTP1.0和HTTP1.1之间的区别

    缓存处理

    在HTTP1.0中主要使用header里的If-Modified-Since,Expires来做为缓存判断的标准,HTTP1.1则引入了更多的缓存控制策略例如Entity tag,If-Unmodified-Since, If-Match, If-None-Match等更多可供选择的缓存头来控制缓存策略。

    带宽优化及网络连接的使用

    HTTP1.0中,存在一些浪费带宽的现象,例如客户端只是需要某个对象的一部分,而服务器却将整个对象送过来了,并且不支持断点续传功能,HTTP1.1则在请求头引入了range头域,它允许只请求资源的某个部分,即返回码是206(Partial Content),这样就方便了开发者自由的选择以便于充分利用带宽和连接

    错误通知的管理

    在HTTP1.1中新增了24个错误状态响应码,如409(Conflict)表示请求的资源与资源的当前状态发生冲突;410(Gone)表示服务器上的某个资源被永久性的删除

    Host头处理

    在HTTP1.0中认为每台服务器都绑定一个唯一的IP地址,因此,请求消息中的URL并没有传递主机名(hostname)。但随着虚拟主机技术的发展,在一台物理服务器上可以存在多个虚拟主机(Multi-homed Web Servers),并且它们共享一个IP地址。HTTP1.1的请求消息和响应消息都应支持Host头域,且请求消息中如果没有Host头域会报告一个错误(400 Bad Request)

    长连接

    HTTP 1.1支持长连接(PersistentConnection)和请求的流水线(Pipelining)处理,在一个TCP连接上可以传送多个HTTP请求和响应,减少了建立和关闭连接的消耗和延迟,在HTTP1.1中默认开启Connection: keep-alive,一定程度上弥补了HTTP1.0每次请求都要创建连接的缺点

    3、HTTP请求格式

    GET方式

    ① 请求行

    请求的方式
    请求的资源路径
    请求的版本协议号

    ② 请求头(描述信息/标准化信息)

    1. Accept:客户端可以接受的数据类型
    2. Accept-Language:客户端可以接受的语言类型
    3. User-Agent:浏览器的信息
    4. Accpect-Encoding:客户端可以接受的编码格式
    5. Host:表示请求的ip和端口号
    6. Connection:告诉服务器请求连接如何处理
    7. Keep-Alive:通知服务器回传数据不要马上关闭,保持一小段的连接
    8. Closed:马上关闭

    POST 请求方式

    ① 请求行

    请求的方式
    请求的资源路径
    请求的协议的版本号

    ② 请求头

    1. Accept:客户端可以接受的数据类型
    2. Accept-Language:客户端可以接受的语言类型
    3. Referer:表示请求发起时,浏览器地址栏中的地址
    4. User-Agent:浏览器的信息
    5. Content-Type:发送的数据类型
    6. Content-Length:发送的数据长度

    ③ 请求体

    就是发送给服务器的数据

    区别

    区别一:语义上的区别

    Get向服务器请求数据,依照HTTP协议,get 是用来请求数据。

    Post向服务器发数据,依照HTTP协议,Post的语义是向服务器添加数据,也就是说按照Post的语

    义,该操作是会修改服务器上的数据

    区别二:服务器请求的区别

    Get请求是可以被缓存,示例:访问百度,访问的方式就是GET,此时访问后的内容会缓被存在浏览器中,短时间再次访问,其实是拿到的浏览器中的缓存内容

    另外Get请求只能接收ASCII码的回复

    Post请求是不可以被缓存的。对于Post方式提交表单,刷新页面浏览器会弹出提示框“是否重新提交表单”,Post可以接收二进制等各种数据形式,所以如果要上传文件一般用Post请求

    区别三:参数放请求头和请求体的差别

    Get请求通常没有请求体(当然这也是可以由程序猿心情改变的),在TCP传输中只需传输一次(而不是一个包),所以Get请求效率相对高。

    Post请求将数据放在请求体中,而实际传输中,会先传输完请求头,再传输请求体,是分为两次传输的(而不是两个包)。Post请求头会比Get更小(一般不带参数),请求头更容易在一个TCP包中完成传输,更何况请求头中有Content-Length的标识,可以更好地保证Http包的完整性。

    六、HTTP状态码

    HTTP状态码(HTTP Status Code) 是用以表示网页服务器HTTP 响应状态的3位数字代码,当浏览器请求某一URL时,服务器根据处理情况返回相应的处理状态。
    通常正常的状态码为2xx,3xx (如200),如果出现异常会返回4xx,5xx (如404)

    状态码首部已定义范围分类
    1xx100-101信息提示
    2xx200-206成功
    3xx300-305重定向
    4xx400-415客户端错误
    5xx500-505服务器错误

    HTTP常见状态码

    状态码功能描述
    200一切正常
    301永久重定向
    302临时重定向
    401用户名或PASSWD错误
    403禁止访问(客户端IP地址被拒绝)
    404请求文件不存在
    414请求URI头部过长
    500服务器内部错误
    502无效网关
    503当前服务不可用
    504网关请求超时

    HTTP请求流程分析

    用户在浏览器输入URL访问时,发起HTTP请求报文,请求中包括请求行、请求头、请求体,服务器收到请求后返回响应报文,包括状态行、响应头、响应体。

    常见响应头

    响应头描述
    Server服务器应用程序软件的名称和版本
    Content-Type响应正文的类型(是图片还是二进制字符串)
    Content-Length响应正文长度
    Content-Charset响应正文使用的编码
    Content-Encoding响应正文使用的数据压缩格式
    Content-Language响应正文使用的语言

  • 相关阅读:
    Mysql Innodb Cluster集群搭建 - docker
    机器学习实训(4)——支持向量机(补充)
    01.bpmn-js 样例项目解析-启动
    操作系统拾遗(奇数篇)
    Scala003--Scala中的运算符及注释
    07.数据持久化之文件操作
    matlab 最小二乘拟合平面并与XOY平面对齐
    BCG ribbon简单使用(1)
    Linux系统安装MongoDB流程
    开放式运动耳机排行榜,盘点五款最适合入手的运动耳机
  • 原文地址:https://blog.csdn.net/weixin_71429839/article/details/126463455