CDN(Content Delivery Network)的缩写,是一种利用分布式节点技术,在全球部署服务器,即时地将网站、应用视频、音频等静态或动态资源内容分发到用户所在的最近节点,提高用户访问这些内容的速度和稳定性,降低网络拥塞和延迟,同时也能减轻源站的压力。提高网络或应用的可用性和安全型。
CDN的基本原理是将源站的内容分发到离用户最近的节点上进行缓存,并通过智能路由、负载均衡等技术来保证用户能够快速、稳定地访问到所需资源。CDN将源站与用户之间的网络传输距离缩短,通过多节点并行传输,从而显著降低了网络传输的延迟和带宽消耗。

考虑如下场景:
某部电视剧非常火爆,在某视频APP实现了1千万用户同时在线观看。如果大家观看的是1080p清晰度的视频(理论上需要4Mbps带宽),那么,累计需要的流量带宽是10,000,000×4Mbps=40,000,000Mbps=40Tbps。
对于优酷、爱奇艺这样的互联网视频内容提供商来说,这无疑是非常巨大的流量压力。我们普通计算机的网卡,是1Gbps的带宽。如果优酷有一台超级服务器,那么,这台超级服务器就需要4万块网卡,而且必须百分之百跑满速度,才能够实现这1千万用户的流畅观看。对于一些实力不够的服务商,或者突发流量陡增的情况,就会造成拥塞,从而导致卡顿和延时。有这么一个说法:当用户打开一个页面,等待超过4秒,他就会关闭这个页面。也就是说,这个用户就会流失。

CDN作为一项非常有效的缩短时延的技术,能够有效解决上述问题。
CDN就是采用更多的缓存服务器(CDN边缘节点),布放在用户访问相对集中的地区或网络中。当用户访问网站时,利用全局负载技术,将用户的访问指向距离最近的缓存服务器上,由缓存服务器响应用户请求。(有点像电商的本地仓)
CDN与镜像服务器的区别:
镜像服务器是源内容服务器的完整复制。
CDN是部分内容的缓存,智能程度更好。CND = 更智能的镜像 + 缓存 + 流量导流。
CDN的系统组成通常包含以下组件:
| 源服务器 (Origin Server) | 源服务器是存储网站内容的主要服务器。它存放着原始的网页、图像、视频和其他静态或动态文件。当内容发生更改时,源服务器会产生新的版本,并将其传递给 CDN。 |
| 边缘服务器 (Edge Server) | 边缘服务器是部署在全球各个地点的服务器节点,它们构成了 CDN 的基础架构。每个边缘服务器都存有一部分或全部的缓存内容,包括从源服务器获取到的静态文件副本。边缘服务器负责提供内容的分发和加速,向用户提供最接近的服务器节点。 |
| 负载均衡器 (Load Balancer) | 负载均衡器用于在多个边缘服务器之间均匀分配用户请求的流量。它根据不同算法(如轮询、最少连接等)将请求导向最优的边缘服务器,以实现负载均衡和高可用性。 |
| 缓存机制 | CDN 使用缓存机制来存储源服务器上的内容副本。当用户请求访问文件时,边缘服务器会尝试返回缓存中的副本,而不必每次都访问源服务器。这减少了对源服务器的负载,提高了响应速度和用户体验。 |
| DNS (Domain Name System) | DNS 解析用户请求的域名并将其映射到最近的边缘服务器。CDN 使用智能 DNS 解析技术,根据用户位置和网络条件来选择最优的边缘服务器。这确保用户能够通过最快的路径获取内容。 |
| 内容管理系统(Content Management System) | 内容管理系统用于管理和发布网站的内容。它可以与 CDN 集成,使更新的内容能够传递到 CDN,并在边缘服务器上进行缓存。 |
CDN的访问过程依赖于DNS的重定向技术,即将用户定向至地理位置上距离其最近的边缘CDN节点服务器上。用户首先向根DNS服务器发送域名解析请求,根DNS服务器向授权DNS服务器发送域名解析请求,请求中包含了根服务器的IP地址,当域名解析服务器/根DNS服务器接受到一个CNAME类的DNS记录,域名解析服务器会重定向到CDN节点网络层中的智能CDN域名服务器上,CDN域名服务器将进行一系列的智能解析操作,根据本地DNS域名解析服务器的IP地址,分析各个网络线路的拥堵情况和负载情况,将最适合的CDN节点服务器IP地址返还给根DNS服务器,用户接受到CDN节点的IP地址后,直接向CDN节点服务器发送请求获取网站内容。

具体步骤概括如下:
CDN的加速原理主要通过负载均衡、缓存机制、数据传输优化、动态加速技术和安全保障等方面来实现网络加速,提升用户的网络访问体验。
静态加速是指对网页中的静态资源(包括html文件、CSS文件、js文件、图片、flash动画等)进行CDN节点缓存,使得用户在访问网页中的静态资源时,调取CDN边缘节点缓存;在访问网页中的动态资源如asp、php、jsp等时从源站中调取,从而实现“动静分离”,达到加速的目的。“动静分离”的好处在于用户访问网站时,静态资源直接从离自己最近的CDN节点缓存中获取(具体架构见使用CDN后的访问),减少用户访问静态资源的时间,同时又降低源站服务器的带宽压力、静态资源访问压力。

通过CDN众多节点找到一条最快的路由,去源站点取数据从而达到对动态网站加速,再配合数据压缩技术,可以将动态网站的访问速度提高10倍甚至100倍。另外,动态网站的页面内容一般是由静态图片和动态文本混合组成,而静态图片将会被缓存到CDN节点的硬盘上,也能提高动态网站的访问速度。
动态加速是指CDN的DNS解析中通过动态链路探测,监控网络环境的变化,监控各地网络延迟,寻找到一条最稳定、最高效、最快速的路径,回源动态资源,从而实现动态资源(如asp、php、jsp等)加速。然后构成链路列表,绑定到DNS解析上,更新到CDN的本地域名服务器上。简单架构见下图所示。

CDN分为推拉两种方式,推是服务器将内容推到cdn节点上,拉是cdn在第一次接受请求的时候从服务器拉取资源进行响应并保存,当资源在cdn缓存之后,如果服务器上的资源发生变化,cdn节点是不会知道的,除非缓存时间到期重新拉取或者修改新资源的访问。
动态资源的话,一般都是无延迟的。静态对于 css 和 js 来说,建议在编译生成的阶段,为文件名加上时间戳。而且最好是在文件名里面,而不是 querystring 里面加。这是最方便的方案,因为一旦发生了更新,每次去取的一定是新文件,不涉及缓存刷新的问题
CDN 的主要作用是通过就近缓存、加速内容传输和提供全球分发网络,改善用户体验,减轻源服务器负载,并提供更高的网站可用性和保护。
降低成本:通过CDN可以降低带宽和服务器的成本,提高用户体验的同时,降低网站运营成本。
参考链接