• 聊一聊 tcp/ip 在.NET故障分析的重要性


    一:背景

    1. 讲故事

    这段时间分析了几个和网络故障有关的.NET程序之后,真的越来越体会到计算机基础课的重要,比如 计算机网络 课,如果没有对 tcpip协议 的深刻理解,解决这些问题真的很难,因为你只能在高层做黑盒测试,你无法看到 tcp 层面的握手和psh通讯。

    这篇我们通过两个小例子来理解一下 tcp 协议在故障分析中的作用。

    二:tcp协议的两个小例子

    1. 程序突然大量超时

    这个故事起源于一位朋友遇到的问题:

    起初程序跑的一直都是好好的,但会有偶发性突然无法访问,奇怪的是在故障时手工访问域名时又是正常的,后面又莫名奇怪的好了,请问这是怎么回事?

    这种问题朋友虽然抓了dump,但在dump中寻找问题很难,因为大概率是在 http 通讯中出了问题,需要用类似 wireshark 去做流量监控,最后发现的原因是代理服务器偶发的抽风,导致 C# 的 HttpClient 无法访问。

    为了方便演示,这里用一段简单的测试代码。

    1. WebAPI 代码

    创建一个 WebApi 骨架代码,然后部署 Windows 虚拟机上。

    
    
            [HttpGet]
            public IEnumerable Get()
            {
                return Enumerable.Range(1, 5).Select(index => new WeatherForecast
                {
                    Date = DateTime.Now.AddDays(index),
                    TemperatureC = Random.Shared.Next(-20, 55),
                    Summary = Summaries[Random.Shared.Next(Summaries.Length)]
                })
                .ToArray();
            }
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14

    并且在 appsetttings.json 中配置对外端口为 80。

    
    {
      "Logging": {
        "LogLevel": {
          "Default": "Information",
          "Microsoft.AspNetCore": "Warning"
        }
      },
      "Kestrel": {
        "Endpoints": {
          "Http": {
            "Url": "http://0.0.0.0:80"
          }
        }
      }
    }
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    1. Client 的 HttpClient

    这里面我用 hosts 做了虚拟机 192.168.25.133 myproxy.com 的映射,然后通过域名的方式访问。

    
        internal class Program
        {
            public static HttpClient client = new HttpClient(new HttpClientHandler()
            {
                Proxy = new WebProxy("http://myproxy.com")
            });
    
            static async Task Main(string[] args)
            {
                for (int i = 0; i < 100000; i++)
                {
                    try
                    {
                        // 发送 GET 请求
                        HttpResponseMessage response = await client.GetAsync("http://youtube.com/WeatherForecast");
    
                        // 检查响应状态码
                        response.EnsureSuccessStatusCode();
    
                        // 读取响应内容
                        string responseBody = await response.Content.ReadAsStringAsync();
    
                        // 输出响应内容
                        Console.WriteLine(responseBody);
    
                        await Task.Delay(1000);
                    }
                    catch (HttpRequestException e)
                    {
                        Console.WriteLine($"{DateTime.Now} HTTP 请求异常:{e.Message} {e.GetType().Name}");
                    }
                }
    
            }
        }
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37

    打开 wireshark 进行流量监听,将程序运行起来,发现一切都是那么太平,截图如下:

    由于某些原因,代理服务器出了问题,这里用 关闭的方式来模拟,再次观察 wireshark 可以发现,没有收到服务器对154号包的响应,client 这边根据 RTO=1s 进行重试。

    2. DNS解析到的IP无法访问

    有些朋友程序出现了卡死,原因在于设置了很长的 Timeout,这种 Timeout 挺有意思,域名能够通过 DNS 解析到 IP,但 IP 无法被访问到,导致 client 这边在不断的重试,直到 timeout 的时限到时抛出异常。

    接下来还是用 HttpClient 做一个小例子,直接访问 youtube.com ,参考如下代码:

    
    static async Task Main(string[] args)
            {
                HttpClient client = new HttpClient();
    
                for (int i = 0; i < 100000; i++)
                {
                    try
                    {
                        // 发送 GET 请求
                        HttpResponseMessage response = await client.GetAsync("http://youtube.com");
    
                        // 检查响应状态码
                        response.EnsureSuccessStatusCode();
    
                        // 读取响应内容
                        string responseBody = await response.Content.ReadAsStringAsync();
    
                        // 输出响应内容
                        Console.WriteLine(responseBody);
    
                        await Task.Delay(1000);
                    }
                    catch (HttpRequestException e)
                    {
                        Console.WriteLine($"{DateTime.Now} HTTP 请求异常:{e.Message} {e.GetType().Name}");
                    }
                }
            }
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30

    打开 wireshark 启动监控,然后将程序运行起来,截图如下:

    从卦中可以看到 client 发起了一个 DNS 查询,DNS服务器查询到 youtube.com 所对应的 IP 是 104.244.46.85,接下来应该就是 client 对这个 ip 发起 握手请求,截图如下:

    从图中信息看,真的很尬尴,有如下两点信息:

    • client 发起了 SYN 请求,结果没人鸟它,没人鸟主要是因为路径上的防火墙把这个 SYN ACK 给没收了。

    • client 端按照 1s,2s,4s,8s 的RTO计时器超时进行重试,直到 HttpClient 等不及抛 TimeoutException 异常。

    三:总结

    人是活在错综复杂的关系网里,同样程序也是,要想解决更多的.NET程序故障,对 tcp/ip 体系知识的了解也同样必不可少。

  • 相关阅读:
    三岁看大,六岁看老,有科学依据嚒
    Vue 3的Diff算法相比Vue 2有哪些具体的改进?
    【python数据结构算法】并查集
    【华为OD机试真题 JAVA】目录删除
    react使用Table表格调整间距 居中样式
    “Python+”集成技术高光谱遥感数据处理与机器学习深度
    RabbitMQ可靠发布-SpringBoot
    [附源码]计算机毕业设计智能家电商城Springboot程序
    onps栈使用说明(2)——ping、域名解析等网络工具测试
    3d建模都是美术生学的吗
  • 原文地址:https://blog.csdn.net/huangxinchen520/article/details/134272177