十几万连接几M的流量,吓死“宝宝”了

    某局点升级(nginxats,同时去掉前端的nginx负载层),升级之后服务就不正常,硬生生的看着十几万连接,没有流量,各种排错,可谓是把心提到嗓子眼惊心动魄的半小时,虽然做了很好的业务机制,服务不正常用户可以直接回源,不过对于我们的流量而言肯定是个锯齿了,回顾一下排查过程。

    升级过程不说了,升完后对业务配置、健康心跳、磁盘设置、本地回源DNS简单做了检查,没发现问题。接下来就是切流量过来,前端的DNS按照域名哈希将请求分发过来,流量迅速到了100M还在上升,连接数到了几万(域名质量不好,很多动态的,所以也算正常),但过了几分钟流量骤降,一直降到了几M,观察连接数没降反升,内存几乎吃满。


十几万连接几M的流量,吓死“宝宝”了

(当前连接数)


十几万连接几M的流量,吓死“宝宝”了

(进出流量及cpu、内存、tcp重传1秒刷新动态监控图,内存越跑越满,tcp重传越来越高)


    神经马上紧张起来了,先检查DNS是否正常,因为本地回源DNS如果坏掉,会出现这种攒了大量连接无法服务的情况,然而测试发现本地回源DNS服务正常,看来不是简单问题,crt打开多个窗口,开始监测:

    tailf /var/log/messages |grep kernel   没有报错,系统层面应该没什么问题。

    tailf /opt/ats/var/log/trafficserver/diags.log 没有明显报错,只是过一段时间会提示连接太多,丢弃连接,说明业务肯定是不正常了,不过定位不了是哪里的错误。

    tstop打开后查看整体的情况,发现正常刷新,但是每次刷新有些数据不能正常显示,内存缓存和硬盘缓存的容量都没有显示,为什么没有显示呢,是设置错误了么,然后再去检查磁盘设置,发现records.config内存缓存设置为内存的一半12Gstorge.config设置也没问题,继续检查。

    tsar –l 1  监测,磁盘IO都为0,所有的盘都不写盘,于是想到底是因为没有流量导致不写盘的,还是写不了盘导致没有流量的呢,先假设不写盘才没流量的吧,不写盘有两种情况一是盘坏了二是磁盘的权限不对,马上检查,发现所有的数据盘拥有者所有组均为tserver,而且检查了全为裸盘,貌似没有问题。


十几万连接几M的流量,吓死“宝宝”了

(权限查看后发现没问题)


    tsar –n  1 继续检查下历史数据,发现ats启动的瞬间是有流量的,紧接着流量骤降,而且磁盘刚开始是有IO的,越来越怀疑是硬盘问题但没有证据。后来想,做个测试,干脆不用硬盘,直接上内存,竟然有流量了,而且相对稳定,终于定位出问题了。


十几万连接几M的流量,吓死“宝宝”了

(将盘全部注释掉) 

    继续想,难道所有的硬盘都坏了么,加入一个硬盘试试吧,依旧不行,继续想下去,为什么tstop计算不出缓存呢,于是列出所有磁盘的大小,发现这个局点的每块磁盘居然有将近2T左右,图如下:


十几万连接几M的流量,吓死“宝宝”了

(只有一个盘是186.5G,其余的盘都在2T)


    继续想可能是磁盘太大了,ats无法加入进来吧,于是更改使用磁盘的大小(300G),重启ats,问题解决,松了一口气,惊心动魄半小时。


十几万连接几M的流量,吓死“宝宝”了

(磁盘大小配置更改,直接指定大小)


十几万连接几M的流量,吓死“宝宝”了

(更改重启后,业务恢复正常)

自建个人原创站运维网咖社(www.net-add.com),新的博文会在网咖社更新,欢迎浏览。

原创文章,作者:ZVJLO,如若转载,请注明出处:http://www.wangzhanshi.com/n/13244.html

(0)
ZVJLO的头像ZVJLO
上一篇 2025年1月1日 17:07:25
下一篇 2025年1月1日 17:07:27

相关推荐

  • CDN如何在OCSP中使用

    CDN简介 CDN的全称是Content Delivery Network,即内容分发网络。其基本思路是尽可能避开互联网上有可能影响数据传输速度和稳定性的瓶颈和环节,使内容传输的更…

    2025年1月1日
  • CDN加速的原理是什么

    CDN(Content Delivery Network,内容分发网络)是构建在现有互联网基础之上的一层智能虚拟网络,通过在网络各处部署节点服务器,实现将源站内容分发至所有CDN节…

    CDN加速 2025年1月1日
  • 如何避免CDN为PC端缓存移动端页面

    如果 PC 端和移动端是一套代码则不会出现这个问题。「这个问题出现在 PC 端和移动端是两套代码,却共用一个域名。」 使用 nginx 配置如下,根据 UA 判断是否移动端,而走不…

    CDN加速 2025年1月1日
  • CDN技术有哪些优点

    概念 CDN这个概念相信大家都比较耳熟,到底什么是CDN呢? CDN,全称为Content Delivery Network,即内容分发网络。 其基本思路是尽可能避开互联网上有可能…

    2025年1月1日
  • cdn加速的原理及步骤

    网站那些事内容分发网络。其基本思路是避开互联网上可能影响数据传输速度和稳定性的瓶颈和链接,从而使内容传输更快、更稳定。通过在网络各处放置节点服务器所构成的在现有的互联网基础之上的一…

    2025年1月2日
  • 怎么样检查网站用了cdn加速

    网站那些事内容分发网络(Content Delivery Network,简称CDN)是建立并覆盖在承载网之上,由分布在不同区域的边缘节点服务器群组成的分布式网络。网站那些事CDN…

    2025年1月2日
  • cdn加速具体有哪几种方式

    与其他CDN服务商相比,网站那些事CDN的主要优势包括稳定快速、性价比高、简单易用、高效智能。比较多的用户会问到稳定快速这个优点,一般来说,网站那些事的CDN特点是分担源站压力,避…

    2025年1月2日
  • 什么是cdn服务器

    什么是cdn服务器 CDN服务器是一套网络服务器系统。它包括了很多特定的功能模块。其中包括分布式存储、负载均衡、网络请求的重定向和内容管理4个主要的功能模块,内容管理和网络流量管理…

    CDN加速 2025年1月1日
  • Nginx反向代理和proxy_cache缓存如何搭建CDN服务器

    碰到问题:移动用户访问web服务器www.osyunwei.com很慢解决办法:1、在移动机房放置一台nginx反向代理服务器2、通过域名DNS智能解析,所有移动用户访问www.o…

    2025年1月1日
  • 电商网站使用cdn加速有什么优势

    1.提高网页加载速度 Diycdn全站加速服务实现了全网监控,调度精准, 节点丰富,实时动态优化访问线路,保障极致加速状态,有效提高页面加载速度,给用户良好购物体验。 2.稳定数据…

    CDN加速 2025年1月2日

发表回复

登录后才能评论