当前位置:首页 > 科技  > 软件

记一次 .NET某工厂报警监控设置崩溃分析

来源: 责编: 时间:2024-06-14 08:47:37 192观看
导读一、背景1. 讲故事前些天有位朋友在微信上丢了一个崩溃的dump给我,让我帮忙看下为什么出现了崩溃,在 Windows 的事件查看器上显示的是经典的 访问违例 ,即 c0000005 错误码,不管怎么说有dump就可以上windbg开干了。二、Wi

一、背景

1. 讲故事

前些天有位朋友在微信上丢了一个崩溃的dump给我,让我帮忙看下为什么出现了崩溃,在 Windows 的事件查看器上显示的是经典的 访问违例 ,即 c0000005 错误码,不管怎么说有dump就可以上windbg开干了。qYP28资讯网——每日最新资讯28at.com

二、WinDbg 分析

1. 程序为谁崩溃了

在 Windows 平台上比较简单,可以用 !analyze -v 命令查看,输出结果如下:qYP28资讯网——每日最新资讯28at.com

0:120> !analyze -v...CONTEXT:  (.ecxr)rax=0000000000000000 rbx=000000d5140fcf00 rcx=0000000000000000rdx=000001d7f61cf1d8 rsi=000001d7d3635a10 rdi=000000d5140fc890rip=00007ff80e17d233 rsp=000000d5140fc760 rbp=000000d5140fc8a0 r8=000001d7d3308144  r9=0000000000000000 r10=0000000000000000r11=000001d96736b620 r12=000000d5140fca08 r13=00007ff80d326528r14=000000d5140fcf00 r15=0000000000000000iopl=0         nv up ei pl nz na po nccs=0033  ss=002b  ds=002b  es=002b  fs=0053  gs=002b             efl=0001020600007ff8`0e17d233 3909            cmp     dword ptr [rcx],ecx ds:00000000`00000000=????????Resetting default scopeEXCEPTION_RECORD:  (.exr -1)ExceptionAddress: 00007ff80e17d233   ExceptionCode: c0000005 (Access violation)  ExceptionFlags: 00000000NumberParameters: 2   Parameter[0]: 0000000000000000   Parameter[1]: 0000000000000000Attempt to read from address 0000000000000000ERROR_CODE: (NTSTATUS) 0xc0000005 - 0x%p            0x%p                    %sEXCEPTION_CODE_STR:  c0000005STACK_TEXT:  000000d5`140fc760 00007ff8`6bcc6d93     : 000001d7`d3635a10 000000d5`140fcb80 00007ff8`6bcfda57 00007ff8`695acc92 : 0x00007ff8`0e17d233000000d5`140fc8b0 00007ff8`6bcc6c48     : 00000000`00000004 00007ff8`6be5ba73 00000000`00000000 00000000`00000000 : clr!CallDescrWorkerInternal+0x83000000d5`140fc8f0 00007ff8`6be5bf66     : 000001d7`d3635a10 00000000`00000000 000000d5`140fcad8 00000000`00000000 : clr!CallDescrWorkerWithHandler+0x4e000000d5`140fc930 00007ff8`6be5c41f     : 00000000`00000000 000000d5`140fca30 00000000`00000000 000000d5`140fcb60 : clr!CallDescrWorkerReflectionWrapper+0x1a000000d5`140fc980 00007ff8`69993ee4     : 00000000`00000000 00000000`00000000 000001d7`d3635a10 00007ff8`699f9700 : clr!RuntimeMethodHandle::InvokeMethod+0x45f000000d5`140fcf90 00007ff8`6997eeae     : 000001d7`d3376af0 00000000`00000000 00000000`0000011e 00007ff8`699f82f3 : mscorlib_ni!System.Reflection.RuntimeMethodInfo.UnsafeInvokeInternal+0x104000000d5`140fd000 00007ff8`699c3a06     : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : mscorlib_ni!System.Reflection.RuntimeMethodInfo.Invoke+0x8e000000d5`140fd080 00007ff8`0dfb7bb3     : 000001d7`d3635998 000001d7`d45e28e0 00000000`0000011c 000001d7`d3376af0 : mscorlib_ni!System.RuntimeType.InvokeMember+0x306...STACK_COMMAND:  ~120s; .ecxr ; kb...

从卦中信息看崩溃的汇编语句是 dword ptr [rcx],ecx ,经常看C#汇编代码的朋友我相信对这条语句非常敏感,对,它就是JIT自动插入的一条 this!=null 的防御性判断,看样子程序有 this=null 的情况,接下来入手点就是RIP处 ExceptionAddress: 00007ff80e17d233,用 !U 观察下上下文。qYP28资讯网——每日最新资讯28at.com

0:120> !U 00007ff80e17d233Normal JIT generated codeMyScript.Process()Begin 00007ff80e17d1c0, size 3d500007ff8`0e17d1c0 55              push    rbp00007ff8`0e17d1c1 57              push    rdi00007ff8`0e17d1c2 56              push    rsi00007ff8`0e17d1c3 4881ec30010000  sub     rsp,130h00007ff8`0e17d1ca c5f877          vzeroupper...00007ff8`0e17d220 e813c1edfe      call    00007ff8`0d059338 (xxx.GetRegion(System.String, Boolean), mdToken: 000000000600034f)00007ff8`0e17d225 48898570ffffff  mov     qword ptr [rbp-90h],rax00007ff8`0e17d22c 488b8d70ffffff  mov     rcx,qword ptr [rbp-90h]>>> 00007ff8`0e17d233 3909            cmp     dword ptr [rcx],ecx00007ff8`0e17d235 e8de87edfe      call    00007ff8`0d055a18 (xxx.get_Region(), mdToken: 0000000006000073)

从卦中的汇编代码看逻辑非常清晰,即 xxx.GetRegion() 方法返回为null,然后在取其中的 Region 属性时直接崩掉,说白了这是一个简单的 空引用异常,完整的代码截图如下:qYP28资讯网——每日最新资讯28at.com

图片图片qYP28资讯网——每日最新资讯28at.com

奇怪就奇怪在这里,代码中明明用 try catch 给包起来了,为什么程序直接崩掉了。qYP28资讯网——每日最新资讯28at.com

2. 为什么try catch 无效

尼玛,这是我这几年做dump分析第一次遇到这种情况,真的是无语了,接下来我们验证下这个异常是否到了托管层?qYP28资讯网——每日最新资讯28at.com

  • 是否有 NullReferenceException

熟悉dump分析的朋友应该知道,如果线程抛了异常在回溯的过程中会记录到 Thread.m_LastThrownObjectHandle 字段中,同时 !t 命令可以在 Exception 列中看到此信息。qYP28资讯网——每日最新资讯28at.com

0:120> !tThreadCount:      48UnstartedThread:  0BackgroundThread: 47PendingThread:    0DeadThread:       0Hosted Runtime:   no                                                                                                        Lock         ID OSID ThreadOBJ           State GC Mode     GC Alloc Context                  Domain           Count Apt Exception   0    1 29dc 000001d7d162d5d0    26020 Preemptive  000001D7D8228A00:000001D7D8228D28 000001d7d1602380 0     STA  ... 159   18 22dc 000001d967906ff0  1029220 Preemptive  000001D7D834E558:000001D7D834E558 000001d7d1602380 1     MTA (GC) (Threadpool Worker)  ...

但从卦中数据看所有的 Exception 列都没有异常信息,这就表示程序没有走到 CLR 的异常处理链条上,至少是不完整的。qYP28资讯网——每日最新资讯28at.com

  • 是否有 AccessViolationException

参加过 C#内功修炼训练营 的朋友应该都知道,这种 c0000005 的异常在 C#层面最终会被map成两种异常中的其一,即 NullReferenceException 和 AccessViolationException,选择其一的逻辑就是判断 RIP 是在托管层还是非托管层,模型图如下:qYP28资讯网——每日最新资讯28at.com

图片图片qYP28资讯网——每日最新资讯28at.com

但遗憾的是在 !t 的列表中也没有任何的 AccessViolationException 字样,这也更加确认了它没有调用异常处理链中的 CreateThrowable 函数。。。qYP28资讯网——每日最新资讯28at.com

事出反常必有妖,在 !t 的输出结果中可以看到此时 159号线程触发了 GC,接下来切过去看一看。qYP28资讯网——每日最新资讯28at.com

0:120> ~159sntdll!NtQueryInformationThread+0x14:00007ff8`8317ea34 c3              ret0:159> k # Child-SP          RetAddr               Call Site00 000000d5`00c3e7d8 00007ff8`7f216e2e     ntdll!NtQueryInformationThread+0x1401 000000d5`00c3e7e0 00007ff8`6bcea731     KERNELBASE!GetThreadPriority+0x1e02 000000d5`00c3e850 00007ff8`6be69cc5     clr!Thread::GetThreadPriority+0x5603 000000d5`00c3e8a0 00007ff8`6be69bc4     clr!ThreadSuspend::SuspendRuntime+0xa504 000000d5`00c3e990 00007ff8`6bd814e3     clr!ThreadSuspend::SuspendEE+0x12805 000000d5`00c3ea90 00007ff8`6bd85f51     clr!WKS::GCHeap::GarbageCollectGeneration+0xb706 000000d5`00c3eaf0 00007ff8`6be7ee6b     clr!WKS::gc_heap::trigger_gc_for_alloc+0x2d07 000000d5`00c3eb30 00007ff8`470e53ec     clr!JIT_New+0x4d608 000000d5`00c3eee0 00007ff8`470e537c     Microsoft_VisualBasic_ni!Microsoft.VisualBasic.Strings.ReplaceInternal+0x3c [f:/dd/vb/runtime/msvbalib/Strings.vb @ 761] 09 000000d5`00c3ef80 00007ff8`0d04f81f     Microsoft_VisualBasic_ni!Microsoft.VisualBasic.Strings.Replace+0x15c [f:/dd/vb/runtime/msvbalib/Strings.vb @ 737] ...

从卦中的线程栈来看,此时正在 SuspendEE 阶段,而且还是处于早期阶段,正在准备给 SuspendThread 安排一个好的优先级,主要是怕优先级太低了,导致 线程饥饿 得不到调度,毕竟 GC Process 的过程一定要是快中再快,接下来我们看下程序的 framework 版本。qYP28资讯网——每日最新资讯28at.com

0:159> !eeversion4.7.3190.0 freeWorkstation modeSOS Version: 4.7.3190.0 retail build

可以看到还是比较老的 .netframework 4.7.3,结合这么多信息,我个人觉得这可能是 CLR 的一个 bug,在 SuspendEE 阶段的早期(还没有 foreach threads)刚好遇到了一个硬件异常,这个 硬件异常 CLR 在业务逻辑上没处理好,导致 SEH 异常没有引入到 托管层,或者中途的某一环断掉了,我放一张C#内功修炼训练营 中的硬件异常完整流程图。qYP28资讯网——每日最新资讯28at.com

图片图片qYP28资讯网——每日最新资讯28at.com

最后给到朋友的建议比较简单:qYP28资讯网——每日最新资讯28at.com

  • 判 null 的时候一定要加 null 判断,避免异常逻辑。
  • 升级 framework 到最新的 4.8.1 观察。

三:总结

这次程序崩溃的原因很简单,就是 空引用异常 ,但诡异就诡异在明明有 trycatch 在外部,硬是没接住,这个大概率是 CLR 的 bug,让我这个分析多年dump的老手都叹为观止,开了眼界,无语了无语了...qYP28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-93680-0.html记一次 .NET某工厂报警监控设置崩溃分析

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 对比Word和Markdown,为什么LaTeX更受专业人士欢迎

下一篇: React 实现给密码输入框加上【密码强度】展示?

标签:
  • 热门焦点
  • 一加首款折叠屏!一加Open渲染图出炉:罕见单手可握小尺寸

    8月5日消息,此前就有爆料称,一加首款折叠屏手机将会在第三季度上市,如今随着时间临近,新机的各种消息也开始浮出水面。据悉,这款新机将会被命名为“On
  • 摸鱼心法第一章——和配置文件说拜拜

    为了能摸鱼我们团队做了容器化,但是带来的问题是服务配置文件很麻烦,然后大家在群里进行了“亲切友好”的沟通图片图片图片图片对比就对比,简单对比下独立配置中心和k8s作为配
  • .NET 程序的 GDI 句柄泄露的再反思

    一、背景1. 讲故事上个月我写过一篇 如何洞察 C# 程序的 GDI 句柄泄露 文章,当时用的是 GDIView + WinDbg 把问题搞定,前者用来定位泄露资源,后者用来定位泄露代码,后面有朋友反
  • 阿里大调整

    来源:产品刘有媒体报道称,近期淘宝天猫集团启动了近年来最大的人力制度改革,涉及员工绩效、层级体系等多个核心事项,目前已形成一个初步的“征求意见版”:1、取消P序列
  • 重估百度丨大模型,能撑起百度的“今天”吗?

    自象限原创 作者|程心 罗辑2023年之前,对于自己的“今天”,百度也很迷茫。“新业务到 2022 年底还是 0,希望 2023 年出来一个 1。”这是2022年底,李彦宏
  • 携众多高端产品亮相ChinaJoy,小米带来一场科技与人文的视听盛宴

    7月28日,全球数字娱乐领域最具知名度与影响力的年度盛会中国国际数码互动娱乐展览会(简称ChinaJoy)在上海新国际博览中心盛大开幕。作为全球领先的科
  • 8月见!小米MIX Fold 3获得3C认证:支持67W快充

    这段时间以来,包括三星、一加、荣耀等等有不少品牌旗下的最新折叠屏旗舰都得到了不少爆料,而小米新一代折叠屏旗舰——小米MIX Fold 3此前也屡屡被传
  • 2纳米决战2025

    集微网报道 从三强争霸到四雄逐鹿,2nm的厮杀声已然隐约传来。无论是老牌劲旅台积电、三星,还是誓言重回先进制程领先地位的英特尔,甚至初成立不久的新
  • 上海举办人工智能大会活动,建设人工智能新高地

    人工智能大会在上海浦江两岸隆重拉开帷幕,人工智能新技术、新产品、新应用、新理念集中亮相。8月30日晚,作为大会的特色活动之一的上海人工智能发展盛典人工
Top