powerpc: Do not send system reset request through the oops path
authorNicholas Piggin <npiggin@gmail.com>
Wed, 5 Jul 2017 03:56:27 +0000 (13:56 +1000)
committerMichael Ellerman <mpe@ellerman.id.au>
Thu, 31 Aug 2017 04:26:02 +0000 (14:26 +1000)
A system reset is a request to crash / debug the system rather than
necessarily caused by encountering a BUG. So there is no need to
serialize all CPUs behind the die lock, adding taints to all
subsequent traces beyond the first, breaking console locks, etc.

The system reset is NMI context which has its own printk buffers to
prevent output being interleaved. Then it's better to have all
secondaries print out their debug as quickly as possible and the
primary will flush out all printk buffers during panic().

So remove the 0x100 path from die, and move it into system_reset. Name
the crash/dump reasons "System Reset".

This gives "not tained" traces when crashing an untainted kernel. It
also gives the panic reason as "System Reset" as opposed to "Fatal
exception in interrupt" (or "die oops" for fadump).

Signed-off-by: Nicholas Piggin <npiggin@gmail.com>
Signed-off-by: Michael Ellerman <mpe@ellerman.id.au>
arch/powerpc/kernel/traps.c

index f77d954f662203d9895ec263041012a2af77a9fc..5e4db2fc2add2f9826ed4800a7a2591e45d10cec 100644 (file)
@@ -162,21 +162,9 @@ static void oops_end(unsigned long flags, struct pt_regs *regs,
 
        crash_fadump(regs, "die oops");
 
-       /*
-        * A system reset (0x100) is a request to dump, so we always send
-        * it through the crashdump code.
-        */
-       if (kexec_should_crash(current) || (TRAP(regs) == 0x100)) {
+       if (kexec_should_crash(current))
                crash_kexec(regs);
 
-               /*
-                * We aren't the primary crash CPU. We need to send it
-                * to a holding pattern to avoid it ending up in the panic
-                * code.
-                */
-               crash_kexec_secondary(regs);
-       }
-
        if (!signr)
                return;
 
@@ -303,17 +291,44 @@ void system_reset_exception(struct pt_regs *regs)
                        goto out;
        }
 
-       die("System Reset", regs, SIGABRT);
+       if (debugger(regs))
+               goto out;
+
+       /*
+        * A system reset is a request to dump, so we always send
+        * it through the crashdump code (if fadump or kdump are
+        * registered).
+        */
+       crash_fadump(regs, "System Reset");
+
+       crash_kexec(regs);
+
+       /*
+        * We aren't the primary crash CPU. We need to send it
+        * to a holding pattern to avoid it ending up in the panic
+        * code.
+        */
+       crash_kexec_secondary(regs);
+
+       /*
+        * No debugger or crash dump registered, print logs then
+        * panic.
+        */
+       __die("System Reset", regs, SIGABRT);
+
+       mdelay(2*MSEC_PER_SEC); /* Wait a little while for others to print */
+       add_taint(TAINT_DIE, LOCKDEP_NOW_UNRELIABLE);
+       nmi_panic(regs, "System Reset");
 
 out:
 #ifdef CONFIG_PPC_BOOK3S_64
        BUG_ON(get_paca()->in_nmi == 0);
        if (get_paca()->in_nmi > 1)
-               panic("Unrecoverable nested System Reset");
+               nmi_panic(regs, "Unrecoverable nested System Reset");
 #endif
        /* Must die if the interrupt is not recoverable */
        if (!(regs->msr & MSR_RI))
-               panic("Unrecoverable System Reset");
+               nmi_panic(regs, "Unrecoverable System Reset");
 
        if (!nested)
                nmi_exit();