drm/i915: Allow disabling error capture

author Chris Wilson <chris@chris-wilson.co.uk>

Wed, 12 Oct 2016 09:05:18 +0000 (10:05 +0100)

committer Chris Wilson <chris@chris-wilson.co.uk>

Wed, 12 Oct 2016 11:00:32 +0000 (12:00 +0100)
author Chris Wilson <chris@chris-wilson.co.uk>
Wed, 12 Oct 2016 09:05:18 +0000 (10:05 +0100)
committer Chris Wilson <chris@chris-wilson.co.uk>
Wed, 12 Oct 2016 11:00:32 +0000 (12:00 +0100)
diff --git a/drivers/gpu/drm/i915/Kconfig b/drivers/gpu/drm/i915/Kconfig

index 7769e469118f2084f4ee84b70f7aa049cd07239c..8844b99bd760a5c8a0317b9e4a1c06119b185c60 100644 (file)
--- a/drivers/gpu/drm/i915/Kconfig
+++ b/drivers/gpu/drm/i915/Kconfig
@@ -46,6 +46,19 @@ config DRM_I915_PRELIMINARY_HW_SUPPORT
  
           If in doubt, say "N".
  
+config DRM_I915_CAPTURE_ERROR
+       bool "Enable capturing GPU state following a hang"
+       depends on DRM_I915
+       default y
+       help
+         This option enables capturing the GPU state when a hang is detected.
+         This information is vital for triaging hangs and assists in debugging.
+         Please report any hang to
+            https://bugs.freedesktop.org/enter_bug.cgi?product=DRI
+         for triaging.
+
+         If in doubt, say "Y".
+
  config DRM_I915_USERPTR
         bool "Always enable userptr support"
         depends on DRM_I915
diff --git a/drivers/gpu/drm/i915/Makefile b/drivers/gpu/drm/i915/Makefile

index a998c2bce70a0a6c72ac1bb1671b4ebd311e6c40..8790ae4fb1716d265bb2d433ac4e9e3187088dc9 100644 (file)
--- a/drivers/gpu/drm/i915/Makefile
+++ b/drivers/gpu/drm/i915/Makefile
@@ -42,7 +42,6 @@ i915-y += i915_cmd_parser.o \
           i915_gem_stolen.o \
           i915_gem_tiling.o \
           i915_gem_userptr.o \
-         i915_gpu_error.o \
           i915_trace_points.o \
           intel_breadcrumbs.o \
           intel_engine_cs.o \
@@ -107,6 +106,9 @@ i915-y += dvo_ch7017.o \
           intel_sdvo.o \
           intel_tv.o
  
+# Post-mortem debug and GPU hang state capture
+i915-$(CONFIG_DRM_I915_CAPTURE_ERROR) += i915_gpu_error.o
+
  # virtual gpu code
  i915-y += i915_vgpu.o
  
diff --git a/drivers/gpu/drm/i915/i915_debugfs.c b/drivers/gpu/drm/i915/i915_debugfs.c

index f6762e00f87247d28904c2a4d9748f8f0e06a2cf..358663e833d6e7f30f9b6af115d74c83a006097f 100644 (file)
--- a/drivers/gpu/drm/i915/i915_debugfs.c
+++ b/drivers/gpu/drm/i915/i915_debugfs.c
@@ -960,6 +960,8 @@ static int i915_hws_info(struct seq_file *m, void *data)
         return 0;
  }
  
+#if IS_ENABLED(CONFIG_DRM_I915_CAPTURE_ERROR)
+
  static ssize_t
  i915_error_state_write(struct file *filp,
                        const char __user *ubuf,
@@ -1042,6 +1044,8 @@ static const struct file_operations i915_error_state_fops = {
         .release = i915_error_state_release,
  };
  
+#endif
+
  static int
  i915_next_seqno_get(void *data, u64 *val)
  {
@@ -5398,7 +5402,9 @@ static const struct i915_debugfs_files {
         {"i915_ring_missed_irq", &i915_ring_missed_irq_fops},
         {"i915_ring_test_irq", &i915_ring_test_irq_fops},
         {"i915_gem_drop_caches", &i915_drop_caches_fops},
+#if IS_ENABLED(CONFIG_DRM_I915_CAPTURE_ERROR)
         {"i915_error_state", &i915_error_state_fops},
+#endif
         {"i915_next_seqno", &i915_next_seqno_fops},
         {"i915_display_crc_ctl", &i915_display_crc_ctl_fops},
         {"i915_pri_wm_latency", &i915_pri_wm_latency_fops},
diff --git a/drivers/gpu/drm/i915/i915_drv.h b/drivers/gpu/drm/i915/i915_drv.h

index 4553a5372008844974b3a435dcd73e398879a1a8..380590b30bbf8008a6db5e326713eb6d41c0597a 100644 (file)
--- a/drivers/gpu/drm/i915/i915_drv.h
+++ b/drivers/gpu/drm/i915/i915_drv.h
@@ -3544,6 +3544,8 @@ static inline void intel_display_crc_init(struct drm_i915_private *dev_priv) {}
  #endif
  
  /* i915_gpu_error.c */
+#if IS_ENABLED(CONFIG_DRM_I915_CAPTURE_ERROR)
+
  __printf(2, 3)
  void i915_error_printf(struct drm_i915_error_state_buf *e, const char *f, ...);
  int i915_error_state_to_str(struct drm_i915_error_state_buf *estr,
@@ -3564,6 +3566,20 @@ void i915_error_state_get(struct drm_device *dev,
  void i915_error_state_put(struct i915_error_state_file_priv *error_priv);
  void i915_destroy_error_state(struct drm_device *dev);
  
+#else
+
+static inline void i915_capture_error_state(struct drm_i915_private *dev_priv,
+                                           u32 engine_mask,
+                                           const char *error_msg)
+{
+}
+
+static inline void i915_destroy_error_state(struct drm_device *dev)
+{
+}
+
+#endif
+
  const char *i915_cache_level_str(struct drm_i915_private *i915, int type);
  
  /* i915_cmd_parser.c */
diff --git a/drivers/gpu/drm/i915/i915_gpu_error.c b/drivers/gpu/drm/i915/i915_gpu_error.c

index 04205c82f0c9734f455f59b380f60fa1487e1aba..c88c0d192a601e6e0004f6b173673a6cec0df496 100644 (file)
--- a/drivers/gpu/drm/i915/i915_gpu_error.c
+++ b/drivers/gpu/drm/i915/i915_gpu_error.c
@@ -1464,6 +1464,9 @@ void i915_capture_error_state(struct drm_i915_private *dev_priv,
         struct drm_i915_error_state *error;
         unsigned long flags;
  
+       if (!i915.error_capture)
+               return;
+
         if (READ_ONCE(dev_priv->gpu_error.first_error))
                 return;
  
diff --git a/drivers/gpu/drm/i915/i915_params.c b/drivers/gpu/drm/i915/i915_params.c

index 768ad89d9cd40cf93093713f7db08f7bc10e7ebd..629e4334719ce012a952c3b95fa81b7ef9e09bf2 100644 (file)
--- a/drivers/gpu/drm/i915/i915_params.c
+++ b/drivers/gpu/drm/i915/i915_params.c
@@ -47,6 +47,7 @@ struct i915_params i915 __read_mostly = {
         .load_detect_test = 0,
         .force_reset_modeset_test = 0,
         .reset = true,
+       .error_capture = true,
         .invert_brightness = 0,
         .disable_display = 0,
         .enable_cmd_parser = 1,
@@ -115,6 +116,14 @@ MODULE_PARM_DESC(vbt_sdvo_panel_type,
  module_param_named_unsafe(reset, i915.reset, bool, 0600);
  MODULE_PARM_DESC(reset, "Attempt GPU resets (default: true)");
  
+#if IS_ENABLED(CONFIG_DRM_I915_CAPTURE_ERROR)
+module_param_named(error_capture, i915.error_capture, bool, 0600);
+MODULE_PARM_DESC(error_capture,
+       "Record the GPU state following a hang. "
+       "This information in /sys/class/drm/card<N>/error is vital for "
+       "triaging and debugging hangs.");
+#endif
+
  module_param_named_unsafe(enable_hangcheck, i915.enable_hangcheck, bool, 0644);
  MODULE_PARM_DESC(enable_hangcheck,
         "Periodically check GPU activity for detecting hangs. "
diff --git a/drivers/gpu/drm/i915/i915_params.h b/drivers/gpu/drm/i915/i915_params.h

index 3a0dd78ddb38f88fa7b447a51702f3539c0590d1..94efc899c1efaff338231ede9d11f41bded2b901 100644 (file)
--- a/drivers/gpu/drm/i915/i915_params.h
+++ b/drivers/gpu/drm/i915/i915_params.h
@@ -59,6 +59,7 @@ struct i915_params {
         bool load_detect_test;
         bool force_reset_modeset_test;
         bool reset;
+       bool error_capture;
         bool disable_display;
         bool verbose_state_checks;
         bool nuclear_pageflip;
diff --git a/drivers/gpu/drm/i915/i915_sysfs.c b/drivers/gpu/drm/i915/i915_sysfs.c

index 1012eeea132434c30e100c0b5fa16d0b26bd361d..47590ab08d7ea65e7cc94594853117f78e04946b 100644 (file)
--- a/drivers/gpu/drm/i915/i915_sysfs.c
+++ b/drivers/gpu/drm/i915/i915_sysfs.c
@@ -514,6 +514,8 @@ static const struct attribute *vlv_attrs[] = {
         NULL,
  };
  
+#if IS_ENABLED(CONFIG_DRM_I915_CAPTURE_ERROR)
+
  static ssize_t error_state_read(struct file *filp, struct kobject *kobj,
                                 struct bin_attribute *attr, char *buf,
                                 loff_t off, size_t count)
@@ -571,6 +573,21 @@ static struct bin_attribute error_state_attr = {
         .write = error_state_write,
  };
  
+static void i915_setup_error_capture(struct device *kdev)
+{
+       if (sysfs_create_bin_file(&kdev->kobj, &error_state_attr))
+               DRM_ERROR("error_state sysfs setup failed\n");
+}
+
+static void i915_teardown_error_capture(struct device *kdev)
+{
+       sysfs_remove_bin_file(&kdev->kobj, &error_state_attr);
+}
+#else
+static void i915_setup_error_capture(struct device *kdev) {}
+static void i915_teardown_error_capture(struct device *kdev) {}
+#endif
+
  void i915_setup_sysfs(struct drm_i915_private *dev_priv)
  {
         struct device *kdev = dev_priv->drm.primary->kdev;
@@ -617,17 +634,15 @@ void i915_setup_sysfs(struct drm_i915_private *dev_priv)
         if (ret)
                 DRM_ERROR("RPS sysfs setup failed\n");
  
-       ret = sysfs_create_bin_file(&kdev->kobj,
-                                   &error_state_attr);
-       if (ret)
-               DRM_ERROR("error_state sysfs setup failed\n");
+       i915_setup_error_capture(kdev);
  }
  
  void i915_teardown_sysfs(struct drm_i915_private *dev_priv)
  {
         struct device *kdev = dev_priv->drm.primary->kdev;
  
-       sysfs_remove_bin_file(&kdev->kobj, &error_state_attr);
+       i915_teardown_error_capture(kdev);
+
         if (IS_VALLEYVIEW(dev_priv) || IS_CHERRYVIEW(dev_priv))
                 sysfs_remove_files(&kdev->kobj, vlv_attrs);
         else
diff --git a/drivers/gpu/drm/i915/intel_display.c b/drivers/gpu/drm/i915/intel_display.c

index e4bdd3a6a6e35cb1bc8668ba64e086a95b021b41..cfcb03f82016c79c73a2cad5b0337b45f77eb799 100644 (file)
--- a/drivers/gpu/drm/i915/intel_display.c
+++ b/drivers/gpu/drm/i915/intel_display.c
@@ -17097,6 +17097,8 @@ int intel_modeset_vga_set_state(struct drm_device *dev, bool state)
         return 0;
  }
  
+#if IS_ENABLED(CONFIG_DRM_I915_CAPTURE_ERROR)
+
  struct intel_display_error_state {
  
         u32 power_well_driver;
@@ -17279,3 +17281,5 @@ intel_display_print_error_state(struct drm_i915_error_state_buf *m,
                 err_printf(m, "  VSYNC: %08x\n", error->transcoder[i].vsync);
         }
  }
+
+#endif
diff --git a/drivers/gpu/drm/i915/intel_overlay.c b/drivers/gpu/drm/i915/intel_overlay.c

index a24bc8c7889f04ce3f3d7e2351404e43f777ceef..8c411bfc3b3fa440c566295a4939bca0a6b90ff7 100644 (file)
--- a/drivers/gpu/drm/i915/intel_overlay.c
+++ b/drivers/gpu/drm/i915/intel_overlay.c
@@ -1470,6 +1470,8 @@ void intel_cleanup_overlay(struct drm_i915_private *dev_priv)
         kfree(dev_priv->overlay);
  }
  
+#if IS_ENABLED(CONFIG_DRM_I915_CAPTURE_ERROR)
+
  struct intel_overlay_error_state {
         struct overlay_registers regs;
         unsigned long base;
@@ -1587,3 +1589,5 @@ intel_overlay_print_error_state(struct drm_i915_error_state_buf *m,
         P(UVSCALEV);
  #undef P
  }
+
+#endif
author	Chris Wilson <chris@chris-wilson.co.uk>
	Wed, 12 Oct 2016 09:05:18 +0000 (10:05 +0100)
committer	Chris Wilson <chris@chris-wilson.co.uk>
	Wed, 12 Oct 2016 11:00:32 +0000 (12:00 +0100)
drivers/gpu/drm/i915/Kconfig		patch \| blob \| blame \| history
drivers/gpu/drm/i915/Makefile		patch \| blob \| blame \| history
drivers/gpu/drm/i915/i915_debugfs.c		patch \| blob \| blame \| history
drivers/gpu/drm/i915/i915_drv.h		patch \| blob \| blame \| history
drivers/gpu/drm/i915/i915_gpu_error.c		patch \| blob \| blame \| history
drivers/gpu/drm/i915/i915_params.c		patch \| blob \| blame \| history
drivers/gpu/drm/i915/i915_params.h		patch \| blob \| blame \| history
drivers/gpu/drm/i915/i915_sysfs.c		patch \| blob \| blame \| history
drivers/gpu/drm/i915/intel_display.c		patch \| blob \| blame \| history
drivers/gpu/drm/i915/intel_overlay.c		patch \| blob \| blame \| history