perf stat: Fix memory corruption of xyarray when cpumask is used
authorStephane Eranian <eranian@google.com>
Fri, 17 Jan 2014 15:34:06 +0000 (16:34 +0100)
committerArnaldo Carvalho de Melo <acme@redhat.com>
Mon, 20 Jan 2014 19:19:09 +0000 (16:19 -0300)
This patch fixes a memory corruption problem with the xyarray when the
evsel fds get closed at the end of the run_perf_stat() call.

It could be triggered with:

 # perf stat -a -e power/energy-cores/ ls

When cpumask are used by events (.e.g, RAPL or uncores) then the evsel
fds are allocated based on the actual number of CPUs monitored. That
number can be smaller than the total number of CPUs on the system.

The problem arises at the end by perf stat closes the fds twice. When
fds are closed, their entry in the xyarray are set to -1.

The first close() on the evsel is made from __run_perf_stat() and it
uses the actual number of CPUS for the event which is how the xyarray
was allocated for.

The second is from perf_evlist_close() but that one is on the total
number of CPUs in the system, so it assume the xyarray was allocated to
cover it. However it was not, and some writes corrupt memory.

The fix is in perf_evlist_close() is to first try with the evsel->cpus
if present, if not use the evlist->cpus. That fixes the problem.

Signed-off-by: Stephane Eranian <eranian@google.com>
Cc: David Ahern <dsahern@gmail.com>
Cc: Ingo Molnar <mingo@elte.hu>
Cc: Jiri Olsa <jolsa@redhat.com>
Cc: Peter Zijlstra <peterz@infradead.org>
Link: http://lkml.kernel.org/r/1389972846-6566-3-git-send-email-eranian@google.com
Signed-off-by: Arnaldo Carvalho de Melo <acme@redhat.com>
tools/perf/util/evlist.c

index 40bd2c04df8ad7cb02e713e4f02a832850b0a43f..59ef2802fcf631fa0e7d6f2f97e59e6881f675d4 100644 (file)
@@ -1003,9 +1003,12 @@ void perf_evlist__close(struct perf_evlist *evlist)
        struct perf_evsel *evsel;
        int ncpus = cpu_map__nr(evlist->cpus);
        int nthreads = thread_map__nr(evlist->threads);
+       int n;
 
-       evlist__for_each_reverse(evlist, evsel)
-               perf_evsel__close(evsel, ncpus, nthreads);
+       evlist__for_each_reverse(evlist, evsel) {
+               n = evsel->cpus ? evsel->cpus->nr : ncpus;
+               perf_evsel__close(evsel, n, nthreads);
+       }
 }
 
 int perf_evlist__open(struct perf_evlist *evlist)