tcp/dccp: fix timewait races in timer handling
authorEric Dumazet <edumazet@google.com>
Sat, 19 Sep 2015 16:08:34 +0000 (09:08 -0700)
committerDavid S. Miller <davem@davemloft.net>
Mon, 21 Sep 2015 23:32:29 +0000 (16:32 -0700)
commited2e923945892a8372ab70d2f61d364b0b6d9054
tree6df57f5b44b0003ac00ff559b781b691f91c4d13
parent4c5d283acc997a1bd7bc37cddcf7d284521cffff
tcp/dccp: fix timewait races in timer handling

When creating a timewait socket, we need to arm the timer before
allowing other cpus to find it. The signal allowing cpus to find
the socket is setting tw_refcnt to non zero value.

As we set tw_refcnt in __inet_twsk_hashdance(), we therefore need to
call inet_twsk_schedule() first.

This also means we need to remove tw_refcnt changes from
inet_twsk_schedule() and let the caller handle it.

Note that because we use mod_timer_pinned(), we have the guarantee
the timer wont expire before we set tw_refcnt as we run in BH context.

To make things more readable I introduced inet_twsk_reschedule() helper.

When rearming the timer, we can use mod_timer_pending() to make sure
we do not rearm a canceled timer.

Note: This bug can possibly trigger if packets of a flow can hit
multiple cpus. This does not normally happen, unless flow steering
is broken somehow. This explains this bug was spotted ~5 months after
its introduction.

A similar fix is needed for SYN_RECV sockets in reqsk_queue_hash_req(),
but will be provided in a separate patch for proper tracking.

Fixes: 789f558cfb36 ("tcp/dccp: get rid of central timewait timer")
Signed-off-by: Eric Dumazet <edumazet@google.com>
Reported-by: Ying Cai <ycai@google.com>
Signed-off-by: David S. Miller <davem@davemloft.net>
include/net/inet_timewait_sock.h
net/dccp/minisocks.c
net/ipv4/inet_timewait_sock.c
net/ipv4/tcp_minisocks.c