xprtrdma: Faster server reboot recovery
authorChuck Lever <chuck.lever@oracle.com>
Mon, 2 May 2016 18:43:03 +0000 (14:43 -0400)
committerAnna Schumaker <Anna.Schumaker@Netapp.com>
Tue, 17 May 2016 19:48:04 +0000 (15:48 -0400)
commitb2dde94bfa374b9e851756ab8191209f1a604e0a
tree431a60c0c877faa819b9c6892fc5c49f492f23e4
parent0b043b9fb5dabcb6f187136cc685b26a7f8bcdb1
xprtrdma: Faster server reboot recovery

In a cluster failover scenario, it is desirable for the client to
attempt to reconnect quickly, as an alternate NFS server is already
waiting to take over for the down server. The client can't see that
a server IP address has moved to a new server until the existing
connection is gone.

For fabrics and devices where it is meaningful, set a definite upper
bound on the amount of time before it is determined that a
connection is no longer valid. This allows the RPC client to detect
connection loss in a timely matter, then perform a fresh resolution
of the server GUID in case it has changed (cluster failover).

Signed-off-by: Chuck Lever <chuck.lever@oracle.com>
Tested-by: Steve Wise <swise@opengridcomputing.com>
Signed-off-by: Anna Schumaker <Anna.Schumaker@Netapp.com>
net/sunrpc/xprtrdma/verbs.c