Btrfs: kill BUG_ON in do_relocation
authorLiu Bo <bo.li.liu@oracle.com>
Fri, 23 Sep 2016 21:05:04 +0000 (14:05 -0700)
committerDavid Sterba <dsterba@suse.com>
Mon, 17 Oct 2016 13:48:40 +0000 (15:48 +0200)
commit4547f4d8ffd63ba4ac129f9136027bd14b729101
treebf7105a6ce0c8b41369d2c4f045a6630d5dcba93
parentd9ed71e5457c8c5bf1dc706e06468eab9e2aa87e
Btrfs: kill BUG_ON in do_relocation

While updating btree, we try to push items between sibling
nodes/leaves in order to keep height as low as possible.
But we don't memset the original places with zero when
pushing items so that we could end up leaving stale content
in nodes/leaves.  One may read the above stale content by
increasing btree blocks' @nritems.

One case I've come across is that in fs tree, a leaf has two
parent nodes, hence running balance ends up with processing
this leaf with two parent nodes, but it can only reach the
valid parent node through btrfs_search_slot, so it'd be like,

do_relocation
    for P in all parent nodes of block A:
        if !P->eb:
            btrfs_search_slot(key);   --> get path from P to A.
        if lowest:
            BUG_ON(A->bytenr != bytenr of A recorded in P);
        btrfs_cow_block(P, A);   --> change A's bytenr in P.

After btrfs_cow_block, P has the new bytenr of A, but with the
same @key, we get the same path again, and get panic by BUG_ON.

Note that this is only happening in a corrupted fs, for a
regular fs in which we have correct @nritems so that we won't
read stale content in any case.

Reviewed-by: Josef Bacik <jbacik@fb.com>
Signed-off-by: Liu Bo <bo.li.liu@oracle.com>
Signed-off-by: David Sterba <dsterba@suse.com>
fs/btrfs/relocation.c