xfs: free uncommitted transactions during log recovery
authorBrian Foster <bfoster@redhat.com>
Sat, 24 Jun 2017 17:11:41 +0000 (10:11 -0700)
committerDarrick J. Wong <darrick.wong@oracle.com>
Sat, 24 Jun 2017 17:11:41 +0000 (10:11 -0700)
Log recovery allocates in-core transaction and member item data
structures on-demand as it processes the on-disk log. Transactions
are allocated on first encounter on-disk and stored in a hash table
structure where they are easily accessible for subsequent lookups.
Transaction items are also allocated on demand and are attached to
the associated transactions.

When a commit record is encountered in the log, the transaction is
committed to the fs and the in-core structures are freed. If a
filesystem crashes or shuts down before all in-core log buffers are
flushed to the log, however, not all transactions may have commit
records in the log. As expected, the modifications in such an
incomplete transaction are not replayed to the fs. The in-core data
structures for the partial transaction are never freed, however,
resulting in a memory leak.

Update xlog_do_recovery_pass() to first correctly initialize the
hash table array so empty lists can be distinguished from populated
lists on function exit. Update xlog_recover_free_trans() to always
remove the transaction from the list prior to freeing the associated
memory. Finally, walk the hash table of transaction lists as the
last step before it goes out of scope and free any transactions that
may remain on the lists. This prevents a memory leak of partial
transactions in the log.

Signed-off-by: Brian Foster <bfoster@redhat.com>
Reviewed-by: Christoph Hellwig <hch@lst.de>
Reviewed-by: Darrick J. Wong <darrick.wong@oracle.com>
Signed-off-by: Darrick J. Wong <darrick.wong@oracle.com>
fs/xfs/xfs_log_recover.c

index e19b20c87f355b7a315233efaf0def509a534d87..b6a40bd50099240788cf3d595cbc88610568ba90 100644 (file)
@@ -4152,7 +4152,7 @@ xlog_recover_commit_trans(
 
        #define XLOG_RECOVER_COMMIT_QUEUE_MAX 100
 
-       hlist_del(&trans->r_list);
+       hlist_del_init(&trans->r_list);
 
        error = xlog_recover_reorder_trans(log, trans, pass);
        if (error)
@@ -4354,6 +4354,8 @@ xlog_recover_free_trans(
        xlog_recover_item_t     *item, *n;
        int                     i;
 
+       hlist_del_init(&trans->r_list);
+
        list_for_each_entry_safe(item, n, &trans->r_itemq, ri_list) {
                /* Free the regions in the item. */
                list_del(&item->ri_list);
@@ -5224,12 +5226,16 @@ xlog_do_recovery_pass(
        int                     error2 = 0;
        int                     bblks, split_bblks;
        int                     hblks, split_hblks, wrapped_hblks;
+       int                     i;
        struct hlist_head       rhash[XLOG_RHASH_SIZE];
        LIST_HEAD               (buffer_list);
 
        ASSERT(head_blk != tail_blk);
        rhead_blk = 0;
 
+       for (i = 0; i < XLOG_RHASH_SIZE; i++)
+               INIT_HLIST_HEAD(&rhash[i]);
+
        /*
         * Read the header of the tail block and get the iclog buffer size from
         * h_size.  Use this to tell how many sectors make up the log header.
@@ -5466,6 +5472,19 @@ xlog_do_recovery_pass(
        if (error && first_bad)
                *first_bad = rhead_blk;
 
+       /*
+        * Transactions are freed at commit time but transactions without commit
+        * records on disk are never committed. Free any that may be left in the
+        * hash table.
+        */
+       for (i = 0; i < XLOG_RHASH_SIZE; i++) {
+               struct hlist_node       *tmp;
+               struct xlog_recover     *trans;
+
+               hlist_for_each_entry_safe(trans, tmp, &rhash[i], r_list)
+                       xlog_recover_free_trans(trans);
+       }
+
        return error ? error : error2;
 }