net: split out functions related to registering inflight socket files
authorJens Axboe <axboe@kernel.dk>
Fri, 8 Feb 2019 16:01:44 +0000 (09:01 -0700)
committerGreg Kroah-Hartman <gregkh@linuxfoundation.org>
Wed, 4 Aug 2021 09:58:01 +0000 (11:58 +0200)
commit f4e65870e5cede5ca1ec0006b6c9803994e5f7b8 upstream.

We need this functionality for the io_uring file registration, but
we cannot rely on it since CONFIG_UNIX can be modular. Move the helpers
to a separate file, that's always builtin to the kernel if CONFIG_UNIX is
m/y.

No functional changes in this patch, just moving code around.

Reviewed-by: Hannes Reinecke <hare@suse.com>
Acked-by: David S. Miller <davem@davemloft.net>
Signed-off-by: Jens Axboe <axboe@kernel.dk>
[ backported to older kernels to get access to unix_gc_lock - gregkh ]
Signed-off-by: Greg Kroah-Hartman <gregkh@linuxfoundation.org>
include/net/af_unix.h
net/Makefile
net/unix/Kconfig
net/unix/Makefile
net/unix/af_unix.c
net/unix/garbage.c
net/unix/scm.c [new file with mode: 0644]
net/unix/scm.h [new file with mode: 0644]

index fd60eccb59a67969eba53416a376a3c912d62d81..79f2e1ccfcfb8518c84b22e0a54783286d4e2fe5 100644 (file)
@@ -8,6 +8,7 @@
 
 void unix_inflight(struct user_struct *user, struct file *fp);
 void unix_notinflight(struct user_struct *user, struct file *fp);
+void unix_destruct_scm(struct sk_buff *skb);
 void unix_gc(void);
 void wait_for_unix_gc(void);
 struct sock *unix_get_socket(struct file *filp);
index 4cafaa2b4667e049ab4a698e8242902adb6a65a0..1955d89de75bb9389f9b9f083984916e5107941b 100644 (file)
@@ -16,7 +16,7 @@ obj-$(CONFIG_NET)             += ethernet/ 802/ sched/ netlink/
 obj-$(CONFIG_NETFILTER)                += netfilter/
 obj-$(CONFIG_INET)             += ipv4/
 obj-$(CONFIG_XFRM)             += xfrm/
-obj-$(CONFIG_UNIX)             += unix/
+obj-$(CONFIG_UNIX_SCM)         += unix/
 obj-$(CONFIG_NET)              += ipv6/
 obj-$(CONFIG_PACKET)           += packet/
 obj-$(CONFIG_NET_KEY)          += key/
index 8b31ab85d050f7b5930d53db5d69b6949865df4e..3b9e450656a4dfeef1a00afde58b2469f6b47b1c 100644 (file)
@@ -19,6 +19,11 @@ config UNIX
 
          Say Y unless you know what you are doing.
 
+config UNIX_SCM
+       bool
+       depends on UNIX
+       default y
+
 config UNIX_DIAG
        tristate "UNIX: socket monitoring interface"
        depends on UNIX
index b663c607b1c613e875501cec703a439e1ca0bce3..dc686c6757fb55bb1a4e5f607cc97488654674c4 100644 (file)
@@ -9,3 +9,5 @@ unix-$(CONFIG_SYSCTL)   += sysctl_net_unix.o
 
 obj-$(CONFIG_UNIX_DIAG)        += unix_diag.o
 unix_diag-y            := diag.o
+
+obj-$(CONFIG_UNIX_SCM) += scm.o
index 8bbaa35937dd970dcdb453eeef73aeaaea1c4a87..1cc9d89b5ceeab22f5534e1af8bc08b6ad351169 100644 (file)
 #include <linux/security.h>
 #include <linux/freezer.h>
 
+#include "scm.h"
+
 struct hlist_head unix_socket_table[2 * UNIX_HASH_SIZE];
 EXPORT_SYMBOL_GPL(unix_socket_table);
 DEFINE_SPINLOCK(unix_table_lock);
@@ -1505,80 +1507,6 @@ out:
        return err;
 }
 
-static void unix_detach_fds(struct scm_cookie *scm, struct sk_buff *skb)
-{
-       int i;
-
-       scm->fp = UNIXCB(skb).fp;
-       UNIXCB(skb).fp = NULL;
-
-       for (i = scm->fp->count-1; i >= 0; i--)
-               unix_notinflight(scm->fp->user, scm->fp->fp[i]);
-}
-
-static void unix_destruct_scm(struct sk_buff *skb)
-{
-       struct scm_cookie scm;
-       memset(&scm, 0, sizeof(scm));
-       scm.pid  = UNIXCB(skb).pid;
-       if (UNIXCB(skb).fp)
-               unix_detach_fds(&scm, skb);
-
-       /* Alas, it calls VFS */
-       /* So fscking what? fput() had been SMP-safe since the last Summer */
-       scm_destroy(&scm);
-       sock_wfree(skb);
-}
-
-/*
- * The "user->unix_inflight" variable is protected by the garbage
- * collection lock, and we just read it locklessly here. If you go
- * over the limit, there might be a tiny race in actually noticing
- * it across threads. Tough.
- */
-static inline bool too_many_unix_fds(struct task_struct *p)
-{
-       struct user_struct *user = current_user();
-
-       if (unlikely(user->unix_inflight > task_rlimit(p, RLIMIT_NOFILE)))
-               return !capable(CAP_SYS_RESOURCE) && !capable(CAP_SYS_ADMIN);
-       return false;
-}
-
-#define MAX_RECURSION_LEVEL 4
-
-static int unix_attach_fds(struct scm_cookie *scm, struct sk_buff *skb)
-{
-       int i;
-       unsigned char max_level = 0;
-
-       if (too_many_unix_fds(current))
-               return -ETOOMANYREFS;
-
-       for (i = scm->fp->count - 1; i >= 0; i--) {
-               struct sock *sk = unix_get_socket(scm->fp->fp[i]);
-
-               if (sk)
-                       max_level = max(max_level,
-                                       unix_sk(sk)->recursion_level);
-       }
-       if (unlikely(max_level > MAX_RECURSION_LEVEL))
-               return -ETOOMANYREFS;
-
-       /*
-        * Need to duplicate file references for the sake of garbage
-        * collection.  Otherwise a socket in the fps might become a
-        * candidate for GC while the skb is not yet queued.
-        */
-       UNIXCB(skb).fp = scm_fp_dup(scm->fp);
-       if (!UNIXCB(skb).fp)
-               return -ENOMEM;
-
-       for (i = scm->fp->count - 1; i >= 0; i--)
-               unix_inflight(scm->fp->user, scm->fp->fp[i]);
-       return max_level;
-}
-
 static int unix_scm_to_skb(struct scm_cookie *scm, struct sk_buff *skb, bool send_fds)
 {
        int err = 0;
index c36757e728442bb936c17f8a975b420f5f8a5972..8bbe1b8e4ff7f3da19a1809dc75b6fac8d23e1f1 100644 (file)
 #include <net/scm.h>
 #include <net/tcp_states.h>
 
+#include "scm.h"
+
 /* Internal data structures and random procedures: */
 
-static LIST_HEAD(gc_inflight_list);
 static LIST_HEAD(gc_candidates);
-static DEFINE_SPINLOCK(unix_gc_lock);
 static DECLARE_WAIT_QUEUE_HEAD(unix_gc_wait);
 
-unsigned int unix_tot_inflight;
-
-struct sock *unix_get_socket(struct file *filp)
-{
-       struct sock *u_sock = NULL;
-       struct inode *inode = file_inode(filp);
-
-       /* Socket ? */
-       if (S_ISSOCK(inode->i_mode) && !(filp->f_mode & FMODE_PATH)) {
-               struct socket *sock = SOCKET_I(inode);
-               struct sock *s = sock->sk;
-
-               /* PF_UNIX ? */
-               if (s && sock->ops && sock->ops->family == PF_UNIX)
-                       u_sock = s;
-       }
-       return u_sock;
-}
-
-/* Keep the number of times in flight count for the file
- * descriptor if it is for an AF_UNIX socket.
- */
-
-void unix_inflight(struct user_struct *user, struct file *fp)
-{
-       struct sock *s = unix_get_socket(fp);
-
-       spin_lock(&unix_gc_lock);
-
-       if (s) {
-               struct unix_sock *u = unix_sk(s);
-
-               if (atomic_long_inc_return(&u->inflight) == 1) {
-                       BUG_ON(!list_empty(&u->link));
-                       list_add_tail(&u->link, &gc_inflight_list);
-               } else {
-                       BUG_ON(list_empty(&u->link));
-               }
-               unix_tot_inflight++;
-       }
-       user->unix_inflight++;
-       spin_unlock(&unix_gc_lock);
-}
-
-void unix_notinflight(struct user_struct *user, struct file *fp)
-{
-       struct sock *s = unix_get_socket(fp);
-
-       spin_lock(&unix_gc_lock);
-
-       if (s) {
-               struct unix_sock *u = unix_sk(s);
-
-               BUG_ON(!atomic_long_read(&u->inflight));
-               BUG_ON(list_empty(&u->link));
-
-               if (atomic_long_dec_and_test(&u->inflight))
-                       list_del_init(&u->link);
-               unix_tot_inflight--;
-       }
-       user->unix_inflight--;
-       spin_unlock(&unix_gc_lock);
-}
-
 static void scan_inflight(struct sock *x, void (*func)(struct unix_sock *),
                          struct sk_buff_head *hitlist)
 {
diff --git a/net/unix/scm.c b/net/unix/scm.c
new file mode 100644 (file)
index 0000000..df8f636
--- /dev/null
@@ -0,0 +1,161 @@
+// SPDX-License-Identifier: GPL-2.0
+#include <linux/module.h>
+#include <linux/kernel.h>
+#include <linux/string.h>
+#include <linux/socket.h>
+#include <linux/net.h>
+#include <linux/fs.h>
+#include <net/af_unix.h>
+#include <net/scm.h>
+#include <linux/init.h>
+
+#include "scm.h"
+
+unsigned int unix_tot_inflight;
+EXPORT_SYMBOL(unix_tot_inflight);
+
+LIST_HEAD(gc_inflight_list);
+EXPORT_SYMBOL(gc_inflight_list);
+
+DEFINE_SPINLOCK(unix_gc_lock);
+EXPORT_SYMBOL(unix_gc_lock);
+
+struct sock *unix_get_socket(struct file *filp)
+{
+       struct sock *u_sock = NULL;
+       struct inode *inode = file_inode(filp);
+
+       /* Socket ? */
+       if (S_ISSOCK(inode->i_mode) && !(filp->f_mode & FMODE_PATH)) {
+               struct socket *sock = SOCKET_I(inode);
+               struct sock *s = sock->sk;
+
+               /* PF_UNIX ? */
+               if (s && sock->ops && sock->ops->family == PF_UNIX)
+                       u_sock = s;
+       }
+       return u_sock;
+}
+EXPORT_SYMBOL(unix_get_socket);
+
+/* Keep the number of times in flight count for the file
+ * descriptor if it is for an AF_UNIX socket.
+ */
+void unix_inflight(struct user_struct *user, struct file *fp)
+{
+       struct sock *s = unix_get_socket(fp);
+
+       spin_lock(&unix_gc_lock);
+
+       if (s) {
+               struct unix_sock *u = unix_sk(s);
+
+               if (atomic_long_inc_return(&u->inflight) == 1) {
+                       BUG_ON(!list_empty(&u->link));
+                       list_add_tail(&u->link, &gc_inflight_list);
+               } else {
+                       BUG_ON(list_empty(&u->link));
+               }
+               unix_tot_inflight++;
+       }
+       user->unix_inflight++;
+       spin_unlock(&unix_gc_lock);
+}
+
+void unix_notinflight(struct user_struct *user, struct file *fp)
+{
+       struct sock *s = unix_get_socket(fp);
+
+       spin_lock(&unix_gc_lock);
+
+       if (s) {
+               struct unix_sock *u = unix_sk(s);
+
+               BUG_ON(!atomic_long_read(&u->inflight));
+               BUG_ON(list_empty(&u->link));
+
+               if (atomic_long_dec_and_test(&u->inflight))
+                       list_del_init(&u->link);
+               unix_tot_inflight--;
+       }
+       user->unix_inflight--;
+       spin_unlock(&unix_gc_lock);
+}
+
+/*
+ * The "user->unix_inflight" variable is protected by the garbage
+ * collection lock, and we just read it locklessly here. If you go
+ * over the limit, there might be a tiny race in actually noticing
+ * it across threads. Tough.
+ */
+static inline bool too_many_unix_fds(struct task_struct *p)
+{
+       struct user_struct *user = current_user();
+
+       if (unlikely(user->unix_inflight > task_rlimit(p, RLIMIT_NOFILE)))
+               return !capable(CAP_SYS_RESOURCE) && !capable(CAP_SYS_ADMIN);
+       return false;
+}
+
+#define MAX_RECURSION_LEVEL 4
+
+int unix_attach_fds(struct scm_cookie *scm, struct sk_buff *skb)
+{
+       int i;
+       unsigned char max_level = 0;
+
+       if (too_many_unix_fds(current))
+               return -ETOOMANYREFS;
+
+       for (i = scm->fp->count - 1; i >= 0; i--) {
+               struct sock *sk = unix_get_socket(scm->fp->fp[i]);
+
+               if (sk)
+                       max_level = max(max_level,
+                                       unix_sk(sk)->recursion_level);
+       }
+       if (unlikely(max_level > MAX_RECURSION_LEVEL))
+               return -ETOOMANYREFS;
+
+       /*
+        * Need to duplicate file references for the sake of garbage
+        * collection.  Otherwise a socket in the fps might become a
+        * candidate for GC while the skb is not yet queued.
+        */
+       UNIXCB(skb).fp = scm_fp_dup(scm->fp);
+       if (!UNIXCB(skb).fp)
+               return -ENOMEM;
+
+       for (i = scm->fp->count - 1; i >= 0; i--)
+               unix_inflight(scm->fp->user, scm->fp->fp[i]);
+       return max_level;
+}
+EXPORT_SYMBOL(unix_attach_fds);
+
+void unix_detach_fds(struct scm_cookie *scm, struct sk_buff *skb)
+{
+       int i;
+
+       scm->fp = UNIXCB(skb).fp;
+       UNIXCB(skb).fp = NULL;
+
+       for (i = scm->fp->count-1; i >= 0; i--)
+               unix_notinflight(scm->fp->user, scm->fp->fp[i]);
+}
+EXPORT_SYMBOL(unix_detach_fds);
+
+void unix_destruct_scm(struct sk_buff *skb)
+{
+       struct scm_cookie scm;
+
+       memset(&scm, 0, sizeof(scm));
+       scm.pid  = UNIXCB(skb).pid;
+       if (UNIXCB(skb).fp)
+               unix_detach_fds(&scm, skb);
+
+       /* Alas, it calls VFS */
+       /* So fscking what? fput() had been SMP-safe since the last Summer */
+       scm_destroy(&scm);
+       sock_wfree(skb);
+}
+EXPORT_SYMBOL(unix_destruct_scm);
diff --git a/net/unix/scm.h b/net/unix/scm.h
new file mode 100644 (file)
index 0000000..5a255a4
--- /dev/null
@@ -0,0 +1,10 @@
+#ifndef NET_UNIX_SCM_H
+#define NET_UNIX_SCM_H
+
+extern struct list_head gc_inflight_list;
+extern spinlock_t unix_gc_lock;
+
+int unix_attach_fds(struct scm_cookie *scm, struct sk_buff *skb);
+void unix_detach_fds(struct scm_cookie *scm, struct sk_buff *skb);
+
+#endif