qdisc: validate skb without holding lock

author Eric Dumazet <edumazet@google.com>

Fri, 3 Oct 2014 22:31:07 +0000 (15:31 -0700)

committer David S. Miller <davem@davemloft.net>

Fri, 3 Oct 2014 22:36:11 +0000 (15:36 -0700)
author Eric Dumazet <edumazet@google.com>
Fri, 3 Oct 2014 22:31:07 +0000 (15:31 -0700)
committer David S. Miller <davem@davemloft.net>
Fri, 3 Oct 2014 22:36:11 +0000 (15:36 -0700)
diff --git a/include/linux/netdevice.h b/include/linux/netdevice.h

index 9b7fbacb6296f28c225807e33b851bcaeec2a59d..910fb17ad14898ac9fdbc3d91e951f6b1182bb59 100644 (file)
--- a/include/linux/netdevice.h
+++ b/include/linux/netdevice.h
@@ -2821,7 +2821,7 @@ int dev_set_mac_address(struct net_device *, struct sockaddr *);
  int dev_change_carrier(struct net_device *, bool new_carrier);
  int dev_get_phys_port_id(struct net_device *dev,
                          struct netdev_phys_port_id *ppid);
-struct sk_buff *validate_xmit_skb(struct sk_buff *skb, struct net_device *dev);
+struct sk_buff *validate_xmit_skb_list(struct sk_buff *skb, struct net_device *dev);
  struct sk_buff *dev_hard_start_xmit(struct sk_buff *skb, struct net_device *dev,
                                     struct netdev_queue *txq, int *ret);
  int __dev_forward_skb(struct net_device *dev, struct sk_buff *skb);
diff --git a/include/net/pkt_sched.h b/include/net/pkt_sched.h

index 8bbe626e9ece3d927047fa59b8717301c65c6130..e4b3c828c1c271683dd0efc75099ad570ef80a84 100644 (file)
--- a/include/net/pkt_sched.h
+++ b/include/net/pkt_sched.h
@@ -99,7 +99,7 @@ void qdisc_put_stab(struct qdisc_size_table *tab);
  void qdisc_warn_nonwc(const char *txt, struct Qdisc *qdisc);
  int sch_direct_xmit(struct sk_buff *skb, struct Qdisc *q,
                     struct net_device *dev, struct netdev_queue *txq,
-                   spinlock_t *root_lock);
+                   spinlock_t *root_lock, bool validate);
  
  void __qdisc_run(struct Qdisc *q);
  
diff --git a/net/core/dev.c b/net/core/dev.c

index e55c546717d4d6530fa50f83e463f39fdc717ecf..1a90530f83ffd7afc2b748dccea730218f4b2f40 100644 (file)
--- a/net/core/dev.c
+++ b/net/core/dev.c
@@ -2655,7 +2655,7 @@ struct sk_buff *validate_xmit_vlan(struct sk_buff *skb, netdev_features_t featur
         return skb;
  }
  
-struct sk_buff *validate_xmit_skb(struct sk_buff *skb, struct net_device *dev)
+static struct sk_buff *validate_xmit_skb(struct sk_buff *skb, struct net_device *dev)
  {
         netdev_features_t features;
  
@@ -2720,6 +2720,30 @@ out_null:
         return NULL;
  }
  
+struct sk_buff *validate_xmit_skb_list(struct sk_buff *skb, struct net_device *dev)
+{
+       struct sk_buff *next, *head = NULL, *tail;
+
+       while (skb) {
+               next = skb->next;
+               skb->next = NULL;
+               skb = validate_xmit_skb(skb, dev);
+               if (skb) {
+                       struct sk_buff *end = skb;
+
+                       while (end->next)
+                               end = end->next;
+                       if (!head)
+                               head = skb;
+                       else
+                               tail->next = skb;
+                       tail = end;
+               }
+               skb = next;
+       }
+       return head;
+}
+
  static void qdisc_pkt_len_init(struct sk_buff *skb)
  {
         const struct skb_shared_info *shinfo = skb_shinfo(skb);
@@ -2786,8 +2810,7 @@ static inline int __dev_xmit_skb(struct sk_buff *skb, struct Qdisc *q,
  
                 qdisc_bstats_update(q, skb);
  
-               skb = validate_xmit_skb(skb, dev);
-               if (skb && sch_direct_xmit(skb, q, dev, txq, root_lock)) {
+               if (sch_direct_xmit(skb, q, dev, txq, root_lock, true)) {
                         if (unlikely(contended)) {
                                 spin_unlock(&q->busylock);
                                 contended = false;
diff --git a/net/sched/sch_generic.c b/net/sched/sch_generic.c

index 797ebef73642133c916b7e2013461d733eac677b..2b349a4de3c8e3491fad210a9400d26bda5b52fe 100644 (file)
--- a/net/sched/sch_generic.c
+++ b/net/sched/sch_generic.c
@@ -56,40 +56,34 @@ static inline int dev_requeue_skb(struct sk_buff *skb, struct Qdisc *q)
         return 0;
  }
  
-static struct sk_buff *try_bulk_dequeue_skb(struct Qdisc *q,
-                                           struct sk_buff *head_skb,
-                                           int bytelimit)
+static void try_bulk_dequeue_skb(struct Qdisc *q,
+                                struct sk_buff *skb,
+                                const struct netdev_queue *txq)
  {
-       struct sk_buff *skb, *tail_skb = head_skb;
+       int bytelimit = qdisc_avail_bulklimit(txq) - skb->len;
  
         while (bytelimit > 0) {
-               skb = q->dequeue(q);
-               if (!skb)
-                       break;
+               struct sk_buff *nskb = q->dequeue(q);
  
-               bytelimit -= skb->len; /* covers GSO len */
-               skb = validate_xmit_skb(skb, qdisc_dev(q));
-               if (!skb)
+               if (!nskb)
                         break;
  
-               while (tail_skb->next) /* GSO list goto tail */
-                       tail_skb = tail_skb->next;
-
-               tail_skb->next = skb;
-               tail_skb = skb;
+               bytelimit -= nskb->len; /* covers GSO len */
+               skb->next = nskb;
+               skb = nskb;
         }
-
-       return head_skb;
+       skb->next = NULL;
  }
  
  /* Note that dequeue_skb can possibly return a SKB list (via skb->next).
   * A requeued skb (via q->gso_skb) can also be a SKB list.
   */
-static inline struct sk_buff *dequeue_skb(struct Qdisc *q)
+static struct sk_buff *dequeue_skb(struct Qdisc *q, bool *validate)
  {
         struct sk_buff *skb = q->gso_skb;
         const struct netdev_queue *txq = q->dev_queue;
  
+       *validate = true;
         if (unlikely(skb)) {
                 /* check the reason of requeuing without tx lock first */
                 txq = skb_get_tx_queue(txq->dev, skb);
@@ -98,21 +92,16 @@ static inline struct sk_buff *dequeue_skb(struct Qdisc *q)
                         q->q.qlen--;
                 } else
                         skb = NULL;
+               /* skb in gso_skb were already validated */
+               *validate = false;
         } else {
                 if (!(q->flags & TCQ_F_ONETXQUEUE) ||
                     !netif_xmit_frozen_or_stopped(txq)) {
-                       int bytelimit = qdisc_avail_bulklimit(txq);
-
                         skb = q->dequeue(q);
-                       if (skb) {
-                               bytelimit -= skb->len;
-                               skb = validate_xmit_skb(skb, qdisc_dev(q));
-                       }
                         if (skb && qdisc_may_bulk(q))
-                               skb = try_bulk_dequeue_skb(q, skb, bytelimit);
+                               try_bulk_dequeue_skb(q, skb, txq);
                 }
         }
-
         return skb;
  }
  
@@ -156,19 +145,24 @@ static inline int handle_dev_cpu_collision(struct sk_buff *skb,
   */
  int sch_direct_xmit(struct sk_buff *skb, struct Qdisc *q,
                     struct net_device *dev, struct netdev_queue *txq,
-                   spinlock_t *root_lock)
+                   spinlock_t *root_lock, bool validate)
  {
         int ret = NETDEV_TX_BUSY;
  
         /* And release qdisc */
         spin_unlock(root_lock);
  
-       HARD_TX_LOCK(dev, txq, smp_processor_id());
-       if (!netif_xmit_frozen_or_stopped(txq))
-               skb = dev_hard_start_xmit(skb, dev, txq, &ret);
+       /* Note that we validate skb (GSO, checksum, ...) outside of locks */
+       if (validate)
+               skb = validate_xmit_skb_list(skb, dev);
  
-       HARD_TX_UNLOCK(dev, txq);
+       if (skb) {
+               HARD_TX_LOCK(dev, txq, smp_processor_id());
+               if (!netif_xmit_frozen_or_stopped(txq))
+                       skb = dev_hard_start_xmit(skb, dev, txq, &ret);
  
+               HARD_TX_UNLOCK(dev, txq);
+       }
         spin_lock(root_lock);
  
         if (dev_xmit_complete(ret)) {
@@ -217,9 +211,10 @@ static inline int qdisc_restart(struct Qdisc *q)
         struct net_device *dev;
         spinlock_t *root_lock;
         struct sk_buff *skb;
+       bool validate;
  
         /* Dequeue packet */
-       skb = dequeue_skb(q);
+       skb = dequeue_skb(q, &validate);
         if (unlikely(!skb))
                 return 0;
  
@@ -229,7 +224,7 @@ static inline int qdisc_restart(struct Qdisc *q)
         dev = qdisc_dev(q);
         txq = skb_get_tx_queue(dev, skb);
  
-       return sch_direct_xmit(skb, q, dev, txq, root_lock);
+       return sch_direct_xmit(skb, q, dev, txq, root_lock, validate);
  }
  
  void __qdisc_run(struct Qdisc *q)
author	Eric Dumazet <edumazet@google.com>
	Fri, 3 Oct 2014 22:31:07 +0000 (15:31 -0700)
committer	David S. Miller <davem@davemloft.net>
	Fri, 3 Oct 2014 22:36:11 +0000 (15:36 -0700)
include/linux/netdevice.h		patch \| blob \| blame \| history
include/net/pkt_sched.h		patch \| blob \| blame \| history
net/core/dev.c		patch \| blob \| blame \| history
net/sched/sch_generic.c		patch \| blob \| blame \| history