Nowadays massive amounts of data are being moved over the Internet thanks to data-hungry applications, Big Data, and multimedia content. Combined with a reduction in cost and augmented reliability for high-speed broadband access, the whole Internet infrastructure is facing new challenges especially when information crosses long geographical distances. That is the case for Wide Area Networks (WANs), which are typically traversed in enterprises with multi-site
deployments. When a connection is established between end-points that are geographically distant with high latency and high bandwidth, data is flowing over a so-called Long Fat Network. Currently, transport protocols in end-points are not able to exploit the resources of such links, notably the most common TCP implementations still stuffer from design flaws that limit their efficiency. More recent developments still suffer from low fairness in resource sharing and lack of
global visibility.
We identify SD-WAN as an SDN use-case that can enable new transport protocols adoption, improving traffic behavior over WANs, without the need to modify the end-points. In this thesis, we explore new approaches to network measurements that will enable both end-points and SD-WAN edge routers, to gain visibility over the end-to-end network status. Such additional visibility promotes the development of smarter control mechanisms for network traffic.
The preliminary study carried on comprises TCP behavior over WANs and existing methodologies to control its traffic patterns and enforce rate throttling. We also identify a specific use case that poses challenges for WAN scenarios: the Split TCP connections in a Performance Enhancing Proxy (PEP). New control
mechanisms to improve resource utilization and fairness are defined in this project. Specifically, we propose a new approach called Receive Window Modulation (RWM) that allows edge-routers to control the sending rate of a TCP connection by modifying the window advertised by the receiver. We prove that such a controller can improve TCP efficiency and fairness by leveraging local information and additional contextual information obtained from network measurements.
It also provides a lossless throttling mechanism, allowing for policy enforcement without hindering TCP throughput. We validate RWM in a real experimental scenario, showing improvements of up to 70% in TCP throughput when coupled with loss-based congestion controls. Bufferbloat is also mitigated, reducing the
end-to-end TCP latency measured almost three-fold in some scenarios.
Another contribution of this project includes a new method to estimate network available bandwidth from TCP passive probings based on the statistical analysis of the Inter-Packet arrival time (SABES). The methodology is based on the packet dispersion model and takes advantage of state-of-the-art machine learning techniques to improve its accuracy, including Deep Neural Networks and Kernel Density Estimation. We validate the model in both simulations and real-world
experiments, obtaining a median of the mean absolute error distribution of less than 10% of the network capacity.
We study network capacity estimation and bottleneck detection with an innovative active probing approach called HIRE. We propose a new packet dispersion model that takes into account the packet pairs delay, allowing for precise end-to-end capacity estimation. HIRE also introduces the concept of Hidden packets Red-shift Effect, which consists of injecting TTL expiring packets in between probing pairs at a specific rate. This technique allows locating the narrow link position along the path. We validate the model in simulations obtaining an estimation error of less than 3% in most scenarios. All these contributions constitute the building blocks of a Stateful Edge Router Architecture, SERA. Such architecture is presented in the final part of the dissertation, preparing the ground for future developments.
Hoy en día, Internet mueve cantidades considerables de datos debido a aplicaciones que requieren muchos datos (Big Data). En combinación con una reducción en los costes y un aumento en la fiabilidad de los enlaces de acceso a banda ancha, la infraestructura de Internet tiene que hacer frente a nuevos retos, especialmente cuando la información tiene que atravesar grandes distancias geográficas. Esto es el caso de las Redes de Area Extendida (WANs), que típicamente forman parte de la infraestructura de empresas con distintas sedes y oficinas. Hoy en día, los protocoles de transporto en los puntos finales no son capaces de explotar los recursos de las WANs, las mas comunes siendo implementaciones de TCP, las cuales todavía sufren de fallos en sus diseños que limitan la eficiencia. Desarrollos TCP recientes todavía no garantizan una repartición equitativa de los recursos de red y faltan de visibilidad global. Identificamos SD-WAN como un caso de uso el cual puede facilitar la adopción de nuevos protocoles de transporte, mejorando el comportamiento del trafico de red sobre WANs, sin la necesidad de modificar los puntos finales. En esta tesis exploramos nuevas propuestas en el campo de las medidas de red, las cuales permiten tanto a puntos finales como a router de borde, de ganar visibilidad sobre el estado de la red. Dicha visibilidad añadida permite el desarrollo de mecanismos de control del trafico de red mas inteligentes. Identificamos un caso de uso especifico que pone retos en los escenarios WAN: las conexiones Split TCP en el caso de un Performance Enhancing Proxy (PEP). En el proyecto vienen definidos nuevos mecanismos que mejoran la explotación y repartición de los recursos de red. En concreto, proponemos un nuevo esquema llamado Receive Window Modulation (RWM), que permite a los routers de borde controlar la ratio de envío de una conexión TCP modificando la ventana de recepción declarada por el recibidor. Probamos que dicho controlador puede mejorar la eficiencia y equidad de TCP, utilizando informaciones locales y de contexto obtenidas por medio de medidas de red. RWM también provee un mecanismo de control del trafico privo de perdidas sin dañar el rendimiento de TCP. Hemos validado RWM en un entorno experimental real, demostrando mejoras de hasta el 70% en el rendimiento de TCP. El fenómeno de bufferbloat también viene mitigado, reduciendo la latencia medida hasta tres veces en algunos escenarios. Hemos estudiado un método de estimación del ancho de banda disponible basado en el análisis estadístico de muestras de trafico TCP y de su tiempo de llegada entre paquetes, llamado SABES. La metodología se basa en modelo de dispersión de los paquetes y utiliza técnicas de aprendizaje automático para mejorar su precisión, incluyendo redes neurales profundas (DNN) y estimación de densidad de kernel (KDE). Hemos validado el modelo tanto en entornos simulados como en experimentos reales, obteniendo una mediana del error medio absoluto menor del 10% de la capacidad de red. También hemos estudiado la estimación de la capacidad de red y detección de cuellos de botella con una técnica innovadora que utiliza sondeo activo, que llamamos HIRE. Proponemos un nuevo modelo de dispersión de paquetes el cual tiene en cuenta la latencia de la pareja de paquetes, permitiendo estimar con elevada precisión la capacidad del camino. HIRE también introduce el concepto de Efecto de corrimiento al rojo para paquetes escondidos, el cual consiste en inyectar paquetes que caducaran debido a su TTL entre parejas de sondeo activo a una ratio de envío especifica. Esta técnica permite localizar la posición del enlace a capacidad menor en el camino. Hemos validado el modelo en entornos simulados obteniendo un error de estimación inferior al 3% en la mayoría de los escenarios. Una arquitectura que reúne todos los componentes introducidos viene presentada la parte final de la tesis, preparando el terreno para desarrollo de futuros desarrollos