73 lines
13 KiB
TeX
73 lines
13 KiB
TeX
% !TEX root = ../bachelor-thesis.tex
|
||
|
||
\chapter{引言}
|
||
\label{chap:引言}
|
||
|
||
\section{研究背景}
|
||
|
||
近年来,实时音视频通信、跨地域文件传输、企业远程办公和云上应用访问等互联网服务快速发展\cite{applogic2026gipr},网络所承载的业务类型更加多样,它们都需要高质量的网络以维持优秀的用户体验(Quality of Experience, QoE)。例如,在高清实时音视频通讯业务中,参会用户之间存在频繁的实时互动,视频和音频帧必须按时送达,维持稳定的端到端延迟、减少抖动和丢包才能维持优秀的用户体验;相对地,文件下载业务对延迟并不敏感,可用带宽才是影响用户体验的主要因素。尽管这些应用的用户体验评价指标各不相同,但是它们都需要网络提供高吞吐、稳定低延迟且低丢包的高服务质量(Quality of Service, QoS)链路,以维持优秀的用户体验。
|
||
|
||
\nomenclature{QoE}{用户体验(Quality of Experience)}
|
||
\nomenclature{QoS}{服务质量(Quality of Service)}
|
||
|
||
然而,随着互联网应用的服务对象从局部区域逐渐扩展到全球范围,新增的大量跨域传输场景中网络状况复杂,使得维持优秀用户体验更加困难。跨国企业协作、跨地域云服务访问、国际在线会议和全球内容分发等场景使得通信双方经常位于不同国家和地区,用户连接不再局限于较短距离的本地网络,而是成为需要跨越多个自治系统、运营商网络和广域互联网链路的跨域连接。用户距离的增加和网络路径的拉长会放大底层网络状态变化对应用体验的影响,例如跨域链路中的拥塞、路由变化和链路质量波动都可能造成延迟升高、带宽下降或丢包增加。端到端优化方法可以在一定程度上缓解网络质量波动,例如通过拥塞控制算法调整发送速率、通过多路径传输绕开部分拥塞路径,但它们无法适配所有跨域网络中可能的情况,在大部分条件下仍旧无法提供优秀的服务质量,进而无法保证优秀用户体验。
|
||
|
||
为了给各种网络环境下的用户提供一致的高质量服务,网络服务商通常利用覆盖网络(Overlay Network)为跨地域用户建立连接。覆盖网络是一种建立在物理网络之上的逻辑网络,其各部分通常由软件系统统一管理,因而具有部署灵活、扩展方便和易于集中化管理等特点。服务商将底层复杂且动态变化的跨域传输过程隐藏于覆盖网络下,利用覆盖网络灵活可控的转发能力提升用户连接质量。跨域连接的用户需要利用覆盖网络建立连接时,发送端就近通过互联网接入最近的覆盖网络接入网关,数据经由覆盖网络转发至接收端就近接入的覆盖网络网关,经过互联网送达接收端用户,如图~\ref{fig:云网络转发拓扑}。这种转发方式可以使连接的大部分路径,特别是跨域传输阶段,由服务商可管理的覆盖网络承载,服务商也就能够通过优化覆盖网络内的转发节点、转发路径和链路质量来提升用户体验。
|
||
|
||
\begin{figure}[H]
|
||
\centering
|
||
\includegraphics[width=\linewidth]{cloud_network_rtc.drawio.pdf}
|
||
\caption{基于云网络的覆盖网络为用户提供服务}
|
||
\label{fig:云网络转发拓扑}
|
||
\end{figure}
|
||
|
||
当今的覆盖网络通常构建在云网络资源之上,云网络服务商提供多种资源供服务商按需选择。随着云计算和跨地域互联网服务的发展,服务商在构建覆盖网络时通常不再自行建设底层基础设施,而是租用云服务商在全球多个地区提供的服务器、网关和链路等计算与网络资源,并将这些资源抽象为覆盖网络中的转发节点、接入网关和逻辑链路。由于这些资源可以通过软件配置进行申请、扩展和调整,服务商能够根据业务覆盖范围、用户分布和流量需求快速构建跨地域覆盖网络。例如,当服务商需要连接不同地区的数据中心或接入点时,可以在相应区域租用计算节点作为转发网关,并在节点之间选择合适的网络链路,从而形成一条面向用户连接的覆盖网络转发路径。因此,覆盖网络的灵活性在很大程度上来自云网络资源的可配置性,而覆盖网络的服务质量也受到所选云资源质量的直接影响。
|
||
|
||
不同云资源的质量与定价有所区别,维持高网络服务质量同时降低成本是当今研究的重点。覆盖网络中同一条逻辑链路的连接通常可以由多条物理链路抽象而成,云网络服务商往往同时提供专线链路和公网链路等不同选择。专线链路通常延迟、丢包率都较低且稳定,能够提供较好的传输质量和用户体验,但其价格较高,且常按照流量峰值计费,大规模使用会给服务商带来较高的运营成本;公网链路价格较低,计费方式也更灵活,但容易受到其他用户流量的影响,在拥塞和竞争下出现延迟升高、丢包增加和带宽波动等问题,质量不稳定。全部使用专线链路可以较好地满足业务服务质量需求,但成本难以控制;完全依赖公网链路又可能导致服务质量无法稳定满足用户体验要求。因此,如何在保证覆盖网络高服务质量的同时尽可能降低资源使用成本,成为覆盖网络优化中亟须解决的问题。
|
||
|
||
\section{研究现状}
|
||
|
||
链路调度类的工作从覆盖网络管理者的角度出发,在对连接两端用户透明的前提下,利用覆盖网络中同一链路可由质量价格不同的多个链路抽象而来的特点,通过不断监控同一逻辑链路下的公网链路与专线链路的质量,并在公网质量优秀可以为用户提供优质服务的时段将部分流量经由公网链路发送,从而希望能以此降低在专线上发送的数据流量,从而降低使用专线的成本\cite{kataria2024titan,wu2023xron}。然而实际上,本研究的测量表明用户的高需求时段与公网链路质量下降时段基本重合,有大量流量需要提供服务时恰逢公网链路质量下降不能满足用户体验需求,公网链路的分流效果有限,大量流量仍旧通过专线转发,不能有效削减专线峰值流量,,而专线链路恰恰通过峰值流量计费,实际成本下降效果有限。
|
||
|
||
冗余编码类的工作从端到端用户的角度出发,在对转发覆盖网络透明的前提下,通过在发送端设计特殊的网络编码,通过前向纠错编码等编码应对传输过程中可能的丢包,从而降低上层应用感知到的丢包,提升了用户感知到的链路质量\cite{bolot1999adaptivefec,huang2010skypefec,holmer2013webrtcfec}。这些工作将传输链路看作一个不可变的黑盒,为了充分应对可能发生的丢包只能尽可能多地加入冗余信息,导致在一些链路质量良好的片段上也需要发送冗余包,产生了对优质链路带宽的浪费。
|
||
|
||
% 现有方法分别从覆盖网络链路调度和端到端冗余编码两个角度缓解公网链路质量不足的问题,但仍存在一定局限:前者依赖公网链路在部分时段具备足够好的传输质量,在公网质量下降且业务流量高峰同时出现时难以充分降低专线成本;后者将整条端到端路径视为不可区分的黑盒,往往需要为所有流量加入冗余,带来较高的额外带宽开销。针对上述问题,本文希望结合对链路的质量的实时感知和网络编码对低质量链路的性能提升,以低成本公网链路实现高网络服务质量。
|
||
|
||
\section{研究思路与贡献}
|
||
|
||
本文的核心观察是覆盖网络中的不同公网链路片段的性质差异大,部分跨域链路由于竞争激烈、延迟高,导致性能低下,而部分域内链路性能优秀,与专线质量接近,已有的工作没有考虑到覆盖网络中这种分段的特性,而本文提出应该站在链路层级上,对不同质量的链路分别进行传输优化。为实现对网络中不同链路的针对性质量提升,本文需要解决以下三个挑战:
|
||
\begin{enumerate}
|
||
\item \textbf{如何在通用覆盖网络中加入链路片段级冗余编码。} 覆盖网络承载的上层流量类型多样,用户数据包大小并不固定,部分数据包可能已经接近最大传输单元。因此,冗余机制不能依赖修改用户报文或在用户包内部预留空间,而需要以对应用透明的方式插入覆盖网络转发路径,并能够在单个低质量链路片段上完成编码与恢复。
|
||
\item \textbf{如何根据链路质量变化选择合适的冗余强度。} 公网链路的丢包率和连续丢包模式会随时间变化,若长期对所有链路使用固定冗余,会带来不必要的带宽开销;若冗余不足,又无法有效修复低质量链路。因此,系统需要根据实时链路状态判断是否启用冗余,并动态选择合适的编码参数。
|
||
\item \textbf{如何避免冗余解码过程影响端到端传输控制。} FEC解码通常以编码组为单位恢复数据包,可能造成数据包在解码端集中输出。这种突发式交付会影响接收端的包到达节奏,并进一步干扰拥塞控制、速率估计和实时应用的播放稳定性。因此,系统还需要在完成丢包恢复的同时保持平滑的数据交付节奏。
|
||
\end{enumerate}
|
||
|
||
基于此,本文设计了一套基于交织前向纠错编码(Interleaved Forward Error Correction, Interleaved FEC)的跨国公网链路优化方法。本文提出的方法使用公网实现覆盖网络中所有节点的互联,对覆盖网络中的每一段链路,通过监控链路上的丢包情况,利用马尔科夫链建模网络丢包模型,对低质量的链路动态选择FEC编码参数,并利用交织XOR编码进行编码和丢包恢复,并在解码时对输出速率利用比例-积分控制器进行动态平滑处理。本方法不需要使用专线连接,极大地降低了链路的使用成本,同时又有选择性地在低质量链路上使用冗余编码,避免了在高质量链路上添加额外带宽。另外,应用交织编码技术,将冗余包与数据包间隔其它数据包发送,极大地降低了链路连续丢包对丢包恢复的影响。
|
||
|
||
\nomenclature{FEC}{前向纠错编码(Forward Error Correction)}
|
||
|
||
本文实现了基于本文提出的分段链路质量优化方法的分布式覆盖网络转发以及针对低质量链路的冗余包计算及丢包恢复算法。经过对真实网络的模拟实验,本文提出的方法相比直接使用公网链路将端到端带宽提升了最高~\SI{260}{\percent}。
|
||
|
||
总结而言,本文主要的贡献是:
|
||
\begin{itemize}
|
||
\item 通过对公网链路的真实测量,指出了长距离跨域公网链路质量差的核心在于不同公网链路质量差距大、部分跨域链路片段存在链路质量差的特性;
|
||
\item 提出了通过针对性地对低质量链路片段加入冗余,以最低的额外带宽开销实现对链路整体质量的提升;
|
||
\item 实现并测量了本文提出的链路优化方法在跨国公网链路场景下对端到端性能的提升。
|
||
\end{itemize}
|
||
|
||
\section{论文内容}
|
||
|
||
本文共分为六章,各章内容安排如下:
|
||
|
||
第~\ref{chap:引言} 章为引言。本章介绍跨域云网络中覆盖网络传输的应用背景,分析专线链路成本高、公网链路质量不稳定所带来的矛盾,概述现有链路调度与冗余编码方法的不足,并给出本文的研究思路与主要贡献。
|
||
|
||
第~\ref{chap:背景介绍与研究动机} 章为背景介绍与研究动机。本章介绍云网络、覆盖网络以及前向纠错编码等必要背景,结合真实测量结果分析现有方法在跨域公网链路场景下的局限,指出低质量公网链路不应仅被规避,而应结合覆盖网络的分段转发能力进行针对性质量修复。
|
||
|
||
第~\ref{chap:相关工作} 章为相关工作。本章分别介绍覆盖网络与隧道技术、链路质量优化方法以及软件定义网络与网络调度相关研究,并分析这些工作与本文研究问题之间的联系和差异。
|
||
|
||
第~\ref{chap:跨域云网络传输性能提升研究} 章为跨域云网络传输性能提升方法。本章介绍本文提出的全公网链路优化系统,包括系统总体架构、交织XOR前向纠错编码设计、基于丢包统计的自适应参数调整方法,以及用于平滑解码端突发输出的速率控制机制。
|
||
|
||
第~\ref{chap:实验验证与分析} 章为实验验证与分析。本章介绍实验环境与实验设置,通过在模拟低质量链路条件下对比直接转发方案和本文方法的端到端吞吐性能,验证本文提出的分段链路质量修复方法的有效性。
|
||
|
||
第~\ref{chap:结论与展望} 章为结论与展望。本章总结全文的主要工作与实验结论,并讨论本文方法仍存在的不足以及未来可进一步优化的方向。
|