79 lines
14 KiB
TeX
79 lines
14 KiB
TeX
% !TEX root = ../bachelor-thesis.tex
|
||
|
||
\chapter{引言}
|
||
\label{chap:引言}
|
||
|
||
\section{研究背景}
|
||
|
||
近年来,实时音视频通信、跨地域文件传输、企业远程办公和云上应用访问等互联网服务快速发展\cite{applogic2026gipr},这些应用都需要优质的网络服务质量(Quality of Service, QoS)以提升用户体验(Quality of Experience, QoE)。随着网络应用类型变得更加多样,不同业务对用户体验的关注重点并不完全相同:实时交互类应用更关注稳定的音视频低时延、低卡顿率传输,文件传输类应用则更关注可用带宽和传输完成时间。尽管评价指标存在差异,这些应用都要求底层网络提供高吞吐、低时延和低丢包的高服务质量,以支撑稳定的用户体验。
|
||
|
||
\nomenclature{QoE}{用户体验(Quality of Experience)}
|
||
\nomenclature{QoS}{服务质量(Quality of Service)}
|
||
|
||
随着互联网服务的对象从局部区域扩展到全球范围,跨地域、跨运营商和跨自治系统的传输场景不断增加,网络质量保障变得更加困难。相比本地或域内连接,跨域连接通常路径更长、经过的网络实体更多,也更容易受到拥塞、路由变化和链路质量波动等因素影响,进而造成延迟升高、带宽下降或丢包增加。虽然端到端优化方法可以在一定程度上缓解网络质量波动,但仅依赖端到端调节难以在复杂跨域网络中持续提供稳定的高服务质量,因此需要进一步利用更可控的网络组织方式来改善传输质量。
|
||
|
||
为了给各种复杂多变的网络环境下的用户提供一致的高质量服务,网络服务商通常利用覆盖网络(Overlay Network)为跨地域用户建立连接。覆盖网络是一种建立在物理网络之上的逻辑网络,其各部分通常由软件系统统一管理,因而具有部署灵活、扩展方便和易于集中化管理等特点。服务商将底层复杂且动态变化的跨域传输过程隐藏于覆盖网络下,利用覆盖网络灵活可控的转发能力提升用户连接质量。跨域连接的用户需要利用覆盖网络建立连接时,发送端就近通过互联网接入最近的覆盖网络接入网关,数据经由覆盖网络转发至接收端就近接入的覆盖网络网关,经过互联网送达接收端用户,如图~\ref{fig:云网络转发拓扑}。这种转发方式可以使连接的大部分路径,特别是跨域传输阶段,由服务商可管理的覆盖网络承载,服务商也就能够通过优化覆盖网络内的转发节点、转发路径和链路质量来提升用户体验。
|
||
|
||
\begin{figure}[H]
|
||
\centering
|
||
\includegraphics[width=\linewidth]{cloud_network_rtc.drawio.pdf}
|
||
\caption{基于云网络的覆盖网络为用户提供服务}
|
||
\label{fig:云网络转发拓扑}
|
||
\end{figure}
|
||
|
||
当今服务商建立的覆盖网络通常构建在云网络资源之上,云网络服务商提供多种资源供服务商按需选择。随着云计算和跨地域互联网服务的发展,服务商在构建覆盖网络时通常不再自行建设底层基础设施,而是租用云服务商在全球多个地区提供的服务器、网关和链路等计算与网络资源,并将这些资源抽象为覆盖网络中的转发节点、接入网关和逻辑链路。由于这些资源可以通过软件配置进行申请、扩展和调整,服务商能够根据业务覆盖范围、用户分布和流量需求快速构建跨地域覆盖网络。例如,当服务商需要连接不同地区的数据中心或接入点时,可以在相应区域租用计算节点作为转发网关,并在节点之间选择合适的网络链路,从而形成一条面向用户连接的覆盖网络转发路径。
|
||
|
||
覆盖网络的灵活性在很大程度上来自云网络资源的可配置性,而覆盖网络的服务质量和运营成本也受到所选云资源质量和定价的直接影响,维持高网络服务质量同时降低成本是当今研究的重点。覆盖网络中同一条逻辑链路的连接通常可以由多条不同的物理链路抽象而成,云网络服务商往往同时提供专线链路和公网链路等不同选择。专线链路通常延迟、丢包率都较低且稳定,能够提供较好的传输质量和用户体验,但其价格较高,且常按照流量峰值计费,大规模使用会给服务商带来较高的运营成本;公网链路价格较低,计费方式也更灵活,但容易受到其他用户流量的影响,在拥塞和竞争下出现延迟升高、丢包增加和带宽波动等问题,质量不稳定。现代服务商为确保高质量服务而选择全部使用专线链路可以较好地满足业务服务质量需求,但成本难以控制;完全依赖公网链路又可能导致服务质量无法稳定满足用户体验要求。因此,如何在保证覆盖网络高服务质量的同时尽可能降低资源使用成本,成为覆盖网络优化中亟须解决的问题。
|
||
|
||
\section{研究现状}
|
||
|
||
现有的研究方案主要从两类视角审视覆盖网络传输,并对其进行优化。一些工作从覆盖网络管理者的角度对覆盖网络的调度、链路选择等进行优化;另外一些工作从端到端用户的角度进行优化,对发送速率、发送内容等进行调控和编码。
|
||
|
||
链路调度类的工作从覆盖网络管理者的角度出发,通过网络路径选择等手段,利用低成本链路质量较好的时间窗口分担高成本链路流量。这些工作在对连接两端用户透明的前提下,利用覆盖网络中同一链路可由质量价格不同的多个链路抽象而来的特点,通过不断监控同一逻辑链路下的公网链路与专线链路的质量,并在公网质量优秀可以为用户提供优质服务的时段将部分流量经由公网链路发送。这些工作利用低价公网对高价专线分流,降低了在专线上发送的数据流量,从而降低使用专线的成本\cite{kataria2024titan,wu2023xron}。
|
||
|
||
% 然而实际上,本研究的测量表明用户的高需求时段与公网链路质量下降时段基本重合,有大量流量需要提供服务时恰逢公网链路质量下降不能满足用户体验需求,公网链路的分流效果有限,大量流量仍旧通过专线转发,不能有效削减专线峰值流量,而专线链路恰恰通过峰值流量计费,实际成本下降效果有限。
|
||
|
||
冗余编码类的工作从端到端用户的角度出发,在对转发覆盖网络透明的前提下,将发送端的发送策略随网络进行调整,以提升传输性能。一些工作通过主动探测网络状态调整发送速率,以充分利用网络带宽\cite{ha2008cubiccca,cardwell2016bbrcca,arun2018copacca}。另外一些工作通过在发送端设计针对性的网络编码以应对传输过程中可能的丢包。这些工作大多应用前向纠错编码等编码,通过发送额外的冗余信息,使接收端从冗余信息恢复丢失包,从而降低上层应用感知到的丢包,提升了用户感知到的链路质量\cite{bolot1999adaptivefec,huang2010skypefec,holmer2013webrtcfec}。
|
||
|
||
% 这些工作将传输链路看作一个不可变的黑盒,为了充分应对可能发生的丢包只能尽可能多地加入冗余信息,导致在一些链路质量良好的片段上也需要发送冗余包,产生了对优质链路带宽的浪费。
|
||
|
||
然而,这两类方法在跨域公网链路场景下仍存在局限。链路调度类工作希望在公网链路质量较好时利用其分担部分流量,但这种方法依赖低成本链路在业务高峰时段仍能提供足够稳定的服务质量;而在实际网络中,用户需求较高的时段往往也伴随着公网链路拥塞和质量下降,导致公网链路难以实现大流量的高质量传输,专线峰值流量仍然难以有效降低。端到端优化类工作则将整条传输路径视为不可区分的整体,只能根据端到端观测结果调整发送速率或加入冗余信息,难以判断性能瓶颈究竟来自路径中的哪一段链路。为了应对可能发生的丢包,这类方法通常需要对整条路径上的流量统一加入冗余,即使部分链路片段质量良好也会产生额外带宽开销;同时,单纯降低发送速率虽然可以缓解拥塞,却无法直接修复低质量链路上的丢包问题,且浪费了可用的带宽资源。上述局限表明,现有方法要么从覆盖网络层面规避低质量公网链路,要么从端到端层面被动适应路径质量变化,尚未充分利用覆盖网络中路径可拆分、链路可感知和节点可控的特点。
|
||
|
||
\section{研究思路与贡献}
|
||
|
||
本文的核心观察是覆盖网络中的不同公网链路片段的性质差异大,应分段进行优化。覆盖网络中,部分跨域链路由于竞争激烈、延迟高,导致性能低下,而部分域内链路性能优秀,与专线质量接近,已有的工作没有考虑到覆盖网络中不同链路片段的性质差异,导致优化效果不佳。本文提出应该站在覆盖网络的链路层级上,对不同质量的链路分别进行针对性的传输优化。为实现对网络中不同链路的针对性质量提升,本文需要解决以下两个挑战:
|
||
\begin{enumerate}
|
||
\item \textbf{如何应对各个链路片段频繁且不可预测的链路质量变化。} 公网链路的丢包率和连续丢包模式会随时间变化,若长期对所有链路使用固定冗余,会带来不必要的带宽开销;若冗余不足,又无法有效修复低质量链路。因此,系统需要根据实时链路状态判断是否启用冗余,并动态选择合适的编码参数。
|
||
\item \textbf{如何在对传输两端透明的前提下提升部分链路的传输质量。} 覆盖网络承载的上层业务类型多样,传输两端通常并不知道中间覆盖网络的转发细节,也难以配合覆盖网络内部的链路优化。因此,优化机制不能依赖修改应用报文、改变端到端协议语义或要求发送端与接收端协同,而需要能够在覆盖网络内部的单个低质量链路片段上独立完成质量修复。同时,链路片段级修复还必须保持端到端数据包的正常传输节奏,避免因中间节点处理造成突发交付、乱序或额外时延,从而干扰上层拥塞控制和实时应用体验。
|
||
% FEC解码通常以编码组为单位恢复数据包,可能造成数据包在解码端集中输出。这种突发式交付会影响接收端的包到达节奏,并进一步干扰拥塞控制、速率估计和实时应用的播放稳定性。因此,系统还需要在完成丢包恢复的同时保持平滑的数据交付节奏。
|
||
\end{enumerate}
|
||
|
||
基于此,本文设计了一套基于交织前向纠错编码(Interleaved Forward Error Correction, Interleaved FEC)的跨域公网链路优化方法。本文提出的方法使用公网实现覆盖网络中所有节点的互联,对覆盖网络中的每一段链路,通过监控链路上的丢包情况,利用马尔科夫链建模网络丢包模型,对低质量的链路动态选择FEC编码参数,并利用交织XOR编码进行编码和丢包恢复,最后在解码时对输出速率利用比例-积分控制器进行动态平滑处理。本方法不需要使用专线连接,极大地降低了链路的使用成本,同时又有选择性地在低质量链路上使用冗余编码,避免了在高质量链路上添加额外冗余造成带宽浪费。另外,应用交织编码技术,将冗余包与数据包间隔其它数据包发送,极大地降低了链路连续丢包对丢包恢复的影响。
|
||
|
||
\nomenclature{FEC}{前向纠错编码(Forward Error Correction)}
|
||
|
||
本文实现了基于本文提出的分段链路质量优化方法的分布式覆盖网络转发以及针对低质量链路的冗余包计算及丢包恢复算法。经过对真实网络的模拟实验,本文提出的方法相比直接使用公网链路将端到端带宽提升了最高~\SI{260}{\percent}。
|
||
|
||
总结而言,本文主要的贡献是:
|
||
\begin{itemize}
|
||
\item 通过对公网链路的真实测量,指出了长距离跨域公网链路质量差的核心在于不同公网链路质量差距大、部分跨域链路片段存在链路质量差的特性;
|
||
\item 提出了通过针对性地对低质量链路片段加入冗余,以最低的额外带宽开销实现对链路整体质量的提升;
|
||
\item 实现并测量了本文提出的链路优化方法在跨域公网链路场景下对端到端性能的提升。
|
||
\end{itemize}
|
||
|
||
\section{论文内容}
|
||
|
||
本文共分为六章,各章内容安排如下:
|
||
|
||
第~\ref{chap:引言} 章为引言。本章介绍跨域云网络中覆盖网络传输的应用背景,分析专线链路成本高、公网链路质量不稳定所带来的矛盾,概述现有链路调度与冗余编码方法的不足,并给出本文的研究思路与主要贡献。
|
||
|
||
第~\ref{chap:背景介绍与研究动机} 章为背景介绍与研究动机。本章介绍云网络、覆盖网络以及前向纠错编码等研究背景,结合真实测量结果分析现有方法在跨域公网链路场景下的局限,指出低质量公网链路不应在调度时被舍弃,而应结合覆盖网络的分段转发能力进行针对性质量修复。
|
||
|
||
第~\ref{chap:相关工作} 章为相关工作。本章分别介绍覆盖网络与隧道技术、链路质量优化方法以及软件定义网络与网络调度相关研究,并分析这些工作与本文研究问题之间的联系和差异。
|
||
|
||
第~\ref{chap:跨域云网络传输性能提升研究} 章为跨域云网络传输性能提升方法。本章介绍本文提出的全公网链路优化系统,包括系统总体架构、交织XOR前向纠错编码设计、基于丢包统计的自适应参数调整方法,以及用于平滑解码端突发输出的速率控制机制。
|
||
|
||
第~\ref{chap:实验验证与分析} 章为实验验证与分析。本章介绍实验环境与实验设置,通过在模拟低质量链路条件下对比直接转发方案和本文方法的端到端吞吐性能,验证本文提出的分段链路质量修复方法的有效性。
|
||
|
||
第~\ref{chap:结论与展望} 章为结论与展望。本章总结全文的主要工作与实验结论,并讨论本文方法仍存在的不足以及未来可进一步优化的方向。
|