Files
bachelor-thesis/defense_slides_outline.md
2026-06-08 09:29:02 +08:00

12 KiB
Raw Blame History

本科答辩 Slides 大纲

题目建议:面向跨域公网覆盖网络的分段链路质量修复

核心策略不要把“测量”和“observation”放在背景里讲而是把它们作为本文的第一项工作与第一项贡献。背景只保留听懂问题所必需的 2-3 句话。

总体叙事

答辩老师要求“不要讲背景”,本质上是希望不要花大量时间介绍领域常识和相关工作。因此 slides 可以采用下面的叙事:

  1. 服务商需要用覆盖网络为跨域用户提供稳定传输,但专线贵、公网便宜但不稳定。
  2. 本文先做测量,发现现有“公网好时分流、差时用专线”的思路难以降低峰值成本;同时,公网并不是整体都差,而是不同链路片段差异很大。
  3. 因此,本文提出:不把低质量公网链路直接放弃,而是在全公网覆盖网络中,只对低质量链路片段做质量修复。
  4. 为此,本文设计了分段 FEC 修复、自适应参数选择和解码端 pacer并实现原型系统。
  5. 实验表明,该方法能够识别低质量片段并只在那里启用 FEC最高带来约 3.6 倍吞吐提升。

这套讲法的好处是:开头仍然给了老师理解贡献所需的最小上下文,但从第 3 页开始就进入“我们的发现”和“我们的设计”,不会显得在讲大段背景。

建议页数与时间

建议 12-14 页,适合 8-12 分钟答辩。若时间更短,可以删掉“相关工作差异”页或把 Pacer 压缩到系统设计页里。

Slide 1: 标题页

标题:面向跨域公网覆盖网络的分段链路质量修复

内容:

  • 姓名、导师、院系
  • 一句话副标题:在全公网覆盖网络中,仅对低质量链路片段进行自适应 FEC 修复

讲述目标:

  • 直接让老师知道本文做的是“公网覆盖网络”“分段修复”“FEC”。

Slide 2: 问题一句话说明

标题:跨域覆盖网络的核心矛盾:质量与成本

建议配图:

  • figures/cloud_network_rtc.drawio.pdf

内容:

  • 服务商用覆盖网络连接跨地域用户。
  • 专线链路质量稳定,但成本高,且常按峰值带宽计费。
  • 公网链路成本低,但在跨域场景中容易丢包和波动。

讲述目标:

  • 这页就是“必要背景”,控制在 30-45 秒。
  • 不展开云网络、Overlay、QoS/QoE 等概念,只说清楚“为什么需要优化”。

Slide 3: 本文关注的问题

标题:能否少依赖专线,同时维持跨域传输质量?

内容:

  • 已有调度思路:公网质量好时分流,公网质量差时回到专线。
  • 已有端到端优化:把整条路径当成一条黑盒链路,统一调速或统一加冗余。
  • 本文的问题:在覆盖网络可控、路径可分段的条件下,能否更细粒度地修复公网链路?

讲述目标:

  • 这页不是相关工作综述,而是问题定义。
  • 重点落在“覆盖网络路径是分段的”,为后续 observation 铺垫。

Slide 4: 贡献总览

标题:本文贡献

内容:

  1. 通过真实公网测量,发现公网质量下降与用户流量高峰重合,且不同公网链路片段质量差异显著。
  2. 提出分段链路质量修复:在全公网覆盖网络中,仅对低质量链路片段加入冗余修复。
  3. 设计并实现自适应交织 XOR FEC、三状态丢包模型参数选择和解码端输出速率控制。
  4. 实现 Rust 原型系统并实验验证,最高实现约 3.6 倍端到端吞吐提升。

讲述目标:

  • 提前把所有创新点摆出来。
  • 后续 slides 就是逐一展开这些贡献。

Slide 5: 测量发现一:公网劣化发生在最需要它的时候

标题Observation 1公网质量下降与用户流量高峰重合

建议配图:

  • figures/hongkong-jinan-withbd.pdf

内容:

  • 用户流量升高时,公网链路更容易出现丢包率上升和延迟波动。
  • 这使“公网质量好时分流”的窗口往往出现在低流量时段。
  • 由于专线常按峰值带宽计费,低峰时分流难以显著降低专线成本。

讲述目标:

  • 把测量作为“我们的发现”,不要说成背景。
  • 这页回答:为什么只做公网/专线调度不够。

Slide 6: 测量发现二:公网不是整体都差

标题Observation 2公网链路质量具有明显片段差异

建议配图:

  • figures/loss_avg_heatmap.pdf

内容:

  • 一些公网链路片段平均丢包率很低,接近专线质量。
  • 另一些跨域片段丢包明显,是端到端质量下降的主要来源。
  • 端到端方法只能看到整条路径变差,无法定位是哪一段链路造成问题。

讲述目标:

  • 这页回答:为什么应该“分段修复”而不是“端到端统一冗余”。

Slide 7: 关键想法

标题:从“规避低质量公网”到“修复低质量片段”

建议配图:

  • 可使用 figures/all_redundent_waste.drawio.pdf
  • 或者重画成更适合 slides 的 A-B-C 三节点示意图

内容:

  • 传统调度:公网差时切回专线。
  • 端到端 FEC整条路径统一加冗余可能浪费好链路带宽。
  • 本文方法:全公网互联,只在低质量链路片段两端做 FEC 修复。

一句话 takeaway

  • 把冗余开销限制在真正发生丢包的链路片段上。

讲述目标:

  • 这是全场最重要的概念页,建议多停留一点。

Slide 8: 系统架构

标题:全公网覆盖网络中的分段修复系统

建议配图:

  • figures/system_overview.drawio.pdf

内容:

  • 系统由中心控制器和多个转发节点组成。
  • 控制器负责路径、流标识、转发表和 FEC 参数配置。
  • 转发节点负责普通转发、FEC 编码和 FEC 解码。
  • 每个链路片段独立选择“普通转发”或“FEC 修复”。

讲述目标:

  • 强调对应用透明:用户只感知普通 IP 链路,不需要改应用或端到端协议。

Slide 9: 设计一:交织 XOR FEC

标题:用交织 XOR FEC 修复突发丢包

建议配图:

  • figures/fec_interleave_loss.drawio.pdf
  • figures/interleaved_fec.drawio.pdf

内容:

  • 将数据包组织为二维编码组。
  • 每列用 XOR 生成一个冗余包。
  • 交织把连续丢包分散到不同列,使每列最多丢一个包时可以恢复。
  • 选择 XOR 的原因:计算开销低,适合高吞吐转发;结合交织后可应对有限长度突发丢包。

讲述目标:

  • 不需要讲太多编码理论,只讲“为什么能恢复、为什么适合系统”。

Slide 10: 设计二:根据链路状态动态选择参数

标题:自适应选择 FEC 参数,避免冗余过多或过少

建议配图:

  • figures/markov_state.drawio.pdf

内容:

  • 公网丢包包含孤立丢包和连续突发丢包。
  • 本文用三状态丢包模型描述链路状态:孤立丢包、正常、连续丢包。
  • 解码端统计丢包并上报,控制器估计模型参数。
  • 控制器在延迟约束和残余丢包率约束下搜索交织深度 d 和保护包数 k

讲述目标:

  • 强调“自适应”的必要性:公网链路状态会变,固定冗余不合适。
  • 这页是算法贡献。

Slide 11: 设计三:平滑 FEC 解码后的突发输出

标题:用 Pacer 保持端到端传输节奏

建议配图:

  • figures/pacer_design.drawio.pdf

内容:

  • FEC 按组恢复,解码端可能一次性输出多个包。
  • 突发输出会干扰 ACK 节奏和拥塞控制的带宽估计。
  • 本文设计基于 PI 控制器的输出速率控制器。
  • Pacer 根据缓冲区深度动态调整释放速率,将突发输出平滑为稳定输出。

讲述目标:

  • 这页体现系统工程完整性:不仅能恢复包,还考虑恢复后对上层协议的影响。
  • 如果答辩时间很短,可以压缩为系统设计中的一个小点。

Slide 12: 实现与实验设置

标题:原型实现与实验拓扑

建议配图:

  • figures/exp_topology.drawio.pdf

内容:

  • 使用 Rust 实现分布式转发与控制系统。
  • 实验使用 A-B-C 三节点路径AB 为低质量链路BC 为高质量链路。
  • AB 链路设置 0-2% 丢包,两段 RTT 均为 50 ms带宽均为 100 Mbps。
  • 对比方法:直接转发 vs. 本文分段修复。

讲述目标:

  • 说明实验为什么能验证“分段修复”:只有 AB 有丢包BC 无丢包。

Slide 13: 实验结果

标题:分段修复显著提升端到端吞吐

建议配图:

  • figures/thpt_absolute.pdf
  • figures/thpt_speedup.pdf

内容:

  • 无丢包时,本文方法与直接转发接近,额外开销约 1.3%。
  • 丢包升高时,直接转发吞吐快速下降。
  • 本文方法在 0.2%、0.5%、1%、2% 丢包下均显著高于直接转发。
  • 最高在 2% 丢包时达到约 3.6 倍吞吐提升。

讲述目标:

  • 先讲趋势,再讲数字。
  • 不要只说“FEC 有效”,要说“系统只在 AB 段启用 FECBC 段保持普通转发”,这样扣回核心创新。

Slide 14: 总结

标题:总结

内容:

  • 本文发现:公网质量下降与流量高峰重合,且不同链路片段质量差异显著。
  • 本文提出:全公网覆盖网络中的分段链路质量修复。
  • 本文设计:交织 XOR FEC、自适应参数选择、PI Pacer。
  • 本文验证Rust 原型系统在模拟跨域低质量链路中最高提升约 3.6 倍吞吐。

最后一句建议:

  • 本文的核心结论是:低质量公网链路不一定只能被规避,也可以利用覆盖网络的分段可控性被针对性修复。

可选 Slide 15: 展望

标题:未来工作

内容:

  • 更精细的链路丢包模型和 FEC 参数选择。
  • 在链路片段内部加入轻量级快速重传,补充 FEC 无法恢复的残余丢包。
  • 在更真实的大规模跨地域环境中验证成本与质量收益。

讲述目标:

  • 如果答辩要求必须有展望,可以保留。
  • 如果时间紧,可以把这页删掉,把展望放到总结页最后一句。

建议删减的内容

不建议在正式答辩中展开:

  • VXLAN、NVGRE、Geneve 等隧道技术细节。
  • FEC 相关工作的完整分类。
  • SDN/覆盖网络相关工作的长篇综述。
  • Reed-Solomon、Streaming Code 的详细原理。
  • 三状态模型的完整公式推导。
  • PI 控制器的完整公式推导。

这些内容可以放在备份 slides用于老师提问时回答。

备份 Slides 建议

  1. 为什么不用 Reed-Solomon

    • R-S 恢复能力更强,但计算开销更高。
    • 本文目标是高吞吐转发场景,交织 XOR 已能覆盖观察到的有限突发丢包。
  2. 为什么不用端到端 FEC

    • 端到端 FEC 无法区分哪段链路质量差。
    • 会在高质量片段上也引入冗余,浪费带宽。
  3. 为什么需要 Pacer

    • FEC 解码按组输出可能造成突发 ACK。
    • 突发 ACK 会影响拥塞控制和速率估计。
  4. 实验为什么只模拟 A-B-C 三节点?

    • 该拓扑最小化地刻画了“路径分段质量不均衡”这一核心问题。
    • 只有 AB 丢包、BC 不丢包,可以直接观察系统是否只修复低质量片段。
  5. 方法的局限

    • FEC 会带来冗余带宽开销。
    • 极端长突发丢包仍可能无法恢复。
    • 当前实验为模拟环境,后续需要更大规模真实公网验证。

口头开场建议

可以这样开场:

我的工作关注跨域覆盖网络中的成本和质量问题。服务商通常希望用覆盖网络为跨地域用户提供稳定传输,但专线质量好、成本高,公网成本低、质量不稳定。本文并不是简单地在公网和专线之间调度,而是先通过测量发现:公网链路的问题具有明显的时间特征和分段特征。因此,我提出在全公网覆盖网络中,只对真正低质量的链路片段进行质量修复。

这个开场既交代了背景,又很快转入“本文发现”和“本文提出”,比较符合老师的要求。