Files
bachelor-thesis/defense_slides_outline.md
2026-06-08 09:29:02 +08:00

297 lines
12 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 本科答辩 Slides 大纲
题目建议:**面向跨域公网覆盖网络的分段链路质量修复**
核心策略不要把“测量”和“observation”放在背景里讲而是把它们作为本文的第一项工作与第一项贡献。背景只保留听懂问题所必需的 2-3 句话。
## 总体叙事
答辩老师要求“不要讲背景”,本质上是希望不要花大量时间介绍领域常识和相关工作。因此 slides 可以采用下面的叙事:
1. 服务商需要用覆盖网络为跨域用户提供稳定传输,但专线贵、公网便宜但不稳定。
2. 本文先做测量,发现现有“公网好时分流、差时用专线”的思路难以降低峰值成本;同时,公网并不是整体都差,而是不同链路片段差异很大。
3. 因此,本文提出:不把低质量公网链路直接放弃,而是在全公网覆盖网络中,只对低质量链路片段做质量修复。
4. 为此,本文设计了分段 FEC 修复、自适应参数选择和解码端 pacer并实现原型系统。
5. 实验表明,该方法能够识别低质量片段并只在那里启用 FEC最高带来约 3.6 倍吞吐提升。
这套讲法的好处是:开头仍然给了老师理解贡献所需的最小上下文,但从第 3 页开始就进入“我们的发现”和“我们的设计”,不会显得在讲大段背景。
## 建议页数与时间
建议 12-14 页,适合 8-12 分钟答辩。若时间更短,可以删掉“相关工作差异”页或把 Pacer 压缩到系统设计页里。
## Slide 1: 标题页
标题:面向跨域公网覆盖网络的分段链路质量修复
内容:
- 姓名、导师、院系
- 一句话副标题:在全公网覆盖网络中,仅对低质量链路片段进行自适应 FEC 修复
讲述目标:
- 直接让老师知道本文做的是“公网覆盖网络”“分段修复”“FEC”。
## Slide 2: 问题一句话说明
标题:跨域覆盖网络的核心矛盾:质量与成本
建议配图:
- `figures/cloud_network_rtc.drawio.pdf`
内容:
- 服务商用覆盖网络连接跨地域用户。
- 专线链路质量稳定,但成本高,且常按峰值带宽计费。
- 公网链路成本低,但在跨域场景中容易丢包和波动。
讲述目标:
- 这页就是“必要背景”,控制在 30-45 秒。
- 不展开云网络、Overlay、QoS/QoE 等概念,只说清楚“为什么需要优化”。
## Slide 3: 本文关注的问题
标题:能否少依赖专线,同时维持跨域传输质量?
内容:
- 已有调度思路:公网质量好时分流,公网质量差时回到专线。
- 已有端到端优化:把整条路径当成一条黑盒链路,统一调速或统一加冗余。
- 本文的问题:在覆盖网络可控、路径可分段的条件下,能否更细粒度地修复公网链路?
讲述目标:
- 这页不是相关工作综述,而是问题定义。
- 重点落在“覆盖网络路径是分段的”,为后续 observation 铺垫。
## Slide 4: 贡献总览
标题:本文贡献
内容:
1. 通过真实公网测量,发现公网质量下降与用户流量高峰重合,且不同公网链路片段质量差异显著。
2. 提出分段链路质量修复:在全公网覆盖网络中,仅对低质量链路片段加入冗余修复。
3. 设计并实现自适应交织 XOR FEC、三状态丢包模型参数选择和解码端输出速率控制。
4. 实现 Rust 原型系统并实验验证,最高实现约 3.6 倍端到端吞吐提升。
讲述目标:
- 提前把所有创新点摆出来。
- 后续 slides 就是逐一展开这些贡献。
## Slide 5: 测量发现一:公网劣化发生在最需要它的时候
标题Observation 1公网质量下降与用户流量高峰重合
建议配图:
- `figures/hongkong-jinan-withbd.pdf`
内容:
- 用户流量升高时,公网链路更容易出现丢包率上升和延迟波动。
- 这使“公网质量好时分流”的窗口往往出现在低流量时段。
- 由于专线常按峰值带宽计费,低峰时分流难以显著降低专线成本。
讲述目标:
- 把测量作为“我们的发现”,不要说成背景。
- 这页回答:为什么只做公网/专线调度不够。
## Slide 6: 测量发现二:公网不是整体都差
标题Observation 2公网链路质量具有明显片段差异
建议配图:
- `figures/loss_avg_heatmap.pdf`
内容:
- 一些公网链路片段平均丢包率很低,接近专线质量。
- 另一些跨域片段丢包明显,是端到端质量下降的主要来源。
- 端到端方法只能看到整条路径变差,无法定位是哪一段链路造成问题。
讲述目标:
- 这页回答:为什么应该“分段修复”而不是“端到端统一冗余”。
## Slide 7: 关键想法
标题:从“规避低质量公网”到“修复低质量片段”
建议配图:
- 可使用 `figures/all_redundent_waste.drawio.pdf`
- 或者重画成更适合 slides 的 A-B-C 三节点示意图
内容:
- 传统调度:公网差时切回专线。
- 端到端 FEC整条路径统一加冗余可能浪费好链路带宽。
- 本文方法:全公网互联,只在低质量链路片段两端做 FEC 修复。
一句话 takeaway
- **把冗余开销限制在真正发生丢包的链路片段上。**
讲述目标:
- 这是全场最重要的概念页,建议多停留一点。
## Slide 8: 系统架构
标题:全公网覆盖网络中的分段修复系统
建议配图:
- `figures/system_overview.drawio.pdf`
内容:
- 系统由中心控制器和多个转发节点组成。
- 控制器负责路径、流标识、转发表和 FEC 参数配置。
- 转发节点负责普通转发、FEC 编码和 FEC 解码。
- 每个链路片段独立选择“普通转发”或“FEC 修复”。
讲述目标:
- 强调对应用透明:用户只感知普通 IP 链路,不需要改应用或端到端协议。
## Slide 9: 设计一:交织 XOR FEC
标题:用交织 XOR FEC 修复突发丢包
建议配图:
- `figures/fec_interleave_loss.drawio.pdf`
-`figures/interleaved_fec.drawio.pdf`
内容:
- 将数据包组织为二维编码组。
- 每列用 XOR 生成一个冗余包。
- 交织把连续丢包分散到不同列,使每列最多丢一个包时可以恢复。
- 选择 XOR 的原因:计算开销低,适合高吞吐转发;结合交织后可应对有限长度突发丢包。
讲述目标:
- 不需要讲太多编码理论,只讲“为什么能恢复、为什么适合系统”。
## Slide 10: 设计二:根据链路状态动态选择参数
标题:自适应选择 FEC 参数,避免冗余过多或过少
建议配图:
- `figures/markov_state.drawio.pdf`
内容:
- 公网丢包包含孤立丢包和连续突发丢包。
- 本文用三状态丢包模型描述链路状态:孤立丢包、正常、连续丢包。
- 解码端统计丢包并上报,控制器估计模型参数。
- 控制器在延迟约束和残余丢包率约束下搜索交织深度 `d` 和保护包数 `k`
讲述目标:
- 强调“自适应”的必要性:公网链路状态会变,固定冗余不合适。
- 这页是算法贡献。
## Slide 11: 设计三:平滑 FEC 解码后的突发输出
标题:用 Pacer 保持端到端传输节奏
建议配图:
- `figures/pacer_design.drawio.pdf`
内容:
- FEC 按组恢复,解码端可能一次性输出多个包。
- 突发输出会干扰 ACK 节奏和拥塞控制的带宽估计。
- 本文设计基于 PI 控制器的输出速率控制器。
- Pacer 根据缓冲区深度动态调整释放速率,将突发输出平滑为稳定输出。
讲述目标:
- 这页体现系统工程完整性:不仅能恢复包,还考虑恢复后对上层协议的影响。
- 如果答辩时间很短,可以压缩为系统设计中的一个小点。
## Slide 12: 实现与实验设置
标题:原型实现与实验拓扑
建议配图:
- `figures/exp_topology.drawio.pdf`
内容:
- 使用 Rust 实现分布式转发与控制系统。
- 实验使用 A-B-C 三节点路径AB 为低质量链路BC 为高质量链路。
- AB 链路设置 0-2% 丢包,两段 RTT 均为 50 ms带宽均为 100 Mbps。
- 对比方法:直接转发 vs. 本文分段修复。
讲述目标:
- 说明实验为什么能验证“分段修复”:只有 AB 有丢包BC 无丢包。
## Slide 13: 实验结果
标题:分段修复显著提升端到端吞吐
建议配图:
- `figures/thpt_absolute.pdf`
- `figures/thpt_speedup.pdf`
内容:
- 无丢包时,本文方法与直接转发接近,额外开销约 1.3%。
- 丢包升高时,直接转发吞吐快速下降。
- 本文方法在 0.2%、0.5%、1%、2% 丢包下均显著高于直接转发。
- 最高在 2% 丢包时达到约 3.6 倍吞吐提升。
讲述目标:
- 先讲趋势,再讲数字。
- 不要只说“FEC 有效”,要说“系统只在 AB 段启用 FECBC 段保持普通转发”,这样扣回核心创新。
## Slide 14: 总结
标题:总结
内容:
- 本文发现:公网质量下降与流量高峰重合,且不同链路片段质量差异显著。
- 本文提出:全公网覆盖网络中的分段链路质量修复。
- 本文设计:交织 XOR FEC、自适应参数选择、PI Pacer。
- 本文验证Rust 原型系统在模拟跨域低质量链路中最高提升约 3.6 倍吞吐。
最后一句建议:
- **本文的核心结论是:低质量公网链路不一定只能被规避,也可以利用覆盖网络的分段可控性被针对性修复。**
## 可选 Slide 15: 展望
标题:未来工作
内容:
- 更精细的链路丢包模型和 FEC 参数选择。
- 在链路片段内部加入轻量级快速重传,补充 FEC 无法恢复的残余丢包。
- 在更真实的大规模跨地域环境中验证成本与质量收益。
讲述目标:
- 如果答辩要求必须有展望,可以保留。
- 如果时间紧,可以把这页删掉,把展望放到总结页最后一句。
## 建议删减的内容
不建议在正式答辩中展开:
- VXLAN、NVGRE、Geneve 等隧道技术细节。
- FEC 相关工作的完整分类。
- SDN/覆盖网络相关工作的长篇综述。
- Reed-Solomon、Streaming Code 的详细原理。
- 三状态模型的完整公式推导。
- PI 控制器的完整公式推导。
这些内容可以放在备份 slides用于老师提问时回答。
## 备份 Slides 建议
1. 为什么不用 Reed-Solomon
- R-S 恢复能力更强,但计算开销更高。
- 本文目标是高吞吐转发场景,交织 XOR 已能覆盖观察到的有限突发丢包。
2. 为什么不用端到端 FEC
- 端到端 FEC 无法区分哪段链路质量差。
- 会在高质量片段上也引入冗余,浪费带宽。
3. 为什么需要 Pacer
- FEC 解码按组输出可能造成突发 ACK。
- 突发 ACK 会影响拥塞控制和速率估计。
4. 实验为什么只模拟 A-B-C 三节点?
- 该拓扑最小化地刻画了“路径分段质量不均衡”这一核心问题。
- 只有 AB 丢包、BC 不丢包,可以直接观察系统是否只修复低质量片段。
5. 方法的局限
- FEC 会带来冗余带宽开销。
- 极端长突发丢包仍可能无法恢复。
- 当前实验为模拟环境,后续需要更大规模真实公网验证。
## 口头开场建议
可以这样开场:
> 我的工作关注跨域覆盖网络中的成本和质量问题。服务商通常希望用覆盖网络为跨地域用户提供稳定传输,但专线质量好、成本高,公网成本低、质量不稳定。本文并不是简单地在公网和专线之间调度,而是先通过测量发现:公网链路的问题具有明显的时间特征和分段特征。因此,我提出在全公网覆盖网络中,只对真正低质量的链路片段进行质量修复。
这个开场既交代了背景,又很快转入“本文发现”和“本文提出”,比较符合老师的要求。