Mac Sync

2024-05-15 20:05:18 +08:00
parent 4bc3f77879
commit 8b657be441
20 changed files with 2174 additions and 2074 deletions
--- a/hw1/HW1-Report/codes/1.1.out.txt
+++ b/hw1/HW1-Report/codes/1.1.out.txt
@@ -1,56 +1,56 @@
-Epoch 01: loss = inf
-Epoch 02: loss = inf
-Epoch 03: loss = 6.678
-Epoch 04: loss = 4.361
-Epoch 05: loss = 3.110
-Epoch 06: loss = 2.099
-Epoch 07: loss = 1.698
-Epoch 08: loss = 1.320
-Epoch 09: loss = 0.970
-Epoch 10: loss = 0.891
-Epoch 10: validation accuracy = 66.0%
-Epoch 11: loss = 0.817
-Epoch 12: loss = 0.723
-Epoch 13: loss = 0.512
-Epoch 14: loss = 0.353
-Epoch 15: loss = 0.202
-Epoch 16: loss = 0.182
-Epoch 17: loss = 0.184
-Epoch 18: loss = 0.191
-Epoch 19: loss = 0.175
-Epoch 20: loss = 0.166
-Epoch 20: validation accuracy = 68.0%
-Epoch 21: loss = 0.146
-Epoch 22: loss = 0.105
-Epoch 23: loss = 0.109
-Epoch 24: loss = 0.074
-Epoch 25: loss = 0.097
-Epoch 26: loss = 0.047
-Epoch 27: loss = 0.038
-Epoch 28: loss = 0.037
-Epoch 29: loss = 0.024
-Epoch 30: loss = 0.021
-Epoch 30: validation accuracy = 68.8%
-Epoch 31: loss = 0.019
-Epoch 32: loss = 0.024
-Epoch 33: loss = 0.023
-Epoch 34: loss = 0.014
-Epoch 35: loss = 0.013
-Epoch 36: loss = 0.012
-Epoch 37: loss = 0.011
-Epoch 38: loss = 0.013
-Epoch 39: loss = 0.013
-Epoch 40: loss = 0.016
-Epoch 40: validation accuracy = 70.5%
-Epoch 41: loss = 0.015
-Epoch 42: loss = 0.009
-Epoch 43: loss = 0.011
-Epoch 44: loss = 0.008
-Epoch 45: loss = 0.008
-Epoch 46: loss = 0.010
-Epoch 47: loss = 0.009
-Epoch 48: loss = 0.007
-Epoch 49: loss = 0.007
-Epoch 50: loss = 0.010
-Epoch 50: validation accuracy = 70.5%
+Epoch 01: loss = inf
+Epoch 02: loss = inf
+Epoch 03: loss = 6.678
+Epoch 04: loss = 4.361
+Epoch 05: loss = 3.110
+Epoch 06: loss = 2.099
+Epoch 07: loss = 1.698
+Epoch 08: loss = 1.320
+Epoch 09: loss = 0.970
+Epoch 10: loss = 0.891
+Epoch 10: validation accuracy = 66.0%
+Epoch 11: loss = 0.817
+Epoch 12: loss = 0.723
+Epoch 13: loss = 0.512
+Epoch 14: loss = 0.353
+Epoch 15: loss = 0.202
+Epoch 16: loss = 0.182
+Epoch 17: loss = 0.184
+Epoch 18: loss = 0.191
+Epoch 19: loss = 0.175
+Epoch 20: loss = 0.166
+Epoch 20: validation accuracy = 68.0%
+Epoch 21: loss = 0.146
+Epoch 22: loss = 0.105
+Epoch 23: loss = 0.109
+Epoch 24: loss = 0.074
+Epoch 25: loss = 0.097
+Epoch 26: loss = 0.047
+Epoch 27: loss = 0.038
+Epoch 28: loss = 0.037
+Epoch 29: loss = 0.024
+Epoch 30: loss = 0.021
+Epoch 30: validation accuracy = 68.8%
+Epoch 31: loss = 0.019
+Epoch 32: loss = 0.024
+Epoch 33: loss = 0.023
+Epoch 34: loss = 0.014
+Epoch 35: loss = 0.013
+Epoch 36: loss = 0.012
+Epoch 37: loss = 0.011
+Epoch 38: loss = 0.013
+Epoch 39: loss = 0.013
+Epoch 40: loss = 0.016
+Epoch 40: validation accuracy = 70.5%
+Epoch 41: loss = 0.015
+Epoch 42: loss = 0.009
+Epoch 43: loss = 0.011
+Epoch 44: loss = 0.008
+Epoch 45: loss = 0.008
+Epoch 46: loss = 0.010
+Epoch 47: loss = 0.009
+Epoch 48: loss = 0.007
+Epoch 49: loss = 0.007
+Epoch 50: loss = 0.010
+Epoch 50: validation accuracy = 70.5%
 Model saved in ./saved_models/default.pth
--- a/hw1/HW1-Report/codes/1.2.out.txt
+++ b/hw1/HW1-Report/codes/1.2.out.txt
@@ -1,2 +1,2 @@
-[Info] Load model from .\saved_models\default.pth
+[Info] Load model from .\saved_models\default.pth
 [Info] Test accuracy = 72.0%
--- a/hw1/HW1-Report/codes/2.2.out.txt
+++ b/hw1/HW1-Report/codes/2.2.out.txt
@@ -1,2 +1,2 @@
-[Info] Load model from .\saved_models\adam_optim.pth
+[Info] Load model from .\saved_models\adam_optim.pth
 [Info] Test accuracy = 85.0%
--- a/hw1/HW1-Report/codes/adam_optim_cuda.out.txt
+++ b/hw1/HW1-Report/codes/adam_optim_cuda.out.txt
@@ -1,56 +1,56 @@
-Epoch 01: loss = inf
-Epoch 02: loss = inf
-Epoch 03: loss = inf
-Epoch 04: loss = inf
-Epoch 05: loss = inf
-Epoch 06: loss = inf
-Epoch 07: loss = inf
-Epoch 08: loss = inf
-Epoch 09: loss = 3.250
-Epoch 10: loss = 2.567
-Epoch 10: validation accuracy = 59.0%
-Epoch 11: loss = 1.963
-Epoch 12: loss = 1.558
-Epoch 13: loss = 1.320
-Epoch 14: loss = 0.911
-Epoch 15: loss = 0.808
-Epoch 16: loss = 0.932
-Epoch 17: loss = 0.861
-Epoch 18: loss = 0.748
-Epoch 19: loss = 0.783
-Epoch 20: loss = 0.809
-Epoch 20: validation accuracy = 65.5%
-Epoch 21: loss = 0.678
-Epoch 22: loss = 0.757
-Epoch 23: loss = 0.747
-Epoch 24: loss = 0.660
-Epoch 25: loss = 0.536
-Epoch 26: loss = 0.506
-Epoch 27: loss = 0.577
-Epoch 28: loss = 0.600
-Epoch 29: loss = 0.681
-Epoch 30: loss = 0.604
-Epoch 30: validation accuracy = 68.0%
-Epoch 31: loss = 0.552
-Epoch 32: loss = 0.671
-Epoch 33: loss = 0.604
-Epoch 34: loss = 0.600
-Epoch 35: loss = 0.818
-Epoch 36: loss = 0.659
-Epoch 37: loss = 0.375
-Epoch 38: loss = 0.380
-Epoch 39: loss = 0.418
-Epoch 40: loss = 0.431
-Epoch 40: validation accuracy = 73.5%
-Epoch 41: loss = 0.551
-Epoch 42: loss = 0.488
-Epoch 43: loss = 0.350
-Epoch 44: loss = 0.287
-Epoch 45: loss = 0.294
-Epoch 46: loss = 0.463
-Epoch 47: loss = 0.438
-Epoch 48: loss = 0.392
-Epoch 49: loss = 0.325
-Epoch 50: loss = 0.332
-Epoch 50: validation accuracy = 80.8%
+Epoch 01: loss = inf
+Epoch 02: loss = inf
+Epoch 03: loss = inf
+Epoch 04: loss = inf
+Epoch 05: loss = inf
+Epoch 06: loss = inf
+Epoch 07: loss = inf
+Epoch 08: loss = inf
+Epoch 09: loss = 3.250
+Epoch 10: loss = 2.567
+Epoch 10: validation accuracy = 59.0%
+Epoch 11: loss = 1.963
+Epoch 12: loss = 1.558
+Epoch 13: loss = 1.320
+Epoch 14: loss = 0.911
+Epoch 15: loss = 0.808
+Epoch 16: loss = 0.932
+Epoch 17: loss = 0.861
+Epoch 18: loss = 0.748
+Epoch 19: loss = 0.783
+Epoch 20: loss = 0.809
+Epoch 20: validation accuracy = 65.5%
+Epoch 21: loss = 0.678
+Epoch 22: loss = 0.757
+Epoch 23: loss = 0.747
+Epoch 24: loss = 0.660
+Epoch 25: loss = 0.536
+Epoch 26: loss = 0.506
+Epoch 27: loss = 0.577
+Epoch 28: loss = 0.600
+Epoch 29: loss = 0.681
+Epoch 30: loss = 0.604
+Epoch 30: validation accuracy = 68.0%
+Epoch 31: loss = 0.552
+Epoch 32: loss = 0.671
+Epoch 33: loss = 0.604
+Epoch 34: loss = 0.600
+Epoch 35: loss = 0.818
+Epoch 36: loss = 0.659
+Epoch 37: loss = 0.375
+Epoch 38: loss = 0.380
+Epoch 39: loss = 0.418
+Epoch 40: loss = 0.431
+Epoch 40: validation accuracy = 73.5%
+Epoch 41: loss = 0.551
+Epoch 42: loss = 0.488
+Epoch 43: loss = 0.350
+Epoch 44: loss = 0.287
+Epoch 45: loss = 0.294
+Epoch 46: loss = 0.463
+Epoch 47: loss = 0.438
+Epoch 48: loss = 0.392
+Epoch 49: loss = 0.325
+Epoch 50: loss = 0.332
+Epoch 50: validation accuracy = 80.8%
 Model saved in .\saved_models\adam_optim_cuda.pth
--- a/hw1/HW1-Report/codes/self_test.out.txt
+++ b/hw1/HW1-Report/codes/self_test.out.txt
@@ -1,2 +1,2 @@
-[Info] Load model from .\saved_models\adam_optim_lr1e-3_epoch100_momentum10.pth
+[Info] Load model from .\saved_models\adam_optim_lr1e-3_epoch100_momentum10.pth
 [Info] Test accuracy = 88.8%
--- a/hw1/HW1-Report/codes/self_train.out.txt
+++ b/hw1/HW1-Report/codes/self_train.out.txt
@@ -1,111 +1,111 @@
-Epoch 01: loss = inf
-Epoch 02: loss = inf
-Epoch 03: loss = inf
-Epoch 04: loss = inf
-Epoch 05: loss = inf
-Epoch 06: loss = inf
-Epoch 07: loss = inf
-Epoch 08: loss = inf
-Epoch 09: loss = inf
-Epoch 10: loss = inf
-Epoch 10: validation accuracy = 40.2%
-Epoch 11: loss = inf
-Epoch 12: loss = inf
-Epoch 13: loss = inf
-Epoch 14: loss = inf
-Epoch 15: loss = inf
-Epoch 16: loss = inf
-Epoch 17: loss = 2.360
-Epoch 18: loss = 2.086
-Epoch 19: loss = 1.684
-Epoch 20: loss = 1.453
-Epoch 20: validation accuracy = 53.0%
-Epoch 21: loss = 1.174
-Epoch 22: loss = 1.046
-Epoch 23: loss = 0.859
-Epoch 24: loss = 0.740
-Epoch 25: loss = 0.663
-Epoch 26: loss = 0.495
-Epoch 27: loss = 0.566
-Epoch 28: loss = 0.521
-Epoch 29: loss = 0.470
-Epoch 30: loss = 0.363
-Epoch 30: validation accuracy = 59.0%
-Epoch 31: loss = 0.365
-Epoch 32: loss = 0.305
-Epoch 33: loss = 0.333
-Epoch 34: loss = 0.293
-Epoch 35: loss = 0.191
-Epoch 36: loss = 0.295
-Epoch 37: loss = 0.275
-Epoch 38: loss = 0.461
-Epoch 39: loss = 0.509
-Epoch 40: loss = 0.298
-Epoch 40: validation accuracy = 65.2%
-Epoch 41: loss = 0.186
-Epoch 42: loss = 0.395
-Epoch 43: loss = 0.323
-Epoch 44: loss = 0.309
-Epoch 45: loss = 0.199
-Epoch 46: loss = 0.285
-Epoch 47: loss = 0.290
-Epoch 48: loss = 0.302
-Epoch 49: loss = 0.235
-Epoch 50: loss = 0.190
-Epoch 50: validation accuracy = 71.2%
-Epoch 51: loss = 0.294
-Epoch 52: loss = 0.311
-Epoch 53: loss = 0.254
-Epoch 54: loss = 0.289
-Epoch 55: loss = 0.264
-Epoch 56: loss = 0.213
-Epoch 57: loss = 0.166
-Epoch 58: loss = 0.218
-Epoch 59: loss = 0.231
-Epoch 60: loss = 0.283
-Epoch 60: validation accuracy = 74.8%
-Epoch 61: loss = 0.324
-Epoch 62: loss = 0.245
-Epoch 63: loss = 0.277
-Epoch 64: loss = 0.286
-Epoch 65: loss = 0.255
-Epoch 66: loss = 0.263
-Epoch 67: loss = 0.272
-Epoch 68: loss = 0.272
-Epoch 69: loss = 0.260
-Epoch 70: loss = 0.271
-Epoch 70: validation accuracy = 79.0%
-Epoch 71: loss = 0.310
-Epoch 72: loss = 0.301
-Epoch 73: loss = 0.305
-Epoch 74: loss = 0.311
-Epoch 75: loss = 0.329
-Epoch 76: loss = 0.295
-Epoch 77: loss = 0.300
-Epoch 78: loss = 0.316
-Epoch 79: loss = 0.326
-Epoch 80: loss = 0.352
-Epoch 80: validation accuracy = 77.5%
-Epoch 81: loss = 0.344
-Epoch 82: loss = 0.326
-Epoch 83: loss = 0.326
-Epoch 84: loss = 0.335
-Epoch 85: loss = 0.342
-Epoch 86: loss = 0.361
-Epoch 87: loss = 0.337
-Epoch 88: loss = 0.339
-Epoch 89: loss = 0.339
-Epoch 90: loss = 0.341
-Epoch 90: validation accuracy = 82.8%
-Epoch 91: loss = 0.350
-Epoch 92: loss = 0.359
-Epoch 93: loss = 0.352
-Epoch 94: loss = 0.363
-Epoch 95: loss = 0.347
-Epoch 96: loss = 0.341
-Epoch 97: loss = 0.336
-Epoch 98: loss = 0.348
-Epoch 99: loss = 0.365
-Epoch 100: loss = 0.350
-Epoch 100: validation accuracy = 85.2%
+Epoch 01: loss = inf
+Epoch 02: loss = inf
+Epoch 03: loss = inf
+Epoch 04: loss = inf
+Epoch 05: loss = inf
+Epoch 06: loss = inf
+Epoch 07: loss = inf
+Epoch 08: loss = inf
+Epoch 09: loss = inf
+Epoch 10: loss = inf
+Epoch 10: validation accuracy = 40.2%
+Epoch 11: loss = inf
+Epoch 12: loss = inf
+Epoch 13: loss = inf
+Epoch 14: loss = inf
+Epoch 15: loss = inf
+Epoch 16: loss = inf
+Epoch 17: loss = 2.360
+Epoch 18: loss = 2.086
+Epoch 19: loss = 1.684
+Epoch 20: loss = 1.453
+Epoch 20: validation accuracy = 53.0%
+Epoch 21: loss = 1.174
+Epoch 22: loss = 1.046
+Epoch 23: loss = 0.859
+Epoch 24: loss = 0.740
+Epoch 25: loss = 0.663
+Epoch 26: loss = 0.495
+Epoch 27: loss = 0.566
+Epoch 28: loss = 0.521
+Epoch 29: loss = 0.470
+Epoch 30: loss = 0.363
+Epoch 30: validation accuracy = 59.0%
+Epoch 31: loss = 0.365
+Epoch 32: loss = 0.305
+Epoch 33: loss = 0.333
+Epoch 34: loss = 0.293
+Epoch 35: loss = 0.191
+Epoch 36: loss = 0.295
+Epoch 37: loss = 0.275
+Epoch 38: loss = 0.461
+Epoch 39: loss = 0.509
+Epoch 40: loss = 0.298
+Epoch 40: validation accuracy = 65.2%
+Epoch 41: loss = 0.186
+Epoch 42: loss = 0.395
+Epoch 43: loss = 0.323
+Epoch 44: loss = 0.309
+Epoch 45: loss = 0.199
+Epoch 46: loss = 0.285
+Epoch 47: loss = 0.290
+Epoch 48: loss = 0.302
+Epoch 49: loss = 0.235
+Epoch 50: loss = 0.190
+Epoch 50: validation accuracy = 71.2%
+Epoch 51: loss = 0.294
+Epoch 52: loss = 0.311
+Epoch 53: loss = 0.254
+Epoch 54: loss = 0.289
+Epoch 55: loss = 0.264
+Epoch 56: loss = 0.213
+Epoch 57: loss = 0.166
+Epoch 58: loss = 0.218
+Epoch 59: loss = 0.231
+Epoch 60: loss = 0.283
+Epoch 60: validation accuracy = 74.8%
+Epoch 61: loss = 0.324
+Epoch 62: loss = 0.245
+Epoch 63: loss = 0.277
+Epoch 64: loss = 0.286
+Epoch 65: loss = 0.255
+Epoch 66: loss = 0.263
+Epoch 67: loss = 0.272
+Epoch 68: loss = 0.272
+Epoch 69: loss = 0.260
+Epoch 70: loss = 0.271
+Epoch 70: validation accuracy = 79.0%
+Epoch 71: loss = 0.310
+Epoch 72: loss = 0.301
+Epoch 73: loss = 0.305
+Epoch 74: loss = 0.311
+Epoch 75: loss = 0.329
+Epoch 76: loss = 0.295
+Epoch 77: loss = 0.300
+Epoch 78: loss = 0.316
+Epoch 79: loss = 0.326
+Epoch 80: loss = 0.352
+Epoch 80: validation accuracy = 77.5%
+Epoch 81: loss = 0.344
+Epoch 82: loss = 0.326
+Epoch 83: loss = 0.326
+Epoch 84: loss = 0.335
+Epoch 85: loss = 0.342
+Epoch 86: loss = 0.361
+Epoch 87: loss = 0.337
+Epoch 88: loss = 0.339
+Epoch 89: loss = 0.339
+Epoch 90: loss = 0.341
+Epoch 90: validation accuracy = 82.8%
+Epoch 91: loss = 0.350
+Epoch 92: loss = 0.359
+Epoch 93: loss = 0.352
+Epoch 94: loss = 0.363
+Epoch 95: loss = 0.347
+Epoch 96: loss = 0.341
+Epoch 97: loss = 0.336
+Epoch 98: loss = 0.348
+Epoch 99: loss = 0.365
+Epoch 100: loss = 0.350
+Epoch 100: validation accuracy = 85.2%
 Model saved in .\saved_models\adam_optim_lr1e-3_epoch100_momentum10.pth
--- a/hw1/HW1-Report/main.tex
+++ b/hw1/HW1-Report/main.tex
@@ -1,244 +1,244 @@
-% Homework Template
-\documentclass[a4paper]{article}
-\usepackage{ctex}
-\usepackage{amsmath, amssymb, amsthm}
-\usepackage{moreenum}
-\usepackage{mathtools}
-\usepackage{url}
-\usepackage{bm}
-\usepackage{enumitem}
-\usepackage{graphicx}
-\usepackage{subcaption}
-\usepackage{booktabs} % toprule
-\usepackage[mathcal]{eucal}
-\usepackage[thehwcnt = 1]{iidef}
-\usepackage{listings}
-\usepackage[x11names]{xcolor}
-\usepackage{float}
-\usepackage[colorlinks, linkcolor=black, anchorcolor=green, citecolor=blue]{hyperref}
-
-\DeclareMathOperator{\arctanh}{arctanh}
-% \DeclareMathOperator{\diag}{diag}
-
-\setenumerate[1]{label=(\arabic{*})}
-\setenumerate[2]{label=\arabic{*})}
-
-\definecolor{codekeyword}{RGB}{171, 0, 216}
-\definecolor{codetypename}{RGB}{29, 37, 251}
-\definecolor{codevariable}{RGB}{10, 23, 126}
-\definecolor{codestring}{RGB}{157, 0, 25}
-\definecolor{codecomment}{RGB}{31, 129, 19}
-
-\newfontfamily\cascadia[Ligatures=ResetAll]{Cascadia Code}
-% \newfontfamily\codefont[Ligatures=ResetAll]{Cascadia Code}
-\newfontfamily\codefont[Ligatures=ResetAll]{Fira Code}[Contextuals={Alternate}]
-% To enable ligature in listing, go check lstfiracode's github page and copy firacodestyle's settings.
-
-\lstset{
-    basicstyle          =   \small\codefont,
-    % ---
-    tabsize             =   4,
-    showstringspaces    =   false,
-    numbers             =   left,
-    numberstyle         =   \cascadia,
-    % ---
-    breaklines          =   true,
-    captionpos          =   t,      
-    % ---
-    frame               =   l,
-    flexiblecolumns,
-    columns = fixed,
-}
-
-\thecourseinstitute{清华大学电子工程系}
-\thecoursename{\textbf{媒体与认知} \space 课堂2}
-\theterm{2023-2024学年春季学期}
-\hwname{作业}
-\begin{document}
-\courseheader
-% 请在YOUR NAME处填写自己的姓名
-\name{高艺轩}
-\vspace{3mm}
-\centerline{\textbf{\Large{理论部分}}}
-
-\section{单选题（15分）}
-% 请在？处填写答案
-\subsection{\underline{B}}
-
-\subsection{\underline{A}}
-
-\subsection{\underline{B}}
-
-\subsection{\underline{A}}
-
-\subsection{\underline{B}}
-
-\section{计算题（15 分）}
-\subsection{设隐含层为$\mathbf{z}=\mathbf{W}^T\mathbf{x}+\mathbf{b}$，其中$\mathbf{x}\in R^{(m \times 1)}$，$\mathbf{z}\in R^{(n\times 1)}$，$\mathbf{W}\in R^{(m\times n)}$，$\mathbf{b} \in R^{(n\times 1)}$均为已知，其激活函数如下：
-$$\mathbf{y}=\delta(\mathbf{z})=tanh(\mathbf{z})$$
-tanh表示双曲正切函数。若训练过程中的目标函数为L，且已知L对$\mathbf{y}$的导数 $\frac{\partial L}{\partial \mathbf{y}}=[\frac{\partial L}{\partial y_1},\frac{\partial L}{\partial y_2},...,\frac{\partial L}{\partial y_n}]^T$和$\mathbf{y}=[y_1,y_2,...,y_n]^T$的值。
-}
-\subsubsection{请使用$\mathbf{y}$表示出$\frac{\partial \mathbf{y}^T}{\partial \mathbf{z}}$, 这里的$\mathbf{y}^T$ 为行向量。
-}
-
-\begin{proof}[解]
-    首先，对$i \neq j$，$\dfrac{\partial y_i}{\partial z_j} = 0$。
-    
-    同时$y_i = \tanh(z_i) = \tanh(\arctanh(y_i))$，因此
-    \[\frac{\partial y_i}{\partial z_i} = 1 - \tanh^2(z_i) = 1 - y_i^2\]
-    因此
-    \[\dfrac{\partial \boldsymbol{y}^\mathrm{T}}{\partial \boldsymbol{z}} = \diag\{1 - y_1^2, 1 - y_2^2, \dots, 1 - y_n^2\} \qedhere\]
-\end{proof}
-
-\subsubsection{请使用$\mathbf{y}$和$\frac{\partial L}{\partial \mathbf{y}}$表示$\frac{\partial L}{\partial \mathbf{x}}$，$\frac{\partial L}{\partial \mathbf{W}}$，$\frac{\partial L}{\partial \mathbf{b}}$。
-}
-提示:$\frac{\partial L}{\partial \mathbf{x}}$，$\frac{\partial L}{\partial \mathbf{W}}$，$\frac{\partial L}{\partial \mathbf{b}}$与x,W,b具有相同维度。
-
-\begin{proof}[解]
-    由链式法则
-    \[\frac{\partial L}{\partial \boldsymbol{x}} = \frac{\partial \boldsymbol{z}^\mathrm{T}}{\partial \boldsymbol{x}} \frac{\partial \boldsymbol{y}^\mathrm{T}}{\partial \boldsymbol{z}} \frac{\partial L}{\partial \boldsymbol{y}} = W \diag\{1 - y_1^2, 1 - y_2^2, \dots, 1 - y_n^2\} \frac{\partial L}{\partial \boldsymbol{y}}\]
-
-    对于$\dfrac{\partial L}{\partial W}$，
-    \[\frac{\partial \boldsymbol{z}^T}{\partial W} = \begin{bmatrix}
-        \boldsymbol{x} & \boldsymbol{x} & \cdots & \boldsymbol{x}
-    \end{bmatrix}_{m \times n}\]
-
-    \begin{align*}
-        \frac{\partial L}{\partial W} & = \frac{\partial \boldsymbol{z}^\mathrm{T}}{\partial W} \frac{\partial \boldsymbol{y}^\mathrm{T}}{\partial \boldsymbol{z}} \frac{\partial L}{\partial \boldsymbol{y}}\\
-        & = \begin{bmatrix}
-        \boldsymbol{x} & \boldsymbol{x} & \cdots & \boldsymbol{x}
-    \end{bmatrix}_{m \times n} \diag\{1 - y_1^2, 1 - y_2^2, \dots, 1 - y_n^2\} \frac{\partial L}{\partial \boldsymbol{y}}
-    \end{align*}
-
-    对于$\dfrac{\partial L}{\partial \boldsymbol{b}}$，由链式法则
-    \[\frac{\partial L}{\partial \boldsymbol{b}} = \frac{\partial \boldsymbol{z}^\mathrm{T}}{\partial \boldsymbol{b}} \frac{\partial \boldsymbol{y}^\mathrm{T}}{\partial \boldsymbol{z}} \frac{\partial L}{\partial \boldsymbol{y}} = I_n \frac{\partial \boldsymbol{y}^\mathrm{T}}{\partial \boldsymbol{z}} \frac{\partial L}{\partial \boldsymbol{y}} = \diag\{1 - y_1^2, 1 - y_2^2, \dots, 1 - y_n^2\} \frac{\partial L}{\partial \boldsymbol{y}} \qedhere\]
-\end{proof}
-\vspace{6mm}
-\centerline{\textbf{\Large{编程部分}}}
-
-
-\vspace{3mm}
-% 请根据是否选择自选课题的情况选择“编程作业报告”或“自选课题开题报告”中的一项完成
-\section{编程作业报告}
-% 请在此处完成编程作业报告
-完成后的代码也可以在 \href{https://git.unlockableworld.com/unlockable/MediaNCognition}{\url{https://git.unlockableworld.com/unlockable/MediaNCognition}}中找到。
-\begin{enumerate}
-    \item 使用默认配置进行训练和测试。
-    \begin{enumerate}
-        \item 训练模型。
-        
-        输入：
-        \lstinputlisting{codes/1.1.in.txt}
-        
-        输出：
-        \lstinputlisting{codes/1.1.out.txt}
-        \begin{figure}[H]
-            \centering
-            \includegraphics[width=0.9\linewidth]{img/1default_train.png}
-        \end{figure}
-
-        \item 测试模型。
-        
-        输入：
-        \lstinputlisting{codes/1.2.in.txt}
-
-        输出：
-        \lstinputlisting{codes/1.2.out.txt}
-    \end{enumerate}
-    \item 调整参数、使用Adam优化器训练并测试。
-    \begin{enumerate}
-        \item 训练模型。
-        
-        输入：
-        \lstinputlisting{codes/2.1.in.txt}
-
-        输出：
-        \lstinputlisting{codes/2.1.out.txt}
-        \begin{figure}[H]
-            \centering
-            \includegraphics[width=0.9\linewidth]{img/2adam_optim.png}
-        \end{figure}
-        \item 测试性能。
-        
-        输入：
-        \lstinputlisting{codes/2.2.in.txt}
-
-        输出：
-        \lstinputlisting{codes/2.2.out.txt}
-    \end{enumerate}
-
-    \item 使用效果最佳的模型测试。
-    经过简单的尝试，发现使用
-    \lstinputlisting{codes/self_train.in.txt}
-    可以使测试集准确率达到88.8\%，有略微的提升。训练的loss曲线：
-    \begin{figure}[H]
-        \centering
-        \includegraphics[width=.9\linewidth]{img/3found_best.png}
-    \end{figure}
-    使用它进行预测：
-    \begin{figure}[H]
-        \centering
-        \begin{subfigure}[b]{.3\linewidth}
-            \includegraphics[width=\linewidth]{img/predict/predict01.png}
-            \subcaption{预测：A}
-        \end{subfigure}
-        \hfill
-        \begin{subfigure}[b]{.3\linewidth}
-            \includegraphics[width=\linewidth]{img/predict/predict02.png}
-            \subcaption{预测：B}
-        \end{subfigure}
-        \hfill
-        \begin{subfigure}[b]{.3\linewidth}
-            \includegraphics[width=\linewidth]{img/predict/predict03.png}
-            \subcaption{预测：M}
-        \end{subfigure}
-
-        \begin{subfigure}[b]{.3\linewidth}
-            \includegraphics[width=\linewidth]{img/predict/predict04.png}
-            \subcaption{预测：R}
-        \end{subfigure}
-        \hfill
-        \begin{subfigure}[b]{.3\linewidth}
-            \includegraphics[width=\linewidth]{img/predict/predict05.png}
-            \subcaption{预测：M}
-        \end{subfigure}
-        \hfill
-        \begin{subfigure}[b]{.3\linewidth}
-            \includegraphics[width=\linewidth]{img/predict/predict06.png}
-            \subcaption{预测：O}
-        \end{subfigure}
-
-        \hfill
-        \begin{subfigure}[b]{.3\linewidth}
-            \includegraphics[width=\linewidth]{img/predict/predict07.png}
-            \subcaption{预测：B}
-        \end{subfigure}
-        \hfill
-        \begin{subfigure}[b]{.3\linewidth}
-            \includegraphics[width=\linewidth]{img/predict/predict08.png}
-            \subcaption{预测：W}
-        \end{subfigure}
-        \hfill
-    \end{figure}
-    \item 遇到的问题及解决方法
-    \begin{enumerate}
-        \item 代码中对灰度图像的矩阵进行标准化时，\lstinline{numpy}显示不能对\lstinline{NumpyGenericArray}进行对\lstinline{float}的\lstinline{/}操作。改用\lstinline{np.div()}解决了这个问题。
-        \item 在利用训练好的模型进行预测时，发现自己找到的大部分模型都预测错误；最后与训练集的图片进行了对比，发现主要问题是裁切字母时留下了过大的边距，导致模型不能正确理解输入。重新裁剪边框后，得到正确的结果。
-    \end{enumerate}
-    \item 建议：希望下次发布作业代码可以利用清华的git。
-\end{enumerate}
-
-
-
-
-% \section{自选课题开题报告}
-% 请在此处介绍自选课题
-
-\end{document}
-
-
-
-%%% Local Variables:
-%%% mode: late\rvx
-%%% TeX-master: t
-%%% End:
+% Homework Template
+\documentclass[a4paper]{article}
+\usepackage{ctex}
+\usepackage{amsmath, amssymb, amsthm}
+\usepackage{moreenum}
+\usepackage{mathtools}
+\usepackage{url}
+\usepackage{bm}
+\usepackage{enumitem}
+\usepackage{graphicx}
+\usepackage{subcaption}
+\usepackage{booktabs} % toprule
+\usepackage[mathcal]{eucal}
+\usepackage[thehwcnt = 1]{iidef}
+\usepackage{listings}
+\usepackage[x11names]{xcolor}
+\usepackage{float}
+\usepackage[colorlinks, linkcolor=black, anchorcolor=green, citecolor=blue]{hyperref}
+
+\DeclareMathOperator{\arctanh}{arctanh}
+% \DeclareMathOperator{\diag}{diag}
+
+\setenumerate[1]{label=(\arabic{*})}
+\setenumerate[2]{label=\arabic{*})}
+
+\definecolor{codekeyword}{RGB}{171, 0, 216}
+\definecolor{codetypename}{RGB}{29, 37, 251}
+\definecolor{codevariable}{RGB}{10, 23, 126}
+\definecolor{codestring}{RGB}{157, 0, 25}
+\definecolor{codecomment}{RGB}{31, 129, 19}
+
+\newfontfamily\cascadia[Ligatures=ResetAll]{Cascadia Code}
+% \newfontfamily\codefont[Ligatures=ResetAll]{Cascadia Code}
+\newfontfamily\codefont[Ligatures=ResetAll]{Fira Code}[Contextuals={Alternate}]
+% To enable ligature in listing, go check lstfiracode's github page and copy firacodestyle's settings.
+
+\lstset{
+    basicstyle          =   \small\codefont,
+    % ---
+    tabsize             =   4,
+    showstringspaces    =   false,
+    numbers             =   left,
+    numberstyle         =   \cascadia,
+    % ---
+    breaklines          =   true,
+    captionpos          =   t,      
+    % ---
+    frame               =   l,
+    flexiblecolumns,
+    columns = fixed,
+}
+
+\thecourseinstitute{清华大学电子工程系}
+\thecoursename{\textbf{媒体与认知} \space 课堂2}
+\theterm{2023-2024学年春季学期}
+\hwname{作业}
+\begin{document}
+\courseheader
+% 请在YOUR NAME处填写自己的姓名
+\name{高艺轩}
+\vspace{3mm}
+\centerline{\textbf{\Large{理论部分}}}
+
+\section{单选题（15分）}
+% 请在？处填写答案
+\subsection{\underline{B}}
+
+\subsection{\underline{A}}
+
+\subsection{\underline{B}}
+
+\subsection{\underline{A}}
+
+\subsection{\underline{B}}
+
+\section{计算题（15 分）}
+\subsection{设隐含层为$\mathbf{z}=\mathbf{W}^T\mathbf{x}+\mathbf{b}$，其中$\mathbf{x}\in R^{(m \times 1)}$，$\mathbf{z}\in R^{(n\times 1)}$，$\mathbf{W}\in R^{(m\times n)}$，$\mathbf{b} \in R^{(n\times 1)}$均为已知，其激活函数如下：
+$$\mathbf{y}=\delta(\mathbf{z})=tanh(\mathbf{z})$$
+tanh表示双曲正切函数。若训练过程中的目标函数为L，且已知L对$\mathbf{y}$的导数 $\frac{\partial L}{\partial \mathbf{y}}=[\frac{\partial L}{\partial y_1},\frac{\partial L}{\partial y_2},...,\frac{\partial L}{\partial y_n}]^T$和$\mathbf{y}=[y_1,y_2,...,y_n]^T$的值。
+}
+\subsubsection{请使用$\mathbf{y}$表示出$\frac{\partial \mathbf{y}^T}{\partial \mathbf{z}}$, 这里的$\mathbf{y}^T$ 为行向量。
+}
+
+\begin{proof}[解]
+    首先，对$i \neq j$，$\dfrac{\partial y_i}{\partial z_j} = 0$。
+    
+    同时$y_i = \tanh(z_i) = \tanh(\arctanh(y_i))$，因此
+    \[\frac{\partial y_i}{\partial z_i} = 1 - \tanh^2(z_i) = 1 - y_i^2\]
+    因此
+    \[\dfrac{\partial \boldsymbol{y}^\mathrm{T}}{\partial \boldsymbol{z}} = \diag\{1 - y_1^2, 1 - y_2^2, \dots, 1 - y_n^2\} \qedhere\]
+\end{proof}
+
+\subsubsection{请使用$\mathbf{y}$和$\frac{\partial L}{\partial \mathbf{y}}$表示$\frac{\partial L}{\partial \mathbf{x}}$，$\frac{\partial L}{\partial \mathbf{W}}$，$\frac{\partial L}{\partial \mathbf{b}}$。
+}
+提示:$\frac{\partial L}{\partial \mathbf{x}}$，$\frac{\partial L}{\partial \mathbf{W}}$，$\frac{\partial L}{\partial \mathbf{b}}$与x,W,b具有相同维度。
+
+\begin{proof}[解]
+    由链式法则
+    \[\frac{\partial L}{\partial \boldsymbol{x}} = \frac{\partial \boldsymbol{z}^\mathrm{T}}{\partial \boldsymbol{x}} \frac{\partial \boldsymbol{y}^\mathrm{T}}{\partial \boldsymbol{z}} \frac{\partial L}{\partial \boldsymbol{y}} = W \diag\{1 - y_1^2, 1 - y_2^2, \dots, 1 - y_n^2\} \frac{\partial L}{\partial \boldsymbol{y}}\]
+
+    对于$\dfrac{\partial L}{\partial W}$，
+    \[\frac{\partial \boldsymbol{z}^T}{\partial W} = \begin{bmatrix}
+        \boldsymbol{x} & \boldsymbol{x} & \cdots & \boldsymbol{x}
+    \end{bmatrix}_{m \times n}\]
+
+    \begin{align*}
+        \frac{\partial L}{\partial W} & = \frac{\partial \boldsymbol{z}^\mathrm{T}}{\partial W} \frac{\partial \boldsymbol{y}^\mathrm{T}}{\partial \boldsymbol{z}} \frac{\partial L}{\partial \boldsymbol{y}}\\
+        & = \begin{bmatrix}
+        \boldsymbol{x} & \boldsymbol{x} & \cdots & \boldsymbol{x}
+    \end{bmatrix}_{m \times n} \diag\{1 - y_1^2, 1 - y_2^2, \dots, 1 - y_n^2\} \frac{\partial L}{\partial \boldsymbol{y}}
+    \end{align*}
+
+    对于$\dfrac{\partial L}{\partial \boldsymbol{b}}$，由链式法则
+    \[\frac{\partial L}{\partial \boldsymbol{b}} = \frac{\partial \boldsymbol{z}^\mathrm{T}}{\partial \boldsymbol{b}} \frac{\partial \boldsymbol{y}^\mathrm{T}}{\partial \boldsymbol{z}} \frac{\partial L}{\partial \boldsymbol{y}} = I_n \frac{\partial \boldsymbol{y}^\mathrm{T}}{\partial \boldsymbol{z}} \frac{\partial L}{\partial \boldsymbol{y}} = \diag\{1 - y_1^2, 1 - y_2^2, \dots, 1 - y_n^2\} \frac{\partial L}{\partial \boldsymbol{y}} \qedhere\]
+\end{proof}
+\vspace{6mm}
+\centerline{\textbf{\Large{编程部分}}}
+
+
+\vspace{3mm}
+% 请根据是否选择自选课题的情况选择“编程作业报告”或“自选课题开题报告”中的一项完成
+\section{编程作业报告}
+% 请在此处完成编程作业报告
+完成后的代码也可以在 \href{https://git.unlockableworld.com/unlockable/MediaNCognition}{\url{https://git.unlockableworld.com/unlockable/MediaNCognition}}中找到。
+\begin{enumerate}
+    \item 使用默认配置进行训练和测试。
+    \begin{enumerate}
+        \item 训练模型。
+        
+        输入：
+        \lstinputlisting{codes/1.1.in.txt}
+        
+        输出：
+        \lstinputlisting{codes/1.1.out.txt}
+        \begin{figure}[H]
+            \centering
+            \includegraphics[width=0.9\linewidth]{img/1default_train.png}
+        \end{figure}
+
+        \item 测试模型。
+        
+        输入：
+        \lstinputlisting{codes/1.2.in.txt}
+
+        输出：
+        \lstinputlisting{codes/1.2.out.txt}
+    \end{enumerate}
+    \item 调整参数、使用Adam优化器训练并测试。
+    \begin{enumerate}
+        \item 训练模型。
+        
+        输入：
+        \lstinputlisting{codes/2.1.in.txt}
+
+        输出：
+        \lstinputlisting{codes/2.1.out.txt}
+        \begin{figure}[H]
+            \centering
+            \includegraphics[width=0.9\linewidth]{img/2adam_optim.png}
+        \end{figure}
+        \item 测试性能。
+        
+        输入：
+        \lstinputlisting{codes/2.2.in.txt}
+
+        输出：
+        \lstinputlisting{codes/2.2.out.txt}
+    \end{enumerate}
+
+    \item 使用效果最佳的模型测试。
+    经过简单的尝试，发现使用
+    \lstinputlisting{codes/self_train.in.txt}
+    可以使测试集准确率达到88.8\%，有略微的提升。训练的loss曲线：
+    \begin{figure}[H]
+        \centering
+        \includegraphics[width=.9\linewidth]{img/3found_best.png}
+    \end{figure}
+    使用它进行预测：
+    \begin{figure}[H]
+        \centering
+        \begin{subfigure}[b]{.3\linewidth}
+            \includegraphics[width=\linewidth]{img/predict/predict01.png}
+            \subcaption{预测：A}
+        \end{subfigure}
+        \hfill
+        \begin{subfigure}[b]{.3\linewidth}
+            \includegraphics[width=\linewidth]{img/predict/predict02.png}
+            \subcaption{预测：B}
+        \end{subfigure}
+        \hfill
+        \begin{subfigure}[b]{.3\linewidth}
+            \includegraphics[width=\linewidth]{img/predict/predict03.png}
+            \subcaption{预测：M}
+        \end{subfigure}
+
+        \begin{subfigure}[b]{.3\linewidth}
+            \includegraphics[width=\linewidth]{img/predict/predict04.png}
+            \subcaption{预测：R}
+        \end{subfigure}
+        \hfill
+        \begin{subfigure}[b]{.3\linewidth}
+            \includegraphics[width=\linewidth]{img/predict/predict05.png}
+            \subcaption{预测：M}
+        \end{subfigure}
+        \hfill
+        \begin{subfigure}[b]{.3\linewidth}
+            \includegraphics[width=\linewidth]{img/predict/predict06.png}
+            \subcaption{预测：O}
+        \end{subfigure}
+
+        \hfill
+        \begin{subfigure}[b]{.3\linewidth}
+            \includegraphics[width=\linewidth]{img/predict/predict07.png}
+            \subcaption{预测：B}
+        \end{subfigure}
+        \hfill
+        \begin{subfigure}[b]{.3\linewidth}
+            \includegraphics[width=\linewidth]{img/predict/predict08.png}
+            \subcaption{预测：W}
+        \end{subfigure}
+        \hfill
+    \end{figure}
+    \item 遇到的问题及解决方法
+    \begin{enumerate}
+        \item 代码中对灰度图像的矩阵进行标准化时，\lstinline{numpy}显示不能对\lstinline{NumpyGenericArray}进行对\lstinline{float}的\lstinline{/}操作。改用\lstinline{np.div()}解决了这个问题。
+        \item 在利用训练好的模型进行预测时，发现自己找到的大部分模型都预测错误；最后与训练集的图片进行了对比，发现主要问题是裁切字母时留下了过大的边距，导致模型不能正确理解输入。重新裁剪边框后，得到正确的结果。
+    \end{enumerate}
+    \item 建议：希望下次发布作业代码可以利用清华的git。
+\end{enumerate}
+
+
+
+
+% \section{自选课题开题报告}
+% 请在此处介绍自选课题
+
+\end{document}
+
+
+
+%%% Local Variables:
+%%% mode: late\rvx
+%%% TeX-master: t
+%%% End: