网上很多关于AI大语言模型(或神经网络)的课程,都是号称能帮你入门。如果你的数学基础比较差,比如忘了高中时学的向量和矩阵、忘了大学时学的线性代数和微积分,那么基本上就是
从入门到放弃。比如当你看到Transformer的注意力计算公式:

\[

\text{Attention}(Q, K, V) = \text{softmax}\left(\frac{QK^T}{\sqrt{d_k}}\right)V

\]

当然如果你的数学底子比较好,也未必能学好大模型,因为只有实践才能验证算法,但这个实践成本是非常高的,也就是下面的大力出奇迹。