础的ST-GNN模型。但很快遇到了问题:模型训练不稳定,收敛缓慢,在验证集上的准确率低得可怜。他在群里不断抛出各种技术细节的讨论和报错信息,夹杂着大量专业术语,让韩澈看得云里雾里,更别提提供有效建议了。
焦虑如同潮水,在每一次独自面对晦涩论文、每一次试图将模糊战术概念转化为清晰规则却遭遇失败、每一次看到群里热烈讨论自己却插不上话时,悄然上涨。他仿佛被困在了两个世界的夹缝中:一边是熟悉却难以“数字化”的篮球世界,另一边是精密却难以理解的AI世界。而他,是那个试图在两者之间搭建桥梁,却发现自己既缺乏足够的建筑材料,也不精通桥梁力学的人。
第一次正式的、面对面的小组讨论,在一个没有训练的周四晚上,于图书馆一间需要提前预约的小研讨室里进行。房间不大,只有一张方桌,几把椅子,一面白板,和一台偶尔发出嗡嗡声的老旧空调。
王睿最先到,已经将笔记本电脑接上了投影仪,屏幕上显示着复杂的代码和令人眼花缭乱的损失函数下降曲线图。他看起来有些疲惫,但眼睛里闪烁着技术攻坚特有的、混合着烦躁与兴奋的光芒。“来了?正好,我卡住了。苏晚说的方法我试了,梯度还是爆炸,加了梯度裁剪也没用,我怀疑是图结构构建的方式有问题,或者节点特征设计得不合理……”
苏晚几乎是踩着点进来的,手里拿着一个厚厚的活页笔记本和几篇打印出来的论文,上面用不同颜色的笔做了密密麻麻的批注。她朝两人微微点头,算是打过招呼,便直接看向投影屏幕。“数据归一化做了吗?不同维度的特征量纲差异过大会导致梯度问题。另外,你用的邻接矩阵是如何定义的?只考虑了空间距离,还是包含了相对运动信息?”
“归一化做了,标准归一化。邻接矩阵用了高斯核函数基于距离,也试了加入相对速度差的余弦相似度,效果都不好。”王睿语速飞快,手指在触控板上滑动,调出不同的代码片段和结果图。
韩澈安静地坐在一旁,听着两人用他半懂不懂的术语快速交流。“过拟合”、“特征工程”、“消息传递”、“注意力头”……这些词汇像子弹一样在房间里穿梭。他能看懂屏幕上那些不断跳动的数字和图表大概在反映模型的“好坏”,也能感受到王睿的焦躁和苏晚冷静分析下的凝肃,但具体到问题出在哪里,该如何调整,他完全无法置喙。他带来的,是自己花了几天几夜整理的、关于“挡拆”战术不同形态的文字描述和简单示意图,此刻显得如此苍白和“不
本章未完,请点击下一页继续阅读!