一品网
  • 首页

transformer(ViT)查看权重、梯度和梯度函数


假设我们搭建的模型名称为net,在训练时,我们想查看第0个block的attention中的矩阵K的梯度函数和前几个权重、梯度:

net.transformer.encoder.layer[0].attn.key.weight.grad_fn      (key即矩阵K)

net.transformer.encoder.layer[0].attn.key.weight[:2, :2]

net.transformer.encoder.layer[0].attn.key.weight.grad[:2, :2]

DeepLearningTransformer查看权重梯度

相关


文献阅读Understanding and improving deep learning-based rolling bearing fault di

PointNet:Deep Learning on Point Sets for 3D Classification and Segmentation

ICCV2021 | SOTR:使用transformer分割物体

ICCV2021 | Swin Transformer: 使用移位窗口的分层视觉Transformer

论文翻译:2018_Deep Learning for Acoustic Echo Cancellation in Noisy and Double-Ta

NLP中的预训练语言模型(三)—— XL-Net和Transformer-XL

【论文阅读】FLAT: Chinese NER Using Flat-Lattice Transformer[ACL2020]

X-former:不止一面,你想要的Transformer这里都有

【深度学习】Transformer --李宏毅PPT笔记

打打字就能指挥算法视频抠图,Transformer掌握跨模态新技能,精度优于现有模型丨CVPR 2022

TransformerEncoder中的语法

Deep Learning论文笔记之(二)Sparse Filtering稀疏滤波

标签

一品网 冀ICP备14022925号-6