通俗易懂注意力机制注意力机制详解( 二 ) _早教

[1，1，0]，[0，1，0]，[1，1，0]]

查询权重：

[[1，0，1]，[1，0，0]，[0，0，1]，[0，1，1]]

价值权重：

[[0，2，0]，[0，3，0]，[1，0，3]，[1，1，0]]

注意：在神经网络设置中，这些权重通常是小数，使用适当的随机分布（如高斯，Xavier和Kaiming分布）随机初始化。

步骤3：派生键、查询和值

现在我们有了三组权重，让我们实际获取每个输入的键、查询和值表示形式。

输入 1 的键表示：

[0，0，1][1，0，1，0] x [1，1，0] = [0，1，1] [0，1，0] [1，1，0]
使用相同的权重集获取输入 2 的键表示：

[0，0，1][0，2，0，2] x [1，1，0] = [4，4，0] [0，1，0] [1，1，0]
使用相同的权重集获取输入 3 的键表示：

[0，0，1][1，1，1，1] x [1，1，0] = [2，3，1] [0，1，0] [1，1，0]
一种更快的方法是对上述操作进行矢量化处理：

[0，0，1][1，0，1，0] [1，1，0] [0，1，1][0，2，0，2] x [0，1，0] = [4 ，4，0][1，1，1，1] [1，1，0] [2，3，1]

文章插图
图 1.3a：

每个输入的派生键表示

进行同样的操作，以获取每个输入的值表示形式：

[0，2，0][1，0，1，0] [0，3，0] [1,2，3][0，2，0，2] x [1，0，3] = [2 ，8，0][1，1，1，1] [1，1，0] [2，6，3]

文章插图
图 1.3b：每个输入的派生值表示

最后是查询表示形式：

[1，0，1][1，0，1，0] [1，0，0] [1，0，2][0，2，0，2] x [0，0，1] = [2 ，2，2][1，1，1，1] [0，1，1] [2，1，3]

文章插图
图 1.3c：从每个输入中派生查询表示

注意：实际上，可以将偏差向量添加到矩阵乘法的乘积中。

步骤4：计算输入 1 的注意力得分

文章插图
图 1.4：根据查询 1 计算注意力得分（蓝色）

为了获得注意力得分，我们首先在输入 1 的查询（红色）与所有键（橙色）（包括其自身）之间取一个点积。由于有 3 个关键表示（因为我们有3个输入），因此我们获得 3 个注意力得分（蓝色）。

[0，4，2][1，0，2] x [1，4，3] = [2，4，4] [1，0，1]
注意，我们仅使用输入 1 的查询。稍后，我们将对其他查询重复相同的步骤。

注意：以上操作被称为点产品注意，它是几种评分功能其中之一。其他评分功能包括缩放点积和添加/合并数组。

步骤 5：计算 softmax

文章插图
图 1.5：Softmax 注意分数（蓝色）

在所有注意力得分中使用 softmax（蓝色）。

softmax（[2，4，4]）= [0.0，0.5，0.5]
上一页
1
2
3
4
下一页
		  	
			
注意力分类及改善方法 注意力存在的症状及矫正方法 

注意力不集中怎么缓解 注意力不集中应该怎么办 

6-12岁孩子注意力不集中 小孩注意力不集中原因及治疗方法 

真正稀缺的是注意力 注意力是稀缺资源 

小朋友注意力不集中走神动作慢 小孩注意力不集中走神写作业拖拉 

注意力的训练怎么提高 训练注意力有效方法 

孩子总是注意力不集中上课老走神 孩子上课走神注意力不集中的表现 

孩子注意力不集中如何帮他提高 提高孩子注意力不集中怎么训练 

注意力稳定性的概念 注意力的概念界定 

孩子注意力不集中怎么改掉 如何纠正孩子的注意力不集中 


            
              特别声明：本站内容均来自网友提供或互联网，仅供参考，请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系，我们将在24小时内删除。

通俗易懂注意力机制 注意力机制详解( 二 )

通俗易懂注意力机制注意力机制详解( 二 )