最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

67 自注意力【動手學(xué)深度學(xué)習(xí)v2】

2023-09-08 17:12 作者:月蕪SA  | 我要投稿

自注意力原理:

設(shè)輸入的數(shù)據(jù)為n個長為d的序列。自注意力池化層會把每個序列同時看作key、value、query。

實際上就是抽取輸入數(shù)據(jù)內(nèi)部關(guān)系特征

Self-attention與CNN、RNN對比

圖中d為數(shù)據(jù)序列長度,k為卷積核大小,n為序列數(shù)量。

可以看出self-attention對運算能力的要求特別高,這也是為何如今所有基于self-attention的模型都需要很多GPU才能進行運算。

self-attention里的位置信息處理




知識補充:

位置編碼里的位置在實際中指的是Xi的i。












67 自注意力【動手學(xué)深度學(xué)習(xí)v2】的評論 (共 條)

分享到微博請遵守國家法律
双辽市| 兰坪| 贵南县| 湛江市| 米林县| 宜君县| 五家渠市| 密云县| 行唐县| 海淀区| 壶关县| 通城县| 蓝田县| 赣榆县| 罗源县| 任丘市| 巴里| 清流县| 扎鲁特旗| 皋兰县| 东乌珠穆沁旗| 伊金霍洛旗| 金门县| 苍山县| 峨山| 平昌县| 灵璧县| 那曲县| 庐江县| 灵宝市| 大城县| 邵东县| 北京市| 乌苏市| 绿春县| 郸城县| 秦皇岛市| 辉县市| 汕尾市| 沁阳市| 香港 |