最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

Swin Transformer源碼解析(二)

2023-07-03 15:15 作者:0x435959  | 我要投稿

二、Transformer Block

數(shù)據(jù)經(jīng)過patch_embed后接著進(jìn)入TransformerBlock模塊,TransformerBlock主要包含四個(gè)部分:NormLayer==>W-MSA/SW-MSA==>NormLayer==>MLP,內(nèi)部各部分還使用殘差連接。

1. Norm Layer

NormLayer默認(rèn)使用LayerNorm,對(duì)最后一維歸一化,即模型的維度C

2. W-MSA/SW-MSA

窗口自注意力和移位窗口自注意力,將patch的特征圖劃分成一個(gè)個(gè)window,然后再在每個(gè)window內(nèi)部做自注意力,但是這樣window和window之間無交互,所以又使用了移位窗口自注意力。

2.1 window_partition

類似把圖片分成pacth的操作,這里將patch_embedding操作后的特征圖按window劃分,但不同的是patch_embedding中有個(gè)embedding的過程,是通過卷積實(shí)現(xiàn)的但是這里不需要,只是簡單的分成window。window_partition操作是將圖片的形式由(2,56,56,96)==>(2*8*8,7,7,96) 8*8就是window的數(shù)量,可以看出維度沒有變化,且內(nèi)部也沒有任何神經(jīng)元的連接。

至于為什么要乘以8*8,是因?yàn)楹竺嬉趙indow內(nèi)部做注意力,window與window之間無關(guān),所以直接乘到batch_size里面。

2.2 window_reverse

和window_partition的操作相反,將劃分后的windows轉(zhuǎn)回去,形狀一樣,對(duì)應(yīng)位置也一樣。因?yàn)樽鐾曜宰⒁饬χ笠兂芍暗男螤?,因?yàn)楹竺嬉鰌atch_merge,要轉(zhuǎn)成patch的格式

2.3 window_attention

3、Norm Layer

4、MLP

很簡單,就是全連接==>激活==>dropout==>全連接==>dropout

三、Patch Merge

就是將patch特征圖變小,但是維度增加






Swin Transformer源碼解析(二)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
精河县| 平谷区| 建平县| 邻水| 阿拉尔市| 湘阴县| 建德市| 广丰县| 龙门县| 舞钢市| 托里县| 蛟河市| 玛沁县| 胶南市| 安顺市| 石景山区| 沙河市| 桂阳县| 正宁县| 富蕴县| 平湖市| 乌兰浩特市| 昌图县| 阳东县| 遵义市| 太仆寺旗| 宜宾县| 花莲市| 赣榆县| 临江市| 瓮安县| 南岸区| 平遥县| 东乡县| 武乡县| 汕尾市| 乃东县| 哈尔滨市| 乌苏市| 巨鹿县| 红安县|