一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

【Transformer】從零詳細解讀

 印度阿三17 2021-03-30

本文是對B站視頻“transformer從零詳細解讀”的筆記,視頻:https://www.bilibili.com/video/BV1Di4y1c7Zm?p=1

一、概述

TRM在做一個什么事情?

transformer包含encoder和decoder

encoder和decoder分別有六個

原論文中transformer模型結(jié)構(gòu)

encoder包含以下三個部分:

二、位置編碼

encoder輸入部分:

1. Embedding

2. 位置嵌入

為什么需要?

位置編碼公式

將詞向量和位置編碼相加作為模型的輸入

 

引申一下為什么位置嵌入會有用

但是這種相對位置信息會在注意力機制那里消失

三、多頭注意力機制

1. 注意力機制

1.1 基本的注意力機制

經(jīng)典的注意力機制的圖,顏色深的表示很受關(guān)注,淺的表示不怎么受關(guān)注。

1.2 在TRM中怎么操作

原論文中注意力機制的計算公式:

從公式角度來看:拿上面的圖片舉例子

兩個向量越相似,點乘結(jié)果越大。

再舉個栗子

四、殘差和layerNorm 

五、前饋神經(jīng)網(wǎng)絡(luò) 

來源:https://www./content-4-907751.html

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    亚洲欧美一二区日韩高清在线 | 国产精品偷拍视频一区| 午夜久久久精品国产精品| 日本妇女高清一区二区三区| 欧美日韩久久精品一区二区| 少妇被粗大进猛进出处故事| 神马午夜福利一区二区| 欧美日韩国产欧美日韩| 国产欧美亚洲精品自拍| 成人午夜爽爽爽免费视频| 人妻内射在线二区一区| 午夜精品在线观看视频午夜| 婷婷开心五月亚洲综合| 亚洲欧美日韩在线中文字幕| 国产又粗又猛又爽色噜噜| 日本高清一区免费不卡| 欧美性高清一区二区三区视频 | 国产精品一区二区日韩新区| 日韩一区二区三区18| 亚洲香艳网久久五月婷婷| 蜜桃臀欧美日韩国产精品| 99久久精品久久免费| 国产欧美日韩在线精品一二区| 99亚洲综合精品成人网色播| 亚洲欧美视频欧美视频| 99久久精品午夜一区二区| 国产福利在线播放麻豆| 日韩欧美亚洲综合在线| 欧美人妻一区二区三区| 麻豆国产精品一区二区| 日韩视频在线观看成人| 日韩欧美高清国内精品| 中文字幕有码视频熟女| 人妻少妇久久中文字幕久久| 色婷婷久久五月中文字幕| 精品精品国产自在久久高清| 精品少妇人妻av免费看| 欧美精品女同一区二区| 亚洲精品国产主播一区| 欧美一级内射一色桃子| 69精品一区二区蜜桃视频|