與 Hugging Face 共舞：認識 Transformer

透過本文，您將了解 Transformer 的基本概念，我們將透過 Hugging Face 的 Transformer 套件手把手操作深入瞭解。

課程規劃演練的部分，將以 Google Colab 為主要環境，並使用 Hugging Face 的 Transformer 套件進行操作。

關於 Colab 的申請及使用，請參考 Google Colab。

章節1：Hugging Face 初體驗

分別以 Token Classification、Zero-Shot Classification 及 Image Classification 三個任務，示範如何使用 Hugging Face 的 Transformer 套件。

章節2：Transformer 深入淺出

初探 Transformer 架構，介紹 Input Embedding 及 Positional Encoding。

2.1 The encoder

進一步探討 Transformer Encoder 的運作原理。包含 Self-Attention、Multi-Head Attention 及 Feed-Forward Neural Network。

2.2 The decoder

介紹 Transformer Decoder 的運作原理。包含 Masked Self-Attention、Multi-Head Attention 及 Feed-Forward Neural Network。最後簡單說明 Encoder, Decoder, Encoder-Decoder 三者的相關應用。

章節3：訓練 PII 偵測模型 (Encoder-Only)

基於 Encoder-Only 預訓練模型，微調一個 PII (Personal Identifiable Information) 偵測模型。

章節4：訓練 QA 問答模型 (Decoder-Only)

基於 Decoder-Only 預訓練模型，微調一個 QA 問答模型。

這個章節也會介紹半精度訓練及 LoRA 訓練技巧。以此降低 GPU 記憶體需求，提升訓練效率。

章節5：訓練 PII 遮掩模型 (Encoder-Decoder)

基於 Encoder-Decoder 預訓練模型，微調一個 PII 遮掩模型。

參考資料

影視課程

文章探討

Transformer

Embeddings

Encoder

BERT Encoder Layer

模型微調

台大資訊深度學習之應用 | ADL TA Recitation: LLM LoRA Training 大型語言模型太大怎麼調整呢?

Name		Name	Last commit message	Last commit date
Latest commit History 124 Commits
ForbiddenCodeWritingDataset		ForbiddenCodeWritingDataset
assets/images		assets/images
.gitignore		.gitignore
Makefile		Makefile
README.md		README.md
intro-huggingface.ipynb		intro-huggingface.ipynb
intro-transformer-decoder.ipynb		intro-transformer-decoder.ipynb
intro-transformer-encoder.ipynb		intro-transformer-encoder.ipynb
intro-transformer.ipynb		intro-transformer.ipynb
pii-detection-encoder.ipynb		pii-detection-encoder.ipynb
pii-masking-encode-decode.ipynb		pii-masking-encode-decode.ipynb
qa-decoder.ipynb		qa-decoder.ipynb
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

與 Hugging Face 共舞：認識 Transformer

章節1：Hugging Face 初體驗

章節2：Transformer 深入淺出

2.1 The encoder

2.2 The decoder

章節3：訓練 PII 偵測模型 (Encoder-Only)

章節4：訓練 QA 問答模型 (Decoder-Only)

章節5：訓練 PII 遮掩模型 (Encoder-Decoder)

參考資料

影視課程

文章探討

Transformer

Embeddings

Encoder

模型微調

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 2

Uh oh!

Languages

jonascheng/learning-transformer-with-huggingface

Folders and files

Latest commit

History

Repository files navigation

與 Hugging Face 共舞：認識 Transformer

參考資料

影視課程

文章探討

Transformer

Embeddings

Encoder

模型微調

About

Resources

Uh oh!

Stars

Watchers

Forks

Uh oh!

Uh oh!

Languages