Series

Study LLM — GPT-2 から現代 Coding Agent まで

LLM の内部を、可視化と実践の二本足で解き明かしていく連載です。 Pretraining の基礎から、Transformer を疑うアーキテクチャ、応用、そして Coding Agent まで、読者が自分の手で動かして確かめられる粒度で追いかけます。

Part 0 · プロローグ

ゼロから作る日本語 LLM — GPT-2 の推論・学習の可視化から Modal での事前学習まで

トークン化から生成ループまでを事前計算トレースで段階的に可視化し、最後に日本語コーパスから GPT-2 small を Modal で事前学習します。

続話は順次公開予定です。