Series
Study LLM — GPT-2 から現代 Coding Agent まで
LLM の内部を、可視化と実践の二本足で解き明かしていく連載です。 Pretraining の基礎から、Transformer を疑うアーキテクチャ、応用、そして Coding Agent まで、読者が自分の手で動かして確かめられる粒度で追いかけます。
Part 0 · プロローグ
Ep00ゼロから作る日本語 LLM — GPT-2 の推論・学習の可視化から Modal での事前学習まで
トークン化から生成ループまでを事前計算トレースで段階的に可視化し、最後に日本語コーパスから GPT-2 small を Modal で事前学習します。
続話は順次公開予定です。