作ったAgent Skill、ちゃんと動いていますか?監査用のSkill、skill-auditorを作った話

by 逆瀬川ちゃん

18 min read

はじめに

こんにちは!逆瀬川ちゃん (@gyakuse) です!

今日は前回の記事で「未解決の問題」として残しておいた、スキル間のAttention競合問題に正面から取り組んだ話をしていきます。作ったスキルが10個、20個と増えてきたとき、それぞれがちゃんと正しく発火しているのか。あるスキルのdescriptionを改善したら別のスキルの精度が下がっていないか。そんなポートフォリオレベルの監査を自動でやってくれるスキル、skill-auditorを作りました(現在はClaude Code専用となっています)。

続きを読む →

ひらがなASRを作った話 ― へっぽこだけど、かわいい音声認識モデル

by 逆瀬川ちゃん

24 min read

こんにちは!逆瀬川ちゃん (@gyakuse) です!

今日はひらがなだけを出力する音声認識モデルを自分で作った話をまとめていきたいと思います。なぜ漢字仮名交じり文ではなくひらがななのか、なぜWhisperではダメなのか、そしてどうやってLLMと組み合わせることで実用的な音声対話を実現するのか——背景から実装、検証結果まで一気に書いていきます。

YouTubeで見る / GitHub / HuggingFace Model / Spaces Demo

続きを読む →