Coding Agent比較用の独自のベンチマーク、Harness Benchを作ってみた話
by 逆瀬川ちゃん
8 min read
こんにちは!逆瀬川ちゃん (@gyakuse) です!
今日はHarness向けのベンチマークとして作ったHarnessBenchについてまとめていきたいと思います。
by 逆瀬川ちゃん
8 min read
こんにちは!逆瀬川ちゃん (@gyakuse) です!
今日はHarness向けのベンチマークとして作ったHarnessBenchについてまとめていきたいと思います。
by 逆瀬川ちゃん
5 min read
こんにちは!逆瀬川ちゃん (@gyakuse) です!
今日はClaude Codeの最新バージョンで日本語を書いていると発生する文字化け問題と、hooksを使った簡易的な対応方法についてまとめていきたいと思います。
2026-04-08 追記: Claude Code v2.1.94で本問題が修正されたとのChangelogが出ましたが、完全には治っていないという報告もあります。引き続きhook対策を入れておくのがおすすめです。また、hookをPreToolUseからPostToolUseに戻しました。PostToolUseのほうが書き込み済みの壊れた箇所だけを修復すればよく、修復のためのtokenコストが小さいためです。
by 逆瀬川ちゃん
10 min read
ソフトウェア開発の実践的場面において、ある種の準儀礼的慣行(quasi-ritual practice)が散発的に観測されている。Anthropic社が提供するAIコーディングエージェントClaude Codeの利用者の一部が、プロジェクトのルートディレクトリに.claudeignoreと称するファイルを設置しているのである。
by 逆瀬川ちゃん
3 min read
こんにちは!逆瀬川ちゃん (@gyakuse) です!
個人開発しすぎてお金が無になったので、お仕事を募集します!
by 逆瀬川ちゃん
15 min read
こんにちは!逆瀬川 (@gyakuse) です!
Cursorをひさびさに使おうと思ったのですが、Composer2がKimiベースであるため、Cursorって本当にZDR(ゼロデータ保持)なんだっけ、と思い調べてたら他のCoding Agentも調べることになってました(?)学習に貢献したいというモチベーションのある方にとっては、実は学習されないことがわかるかもしれませんし、学習に貢献したくない方にとっては、学習されうるリスクを排除するのに役立つと思います。Kimi Codeが結構すごくて、メール連絡しない限り派手に学習してくれます。学習に貢献したい場合は、めちゃよいです。ちなみにAPI利用でもKimi (Moonshot AI) はモデルの学習へ利用されます。迫力があってすごい。
2026-03-27 更新: GitHub Copilotが4月24日よりFree/Pro/Pro+ユーザーのデータをAIモデル学習にデフォルトで利用開始すると発表しました。詳細はGitHub Copilotセクションを参照してください。そのほか各ツールの規約情報も最新版に更新しました。