2026 年。世界はとても静かに、しかし決定的に変わりました。
gstack は、その新しい働き方の中心にあるツールキットです。Y Combinator 社長の Garry Tan が、自分のために作り、自分で毎日使い、無料で公開したもの。
“I don't think I've typed like a line of code probably since December, basically, which is an extremely large change.”
― Andrej Karpathy / No Priors podcast, March 2026
元 OpenAI 創業メンバーの Andrej Karpathy がそう語ったのは、2026 年 3 月のことでした。
「12 月以降、コードを 1 行もタイプしていない」――それでも彼は新しいプロジェクトを動かし続けています。
なぜそんなことが可能になったのか。Karpathy はその答えを「the right tooling(正しい道具)」と呼びました。
その「正しい道具」を、商用秘匿でもなく、SaaS でもなく、すべての人が今すぐ無料でコピーできる形でまとめたものが、gstack です。
なぜ今、これがあなたに必要なのか
Garry Tan が公開した一枚の表があります。これは、2026 年のソフトウェア開発でいま実際に起きている「時間圧縮」を示したものです。誇張ではなく、彼自身が手元のリポジトリで計測した値です。
| 作業の種類 | 従来のチーム | AI と一人 | 圧縮率 |
|---|---|---|---|
| 定型コード / 足場づくり | 2 日 | 15 分 | 100× |
| テストを書く | 1 日 | 15 分 | 50× |
| 機能の実装 | 1 週間 | 30 分 | 30× |
| バグ修正+リグレッションテスト | 4 時間 | 15 分 | 20× |
| アーキテクチャ / 設計 | 2 日 | 4 時間 | 5× |
| 調査 / 探索 | 1 日 | 3 時間 | 3× |
この表がすべての判断を変えます。
かつて「時間がないから後回し」にしていた最後の 10%(テスト、エッジケース、ドキュメント)――その 10% が、いまや「数秒で済む」のです。
*「湖(lake)」は沸かせる範囲のもの。完全なテストカバレッジ、すべてのエッジケース、エラーパス全部。
*「海(ocean)」は沸かせない。プラットフォーム全面書き換え、複数四半期の移行。
湖は沸かせ。海はスコープ外と宣言しろ。
さらに、Karpathy は AI コーディングでよくある 4 つの失敗モードを公開しました。間違った前提・過剰複雑化・関係ない場所への変更・命令的なコードです。gstack の各スキルは、これらの失敗モードを仕組みとして防ぐようにできています。たとえば /gstack-office-hours はコードを書く前に前提を炙り出し、/gstack-review は不必要な複雑さや「ついでに直したらしい無関係な変更」を検知します。
つまり gstack は、「AI に書かせる」だけでは越えられない壁を、プロセスとして越えるためのものです。
一人の builder が、一日に 10,000 行以上の使えるコードを、テスト付きで、レビュー済みで出荷する――その規律を提供します。
30 秒で工場を立ち上げる
必要なのは 4 つだけ。すでに開発を始めている人なら、おそらく全部入っています。
手順 ― コピペするだけ
なぜ --prefix を付けるのか
--prefix を付けると、すべてのコマンドが /gstack-qa・/gstack-ship のように 名前空間化されます。
あなたが他のツールやカスタムコマンドを使っているとき、それらと衝突しません。後で気が変わったら、./setup --no-prefix でいつでもフラット化できます。
確認 ― 工場が稼働しているか
Claude Code 内で /gstack- と入力してみてください。43 個の専門家リストがずらりと並べば、開業準備完了です。
bun#4253)があるため、ブラウザ操作系の /gstack-browse は自動的に Node.js 版にフォールバックします。
アンインストール ― 後悔しないために
嫌になったら、これ一発で全部消えます。
43 人の専門家が一斉に出社する
gstack をインストールした瞬間、あなたの Claude Code には 43 人の専門家が出社します。
YC のオフィスアワーを再現する企画担当、CEO 視点で構想を磨くレビューア、プロダクションのバグを嗅ぎ当てるシニアエンジニア、本物のブラウザを開く QA リード、OWASP に怯える CSO ――。彼らは必要な瞬間にだけ呼ばれて仕事をします。
全員を覚える必要はありません。あなたが「壁打ちしたい」「テストして」「PR 作って」と日本語で言えば、勝手に正しい人が出てきます。それでも、誰がいるかを把握しておくと、頼り方が分かります。
企画・思考フェーズ
あなたの構想に対して 6 つの厳しい問いを投げる。「興味は需要じゃない。行動だけが需要だ。」
4 つの姿勢で計画を磨く。EXPANSION(夢を広げる)/SELECTIVE/HOLD(厳格レビュー)/REDUCTION。
アーキテクチャ、データフロー、図、エッジケース、テスト計画。隠れた前提を全部表に出す。
各デザイン軸を 0–10 で採点し、10 点に届かせるために計画を書き直す。AI slop 検出器付き。
「最初の Hello World までの時間(TTHW)」を競合と比較。20–45 個の問いで摩擦を 1 つずつ潰す。
CEO → デザイン → エンジニアリング → DX を一気に通す。あなたの判断が要る箇所だけを浮かび上がらせる。
うるさく感じる質問を「永久に聞かない」に。逆に「必ず聞いて」も指定可。
デザイン
業界の景観を調査し、創造的なリスクを提案、デザインシステム(色・フォント・余白・モーション)をゼロから作る。
「選択肢を見せて」と言うと、4–6 個の AI モックアップを作って比較ボードをブラウザで開く。あなたが選べば学習する。
承認されたモックアップを「実際に出荷できる HTML/CSS」に変換。Pretext によるレイアウト計算で本物のリフローが効く。
ライブサイトの視覚監査。問題を見つけたら、原子的なコミットで一つずつ直し、Before / After のスクリーンショットを残す。
コードレビュー・セキュリティ
CI は通るのに本番で爆発するバグを見つける。SQL injection、LLM trust boundary、条件分岐の副作用、テスト網羅性の劣化を構造的にチェック。
系統的根本原因分析。Iron Law: 根本原因なしに修正してはならない。3 回失敗したら自動的に立ち止まる。
OWASP Top 10 + STRIDE 脅威モデル。秘密鍵の発掘、依存関係のサプライチェーン監査、CI/CD パイプラインの審査。具体的な攻撃シナリオ付き。
OpenAI の Codex CLI で独立レビュー。「200 IQ の自閉的な開発者」のつもりで、Claude が見落としを刺してくる。
本物のブラウザでドキュメントをなぞり、Getting Started を試し、エラーをスクショ。/plan-devex-review の予測と現実を突き合わせる。
QA・テスト・性能
本物のブラウザでアプリを操作し、バグを見つけ、原子的に修正、リグレッションテストを自動生成。3 ティア: Quick / Standard / Exhaustive。
テストのみ、修正なし。スクリーンショット付き構造化レポートを返す。
ページロード、Core Web Vitals、リソースサイズのベースラインを取る。Before / After を毎 PR で比較。
Claude / GPT / Gemini で同じプロンプトを実行。レイテンシ・トークン・コスト・LLM 判定品質を横並びで出す。
ブラウザ操作・エージェント連携
本物の Chromium。実クリック、実スクリーンショット、コマンド 1 個 100 ms。
サイドバー付き専用ブラウザ。anti-bot stealth で Google や NYT も captcha なしで動く。あなたの Chrome は無傷のまま。
OpenClaw・Hermes・Codex・Cursor 等と同じブラウザを共有。各エージェントが別タブを持ち、互いに干渉しない。ngrok 自動起動。
本物の Chrome / Arc / Brave / Edge から Cookie をインポート。認証必須ページのテストが一発で通る。
出荷・デプロイ
main をマージ → テスト実行 → diff レビュー → VERSION bump → CHANGELOG 更新 → コミット → push → PR 作成。テストが無ければ自動生成。
PR をマージ、CI とデプロイを待ち、本番ヘルスチェックまで実行。「approved」から「verified in production」までを 1 コマンド。
デプロイ後の監視ループ。コンソールエラー、性能劣化、ページ失敗をスクショ付きで監視。
Fly.io / Render / Vercel / Netlify / Heroku を自動検出、本番 URL とヘルスチェックを記録。
セーフガード
破壊的コマンドを警告。rm -rf・DROP TABLE・git push --force・kubectl delete はすべて事前確認。
編集スコープを 1 ディレクトリに限定。デバッグ中に Claude が「ついでに」関係ないコードをいじるのを防ぐ。
careful + freeze を一括起動。本番作業の最強モード。
freeze の境界を解除。セッションは続けたまま編集スコープを広げたいとき。
ナレッジ・振り返り・補助
週次の振り返り。コミット履歴・作業パターン・コード品質指標を分析。チーム対応で、人ごとに「賞賛」と「成長機会 1 件」を出す。
セッションを越えて学んだことの管理。プロジェクト固有のパターン、落とし穴、好みを蓄積。検索・剪定・エクスポート可能。
git 状態・決定・残作業を保存。Conductor の workspace 切り替えでも文脈が消えない。
保存した作業状態から再開。「あれ、何やってたっけ」が消える。
ship の後にドキュメントを総点検。README / ARCHITECTURE / CONTRIBUTING / CLAUDE.md を全部最新化。
Markdown を出版品質の PDF に。1 インチ余白、目次クリック可、ページ番号、章立て、curly quotes、DRAFT 透かし対応。
型チェッカー・lint・テスト・dead code 検出を統合し、0–10 の合成スコアで健康度を可視化。
どの VERSION スロットが PR に予約されているか、隣のワークスペースで何がもうすぐ ship されそうかを表示。
セッションを越えた永続記憶 GBrain をゼロから 5 分以内に立ち上げる。PGLite / Supabase の選択あり。
gstack 自身を最新版に。グローバルとプロジェクト同梱を両方検出して同期、変更点を表示。
一日のスプリントはこう流れる
gstack は道具の寄せ集めではありません。一つのプロセスです。スキルは、スプリントが進む順序で並んでいて、それぞれが次のスキルに渡すアウトプットを書き残します。/office-hours が書いた設計ドキュメントを /plan-ceo-review が読み、/plan-eng-review が書いたテスト計画を /qa が拾い、/review が見つけたバグを /ship が「直したか」確認する――。何も床にこぼれない。
/plan-eng-review
/codex
/land-and-deploy
/learn
Conductor などのワークスペース管理ツールと組み合わせれば、10〜15 個のスプリントを並列で回すことが現実になります。これは Garry が 2026 年に毎日やっていることです。「一人で工場を回す」というメタファーは比喩ではなく、運用形態の正確な記述です。
「/qa で 6 → 12 並列ワーカーに増やせた。Claude が『I SEE THE ISSUE』と言ったあと、本当にバグを見つけ、リグレッションテストを書き、検証まで終えてくれる。あれが私の働き方を変えた。」
― Garry Tan / gstack README
実演 ―
朝食ブリーフィングアプリを作る
あなたが Claude Code に「カレンダーから朝食ブリーフィングを作るアプリを作りたい」と言ったとします。
ここから何が起きるか、実際の対話を見てみましょう。これは Garry が公開している実例の再現です。
Step 1 ― 壁打ち
あなたが言った「朝食ブリーフィングアプリ」を、Claude は「あなたが本当に欲しいのはチーフ・オブ・スタッフ AI ですよ」と再構築しました。これが /office-hours の力です。あなたの言葉を聞いていない。あなたの痛みを聞いている。
Step 2 ― CEO レビュー
Step 3 ― エンジニアリングレビュー
Step 4 ― 実装(あなたは見ているだけ)
Step 5 ― レビュー
Step 6 ― QA(眼を持つ)
Step 7 ― 出荷
8 つのコマンド。あなたが「daily briefing app」と言い、Claude が「あなたが作っているのは chief of staff AI です」と言い、二人で完成させ、本物のブラウザでテストし、PR まで出す。これはコパイロットではありません。チームです。
工場を支える三つの哲学
gstack の 43 個のスキルすべての preamble に、同じ三つの原則が注入されています。これらは Garry が 20 年のソフトウェア構築経験から抽出した、2026 年版の「正しい働き方」の決め台詞です。読み流さず、内面化してください。
湖は沸かせ
Boil the Lake
AI コーディングは「完全さ」のコストをほぼゼロにした。
approach A(フル実装、150 LOC)vs approach B(90%、80 LOC)― 常に A を選べ。差の 70 行は数秒だ。
「ショートカットを取る」は人間が瓶首だった時代の遺物。湖は沸かせ。海は宣言してスコープ外にしろ。
建てる前に探せ
Search Before Building
1000× エンジニアの最初の本能は「誰かもう解いていないか?」。
* Layer 1 ― 試され尽くしたもの(あなたは知っているはず。前提を問え)
* Layer 2 ― 新しくて流行のもの(盲信するな。群衆は古いものでも新しいものでも間違える)
* Layer 3 ― 第一原理(最も価値あり。みんなが zig するときに zag せよ)
ユーザー主権
User Sovereignty
AI は提案する。ユーザーが決める。このルールは他のすべてを上書きする。
二つのモデルが「マージしろ」と言い、ユーザーが「分けたい」と言ったら、常にユーザーが正しい。
Karpathy の「アイアンマン・スーツ哲学」: 偉大な AI 製品はユーザーを増強する。置き換えない。
この三つは、独立した教訓ではなく一つの態度を作ります。
「探した上で、本当に必要なら、完全な形で建てる。ただし最終決定はあなたがする」――これが gstack の構えです。
“The best tools solve your own problem. gstack exists because its creator wanted it. Every feature was built because it was needed, not because it was requested.”
― ETHOS.md / Build for Yourself
パワーツール ―
安全と協調の道具箱
「気をつけて」と言うだけ ― /gstack-careful
Claude に「be careful」と言うと、その瞬間から破壊的なコマンドの前に必ず警告が入るようになります。rm -rf・DROP TABLE・git push --force・git reset --hard・kubectl delete・docker system prune――どれも 1 文字のタイプミスで一日分の作業を消し去る危険な命令です。
例外: rm -rf node_modules・.next・dist・__pycache__ など、ビルド成果物の削除は警告なしで通します。賢いセーフガード、です。
編集を「この箱の中」に閉じ込める ― /gstack-freeze
デバッグ中に Claude が「ついでに」関係ない場所のコードを書き換えてしまう。これは AI コーディング最大の事故です。/gstack-freeze src/auth/ と言えば、そのセッション中、src/auth/ の外側へのファイル書き込みは すべてブロックされます。/gstack-investigate は調査対象モジュールに自動 freeze を効かせます。
本番に触る日の最強モード ― /gstack-guard
careful + freeze を一括起動。本番データベースに触る日、AWS の本番アカウントを開く日、これを最初に打ってください。あなた自身の保険です。
セカンドオピニオン ― /gstack-codex
Claude が「これで完璧です」と言ったとき、本当にそうでしょうか? /gstack-codex は OpenAI の Codex CLI を呼び出し、完全に違う AI モデルの目で同じ diff を見ます。3 モード:
- Code Review: pass/fail ゲート。両方が通したコードだけが進む。
- Adversarial Challenge: 「200 IQ の自閉的な開発者」になりきって、あなたのコードを破壊しにかかる。
- Open Consultation: セッション継続つきの自由質問。Claude と Codex 両方に同じ問いを投げて意見比較。
「どこに着地できる場所がある?」― /gstack-pair-agent
あなたが Claude Code を使っていて、別ウィンドウで OpenClaw も使っている。両方に同じブラウザを見せたい。/gstack-pair-agent がそれを 1 コマンドで実現します。専用ブラウザが立ち上がり、ペースト用の指示ブロックが出ます。それをもう一方のエージェントに貼るだけ。各エージェントは別タブを持ち、互いに干渉できない。トークンはスコープ付き、レート制限付き、活動帰属付き。これは異なるベンダーの AI エージェント同士が初めて協調する瞬間です。
永続記憶 ― GBrain との連携
Claude Code はセッションが切れると記憶が消えます。これを補うのが GBrain。/gstack-setup-gbrain でゼロから 5 分以内にセットアップ。
リポジトリごとに信頼レベルを設定できます: read-write(検索&書き込み)/read-only(検索のみ)/deny(一切触らない)。複数クライアントを抱えるコンサルタントが、A 社のリポジトリで作業中に B 社の知識を汚染しないための仕組みです。
よくあるつまずき
- スキルが Claude Code に出てきません
- プロジェクトの
CLAUDE.mdに gstack セクションを追加してください。cd ~/.claude/skills/gstack && ./setupを再実行すれば自動でリンクし直します。 /gstack-browseが動きませんcd ~/.claude/skills/gstack && bun install && bun run build。Windows なら Node.js のインストールも確認してください。- 古いインストールを更新したい
/gstack-upgradeを実行。グローバルインストールとプロジェクト同梱の両方を検出して同期します。~/.gstack/config.yamlでauto_upgrade: trueにすると自動化できます。- もっと短いコマンド名にしたい(
/qaと打ちたい) cd ~/.claude/skills/gstack && ./setup --no-prefix。あなたの選択は次回アップグレード時にも記憶されます。- 逆に名前空間を分けたい(他のスキルパックと併用)
cd ~/.claude/skills/gstack && ./setup --prefix。/qaが/gstack-qaになります。- Codex が「Skipped loading skill(s) due to invalid SKILL.md」と言う
- Codex のスキル定義が古いです。
cd ~/.codex/skills/gstack && git pull && ./setup --host codex。 - テレメトリが心配です
- デフォルトで OFF。初回起動時にオプトインを聞かれるだけで、承認しない限り何も送信されません。送る項目もスキル名・所要時間・成功失敗・gstack バージョン・OS だけ。コード・ファイルパス・リポ名・branch 名・プロンプトは絶対に送りません。送信先は Supabase で、スキーマは
supabase/migrations/で完全公開、Row-Level Security で直接アクセスは全部拒否、検証 edge function 経由のみ。gstack-config set telemetry offで即時無効化できます。 - チームに導入したい
- リポジトリ内で
(cd ~/.claude/skills/gstack && ./setup --team) && ~/.claude/skills/gstack/bin/gstack-team-init required。これで teammate も自動的に gstack を使うことになります。requiredをoptionalに変えると強制ではなく推奨に。リポジトリにファイルを vendor しないので、バージョンドリフトもありません。 - Conductor で並列スプリントを回したい
- 各ワークスペースに
./setup --team済みのリポジトリを置けば、それだけで動きます。10〜15 並列が現実的な上限。各エージェントが/office-hoursや/qaを独立に走らせ、互いに干渉しません。 - 音声で操作したい(AquaVoice / Whisper など)
- 各スキルは「音声で言いたくなる自然な言い回し」を認識します。「セキュリティチェックして」「ウェブサイトをテストして」「エンジニアリングレビューやって」――スラッシュコマンド名を覚える必要はありません。
手放せなくなる三つの理由
「あなたが言ったこと」ではなく「あなたが本当に欲しいもの」を扱う
普通の AI コパイロットは、あなたの言葉を真面目に聞きすぎます。
「朝食ブリーフィングアプリを作って」と言えば、朝食ブリーフィングアプリを作る。それで終わり。
gstack の /office-hours は違います。あなたの痛みを聞き、あなたの構成を押し戻し、本当に作るべきものを再定義する。「あなたが作りたいのは chief of staff AI ですよ」と言ってくれる相手は、世界中の AI ツールの中でこれだけです。
一度この体験をすると、ただ言われた通りに作る AI には戻れません。
床にバグをこぼさない ―
Iron Law の規律
/gstack-investigate の鉄則は 「根本原因なしに修正してはならない」。/gstack-qa はバグを直すたびに自動でリグレッションテストを書きます。/gstack-review は CI を通る危険なコードを構造的に捕まえます。/gstack-ship はテストが無ければ自動でフレームワークを立ち上げてテストを書きます。
つまり、あなたが「あとで」と言いそうな全ての場所に、規律が事前に置かれている。これは「丁寧な開発者になる」訓練ではなく、プロセスとして規律を強制する道具です。
一度この感覚を覚えたチームは、規律のない開発に二度と耐えられません。
並列スプリントが「一人で工場」を現実にする
gstack は単独で使っても便利です。しかし真価は 10〜15 並列に現れます。
一つのワークスペースで /office-hours が新規アイデアを掘っているとき、隣のワークスペースでは /review が PR を見ていて、その隣では実装が動き、その隣では /qa がステージングを叩いている。あなたは CEO のように、判断が必要な瞬間にだけ顔を出す。
人間が瓶首になる工程はもう存在しません。
これが Garry が 2026 年に「2013 年の年間生産性の 240 倍」を出している正体です。秘伝のタレでも有料 SaaS でもなく、無料で公開されたプロセスです。
「これは僕の答えだ。20 年プロダクトを作ってきて、いま、人生で一番たくさんプロダクトを出荷している。AI が書いた。誰がタイプしたかは重要じゃない。何が出荷されたかが重要だ。」
― Garry Tan / gstack README
次の30 秒
Claude Code を開いて、あの 1 行を貼ってください。
その瞬間、43 人の専門家があなたの工場に出社します。
迷ったら、まず 1 つだけ。/gstack-office-hours で
あなたが今考えていることを話してみてください。