Als Anthropic kürzlich den OAuth-Workaround in OpenCode blockierte, fiel vielen Engineering-Teams ihr Modell-Mix auseinander. Markus Wondrak (TAB Zürich) reagierte mit AgentMux: einer deterministischen Multi-Agenten-Pipeline, die vorhandene KI-CLI-Tools via tmux orchestriert. Das LinkedIn-Posting dazu sorgt für Resonanz – Grund genug für einen Deep Dive.

Was AgentMux macht

  • Multi-Agent-Workflow, aber fix verdrahtet: Rollen wie Product Manager, Architect, Coder, Reviewer, Docs laufen sequenziell – keine spontanen Agenten-Entscheidungen.
  • CLI statt API: AgentMux steuert vorhandene Tools (claude, codex, gemini, opencode) in eigenen tmux-Panes. OAuth-Sessions der jeweiligen Provider werden wiederverwendet → keine neuen API-Keys, keine Tokenrechnung.
  • State Machine + Filesystem: Jeder Schritt schreibt strukturierte Outputs (Plan, Code, Review) in Files. Die Orchestrierung beobachtet diese Dateien und schaltet den nächsten Agenten frei.

Warum das spannend ist

  1. Kostenkontrolle: Lizenzen (z. B. Claude Opus, Gemini Pro, OpenCode) werden ohnehin bezahlt. AgentMux spart zusätzliche API-Ausgaben.
  2. Determinismus: Pipeline ist deklarativ festgelegt (config.yaml). Keine Überraschungen durch halluzinierende Pläne; der Orchestrator sorgt für Konsistenz.
  3. Model-Mixing: Pro Rolle lassen sich andere Provider/Profile definieren (z. B. Architekt = Claude Opus, Coder = Codex, Reviewer = Gemini Flash).
  4. GitHub-Integration: Optionaler PM-Step generiert Spezifikationen; --issue zieht Titel/Body via gh und öffnet am Ende Pull Requests.

Architektur (aus dem README)

Product Manager → Planning → Implementing → Reviewing → (Fixing) → Completing

Taktgeber ist pipeline.py: Es rendert Prompts pro Rolle, injiziert sie in tmux, wartet auf Output, checkt Review-Ergebnisse und commitet bei Erfolg.

Installation (Quickstart)

pip install -r requirements.txt
python3 pipeline.py "Add rate limiting to the API"
python3 pipeline.py --product-manager ...         # optional PM-Phase
python3 pipeline.py --issue 42                     # GitHub-Issue Nr.
pipeline.py --resume                               # abgebrochene Runs fortsetzen

Konfiguration landet in .agentmux/config.yaml (overrides via ~/.config/agentmux und --config). Profile (max, standard, low) mappen auf konkrete Modelle pro Provider.

Anforderungen & Praxis-Tipps

  • tmux & CLI-Tools: Du brauchst funktionierende CLI-Aliases (claude, opencode, gh). Authentifizierung läuft wie gewohnt (OAuth in Browser, Tokens lokal).
  • Filesystem-Nerven: AgentMux erzeugt zahlreiche Artefakte im Projektordner (Plan, Code, Tests, Review). Git-Ignore anpassen!
  • Workload: Für große Features gedacht; für Ein-Zeiler-Fixes ist es Overkill.
  • Custom Prompts: Rollen-Prompts liegen in prompts/*.md und lassen sich per Projekt anpassen.

Grenzen & Ideen

Thema Beobachtung
Fehlerhandling Pipeline bricht hart ab, wenn ein CLI-Tool hängt. Watchdog/Timeouts wären wünschenswert.
Kollaboration Aktuell Single-User. Shared tmux-Session wäre möglich, aber nicht integriert.
Tests/CI Generate-Test-Phase vorhanden, aber keine automatische Ausführung in Docker/CI.
Security CLI-Tools laufen mit lokalen Rechten. Secrets sollten vorher sauber isoliert werden.

Fazit

AgentMux ist kein Ersatz für AutoDev oder OpenCode – eher ein deterministisches Framework, um vorhandene High-End-Subscriptions effizient zu stacken. Für größere Umbauten (mehrere Files, Tests, Review) liefert es planbare Ergebnisse ohne API-Overhead. Wer sowieso mit Claude, Codex & Co. arbeitet, findet hier einen pragmatischen Weg, Multi-Agent-Workflows unter eigene Kontrolle zu stellen.

Quellen: LinkedIn-Post von Markus Wondrak, GitHub: AgentMux.