AgentMux: Deterministische KI-Pipelines ohne API-Kosten
Als Anthropic kürzlich den OAuth-Workaround in OpenCode blockierte, fiel vielen Engineering-Teams ihr Modell-Mix auseinander. Markus Wondrak (TAB Zürich) reagierte mit AgentMux : einer deterministischen Multi-Agenten-Pip …
Tech Leads, AI-Builder:innen, Teams mit Multi-Agent-Workflows.
CLI-Affinität (tmux, Python), bestehende AI-Subscriptions.
Als Anthropic kürzlich den OAuth-Workaround in OpenCode blockierte, fiel vielen Engineering-Teams ihr Modell-Mix auseinander. Markus Wondrak (TAB Zürich) reagierte mit AgentMux: einer deterministischen Multi-Agenten-Pipeline, die vorhandene KI-CLI-Tools via tmux orchestriert. Das LinkedIn-Posting dazu sorgt für Resonanz – Grund genug für einen Deep Dive.
Was AgentMux macht
- Multi-Agent-Workflow, aber fix verdrahtet: Rollen wie Product Manager, Architect, Coder, Reviewer, Docs laufen sequenziell – keine spontanen Agenten-Entscheidungen.
- CLI statt API: AgentMux steuert vorhandene Tools (
claude,codex,gemini,opencode) in eigenen tmux-Panes. OAuth-Sessions der jeweiligen Provider werden wiederverwendet → keine neuen API-Keys, keine Tokenrechnung. - State Machine + Filesystem: Jeder Schritt schreibt strukturierte Outputs (Plan, Code, Review) in Files. Die Orchestrierung beobachtet diese Dateien und schaltet den nächsten Agenten frei.
Warum das spannend ist
- Kostenkontrolle: Lizenzen (z. B. Claude Opus, Gemini Pro, OpenCode) werden ohnehin bezahlt. AgentMux spart zusätzliche API-Ausgaben.
- Determinismus: Pipeline ist deklarativ festgelegt (
config.yaml). Keine Überraschungen durch halluzinierende Pläne; der Orchestrator sorgt für Konsistenz. - Model-Mixing: Pro Rolle lassen sich andere Provider/Profile definieren (z. B. Architekt = Claude Opus, Coder = Codex, Reviewer = Gemini Flash).
- GitHub-Integration: Optionaler PM-Step generiert Spezifikationen;
--issuezieht Titel/Body viaghund öffnet am Ende Pull Requests.
Architektur (aus dem README)
Product Manager → Planning → Implementing → Reviewing → (Fixing) → Completing
Taktgeber ist pipeline.py: Es rendert Prompts pro Rolle, injiziert sie in tmux, wartet auf Output, checkt Review-Ergebnisse und commitet bei Erfolg.
Installation (Quickstart)
pip install -r requirements.txt
python3 pipeline.py "Add rate limiting to the API"
python3 pipeline.py --product-manager ... # optional PM-Phase
python3 pipeline.py --issue 42 # GitHub-Issue Nr.
pipeline.py --resume # abgebrochene Runs fortsetzen
Konfiguration landet in .agentmux/config.yaml (overrides via ~/.config/agentmux und --config). Profile (max, standard, low) mappen auf konkrete Modelle pro Provider.
Anforderungen & Praxis-Tipps
- tmux & CLI-Tools: Du brauchst funktionierende CLI-Aliases (
claude,opencode,gh). Authentifizierung läuft wie gewohnt (OAuth in Browser, Tokens lokal). - Filesystem-Nerven: AgentMux erzeugt zahlreiche Artefakte im Projektordner (Plan, Code, Tests, Review). Git-Ignore anpassen!
- Workload: Für große Features gedacht; für Ein-Zeiler-Fixes ist es Overkill.
- Custom Prompts: Rollen-Prompts liegen in
prompts/*.mdund lassen sich per Projekt anpassen.
Grenzen & Ideen
| Thema | Beobachtung |
|---|---|
| Fehlerhandling | Pipeline bricht hart ab, wenn ein CLI-Tool hängt. Watchdog/Timeouts wären wünschenswert. |
| Kollaboration | Aktuell Single-User. Shared tmux-Session wäre möglich, aber nicht integriert. |
| Tests/CI | Generate-Test-Phase vorhanden, aber keine automatische Ausführung in Docker/CI. |
| Security | CLI-Tools laufen mit lokalen Rechten. Secrets sollten vorher sauber isoliert werden. |
Fazit
AgentMux ist kein Ersatz für AutoDev oder OpenCode – eher ein deterministisches Framework, um vorhandene High-End-Subscriptions effizient zu stacken. Für größere Umbauten (mehrere Files, Tests, Review) liefert es planbare Ergebnisse ohne API-Overhead. Wer sowieso mit Claude, Codex & Co. arbeitet, findet hier einen pragmatischen Weg, Multi-Agent-Workflows unter eigene Kontrolle zu stellen.
Quellen: LinkedIn-Post von Markus Wondrak, GitHub: AgentMux.