Alle Beiträge
KI-Telefonie

Telefon-KI selbst bauen mit OpenAI & ElevenLabs Agents — oder kaufen?

ElevenLabs Agents und OpenAI Realtime machen den KI-Telefonassistenten zur fertigen Plattform. Was das wirklich löst — und welche 80 % für einen deutschen Betrieb bleiben: Anbindung an die eigene Telefonanlage, DSGVO, Betrieb.

6 Min Lesezeit robopult.

Ehrliche Antwort vorweg: Ja — und es ist 2026 sogar einfacher geworden. Du musst nicht mehr alles aus OpenAI Realtime und einer TTS-Stimme zusammenstecken. ElevenLabs Agents ist seit März 2026 eine fertige Conversational-AI-Plattform (Version 2.0: Antwortzeiten unter 500 ms, Turn-Taking-Modell, Tool-Calls, Telefonie über Twilio/Vonage/SIP). Die Technik ist exzellent — robopult nutzt unter der Haube ähnliche Modelle. Die Frage ist also nicht ob es geht. Die Frage ist, was zwischen „starke Plattform” und „läuft an unserer Telefonanlage, DSGVO-fertig, ohne dass wir es betreiben” liegt.

„Aber ElevenLabs hat doch jetzt eine fertige Agents-Plattform?”

Stimmt — und für ein Team mit Entwicklern ist das stark. Wichtig ist nur, was ElevenLabs Agents ist: eine Entwickler-Plattform, kein fertiges Produkt für eine Praxis oder Kanzlei. Eine Arzthelferin geht nicht auf elevenlabs.io und hat danach einen Telefonassistenten an der Praxisanlage. Drei Lücken bleiben — egal ob selbst gebaut oder ElevenLabs Agents:

  • Anbindung an deine Telefonanlage. ElevenLabs-Telefonie heißt: Twilio, Vonage oder SIP — du stellst also etwas vor dein Telefonsystem, mit eigenem Twilio-Account, SIP-Trunk und Rufnummern-Routing. Es dockt nicht an deine bestehende Starface oder Cloud-PBX an. Genau das ist robopults Kern: native Starface-Anbindung (Details), andere Anlagen per Sync (Übersicht) — deine Anlage, deine Rufnummern bleiben.
  • DSGVO & Verträge — der teure Teil. ElevenLabs ist eine US-Plattform; verantwortlich bist du. EU-Data-Residency, AVV nach Art. 28, Subprozessor-Liste, Zero-Training-Zusicherung, Hinweispflicht gegenüber Anrufern, Hosting in deutschen Rechenzentren — das klärst du selbst, vertraglich, nicht im Code. robopult bringt AVV nach Art. 28, deutsche Rechenzentren und die DSGVO-Ansage fertig mit.
  • Betrieb & Sicherheit. Monitoring, Failover, Modell-Updates ohne Regressionen, Erreichbarkeit — plus: ein Assistent mit CRM-Zugriff muss social-engineering-resistent sein (keine Bestandskundendaten in Reichweite, Schreibrichtung nur „Ticket rein”). Und jemand muss rangehen, wenn um 8:30 Uhr die Praxis-Hotline klemmt.

Die ehrliche Build-vs-Buy-Regel

Selbst bauen (oder ElevenLabs Agents selbst betreiben) lohnt, wenn Telefon-KI euer Kernprodukt ist und ihr ein Dev-Team habt, das Twilio/SIP-Anbindung, deutsche DSGVO-Verträge und den laufenden Betrieb dauerhaft stemmt — dann gehört das in eure Hand.

Kaufen lohnt, wenn ihr die KI an eurer Telefonanlage nutzen wollt, nicht eine Plattform betreiben. Dann zahlt ihr nicht für das Modell — das ist heute der gute, günstige Teil — sondern für die 80 % danach: native Anbindung an eure Anlage, deutsche DSGVO-Konformität, Betrieb und Haftung. Genau das ist robopults KI-Telefonassistent: starke Modelle unter der Haube, aber an eure Starface/Cloud-PBX angedockt, DSGVO-fertig und schlüsselfertig installiert.

Wenn du abwägen willst, ob sich Eigenbau oder eine Plattform wie ElevenLabs Agents für euch rechnet: In einer kurzen Demo zeigen wir, was „produktionsreif an der eigenen Anlage” konkret bedeutet — danach lässt sich der Aufwand ehrlich vergleichen. Konditionen auf der Preisseite.

Klingt nach deinem Problem?

In einer kurzen Demo zeigen wir die passende Lösung live an einer echten Test-Anlage — du entscheidest danach in Ruhe.