Sprach-KI · SaaS-Plattform

Astos

Organisationen laden Leads hoch. Ein KI-Sprachagent ruft jeden an, führt das Gespräch und dokumentiert das Ergebnis. Jeder Anruf hinterlässt einen unveränderlichen Compliance-Prüfpfad.

Kategorie

Generative KI / Sprach-KI · SaaS-Plattform

Branche

Inkasso, Versicherung, Banken, Gesundheitswesen

Technologie

Next.js 16, React 19, TypeScript, Tailwind v4, NestJS 11, Prisma 5, PostgreSQL, Python, ElevenLabs

Status

In Entwicklung auf Staging. Produktion auf GCP, nur EU, geplant.

Plattformen

Web. Bediener-Dashboard und Marketing-Webseite.

Astos
Astos Dashboard — Kampagnenübersicht mit Lead-Liste und Anrufstatus

Kampagnendetails

Kampagnenübersicht mit Lead-Liste und Anrufstatus.

Astos Anrufdetails — einzelner Anruf mit Transkript und Compliance-Ergebnis

Anrufdetails

Ein einzelner Anruf mit Transkript und Compliance-Ergebnis.

Astos Analytics — Anruf-Funnel, Intent-Klassifikation und Zeitreihen-Diagramme

Analytics

Funnel, Intent-Klassifikation und Zeitreihen-Diagramme.

100%

EU-Datenspeicherung

3

Compliance-Prüfung vor jedem Anruf

30s

Dialer-Zyklus

15 min

JWT token lifetime

2

Isolierte Datenbanken

Entwicklung

Von einem verteilten Stack zu einer Sprachschleife.

Astos Evolution v1 — zusammengesetzte Multi-Anbieter-Sprach-Pipeline-Architektur

Version 01 — Zusammengesetzt

Zusammengesetzte Multi-Anbieter-Pipeline

Das ursprüngliche Design verwendete Deepgram für Sprache zu Text, Cartesia für Text zu Sprache und einen separaten Telefonieanbieter, jeweils mit eigenem API-Schlüssel und Integrationsfläche. Es wurde entworfen, aber vor der Fertigstellung abgelöst.

  • Deepgram speech to text
  • Cartesia text to speech
  • Separater Telefonieanbieter
  • Drei Integrationsflächen
Astos Evolution v2 — ElevenLabs Single-Vendor-Sprachschleife-Architektur

Version 02 — Einzelanbieter

Einzelanbieter-Sprachschleife

ElevenLabs betreibt nun die gesamte Schleife end-to-end hinter einem Python-Dienst: Sprache zu Text, KI-gesteuertes Gespräch, Text zu Sprache und Telefonie. Gewählt zur Reduzierung von Latenz und Integrationsfläche. Das Anrufstatusmodell wurde entsprechend vereinfacht.

  • ElevenLabs end to end
  • Ein Python-Sprachdienst
  • Geringere Latenz, weniger Schnittstellen
  • Failover-Adapter als Stubs behalten
Phase 1

Grundlage

Multi-Mandanten-Einzeldatenbank-Architektur mit Org-Scoping und Soft Deletes. JWT-Authentifizierung mit rotierten Refresh-Tokens und MFA.

Phase 2

Anrufdomäne

Lead- und Anruf-Zustandsmaschinen festgelegt. Die Sprach-Pipeline auf ElevenLabs end-to-end konsolidiert.

Phase 3

Sicherheit und Infrastruktur

Signierte Webhooks, Fehlerverfolgung, AdminJS aus Produktion ausgeschlossen. Hosting beschränkt auf GCP nur EU auf GKE mit CMEK.

Phase 4

MVP-Servicemodell

Im ersten Jahr intern verwalteter Dienst. Astos-Mitarbeitende verwalten Organisationen, Credits und Kampagnen für Kunden.

Die Herausforderung

Ausgehende Anrufe in regulierten Branchen unterliegen strengen, prüfbaren Regeln.

Hohe Compliance-Last

Ausgehende Anrufe in regulierten Branchen unterliegen strengen Pflichten: Einwilligung, Sperrlisten, erlaubte Anrufzeiten und Aufzeichnungshinweise.

Nachweise müssen prüfbar sein

Compliance-Nachweise dürfen nicht editierbar sein. Astos schreibt unveränderliche Prüf- und Protokolldatensätze, die niemals aktualisiert oder gelöscht werden.

Manuelles Anrufen skaliert nicht

Der Dialer automatisiert die Lead-Auswahl und Anrufplatzierung pro Kampagne und berücksichtigt Zeitplanfenster, Versuchslimits und Lead-Status.

Datenspeicherort bestimmt den Stack

DSGVO und EU-Datenspeicherung sind eine festgelegte Architekturentscheidung, kein nachträglicher Gedanke.

Das Produkt

Vom Lead-Upload zum regelkonformen Anruf – automatisch.

Leads hochladen und Kampagne konfigurieren

Schritt 1

Leads hochladen und Kampagne konfigurieren

Erstellen Sie eine Kampagne mit Agenten-Persona, Skript, Anrufernummer, Zeitplanfenster und Wiederholungsregeln. Leads per CSV hochladen. Spalten werden zu dynamischen Variablen, die Platzhalter im Skript füllen.

AI calls automatically, compliance gated

Schritt 2

AI calls automatically, compliance gated

Der Dialer wählt alle 30 Sekunden fällige Leads aus. Vor jedem Anruf validiert er Einwilligung, Anrufsperre und Zeitfenster. Gesperrte Anrufe wählen nie. Bestandene Anrufe laufen live auf ElevenLabs.

Ergebnisse, Transkripte und Analysen

Schritt 3

Ergebnisse, Transkripte und Analysen

Der KI-Dienst gibt Status, Dauer, Transkript, Intent und Sentiment über Webhooks zurück. Dashboards zeigen Funnel, Intent und Zeitreihen. Kunden können signierte ausgehende Webhooks empfangen.

So funktioniert es

Die technische Pipeline im Detail.

Astos technische Pipeline — Operator-Dashboard, Backend-API, Compliance-Engine, KI-Sprachdienst und Integrationen
01

Bediener-Dashboard

Next.js 16 + React 19 + TanStack Query

Bediener starten und überwachen Kampagnen und Anrufe. Der Browser kommuniziert mit der API hinter einem Auth-Proxy, der das Refresh-Token in einem HttpOnly-Cookie speichert.

02

Backend-API

NestJS 11 + Prisma 5 + PostgreSQL

Die zentrale Datenquelle für alle Mandantendaten. Lädt Kampagne und Lead, führt das Compliance-Gate aus, schreibt unveränderliche Datensätze und initiiert den Anruf.

03

Compliance engine

NestJS compliance checks

Einwilligung, dann Anrufsperre, dann Zeitfenster – vor jedem Anruf. Eine Sperre bricht den Anruf ab und wird dauerhaft gespeichert.

04

KI-Sprachdienst

Python + ElevenLabs

Platziert und führt das Live-Sprachgespräch, zeichnet Audio und Transkript auf und berichtet über authentifizierte Webhooks zurück.

05

Integrationen nach außen

HMAC SHA256 webhooks

Call and lead events are delivered to customer endpoints, signed and retried with backoff.

Was Astos besonders macht

Kernfunktionen.

KI-Sprachkampagnen

Ausgehende Anrufe mit konfigurierbarer Agenten-Persona, Skript, Stimme, Zeitplan und Wiederholungsregeln über einen klaren Entwurfs-bis-Archivierungs-Lebenszyklus.

Robot

Automatisierte Compliance-Engine

Einwilligungsnachweise, Anrufsperre, Zeitfenster und Aufzeichnungshinweise. Unveränderlicher Prüfpfad mit CSV-Export.

Lead-Verwaltung

Asynchroner CSV-Upload, eine vollständige Lead-Zustandsmaschine, Anrufsperre und dynamische Variablen zur Skript-Personalisierung.

Autonomer Dialer

Ein Planer, der alle 30 Sekunden fällige Anrufe auswählt und platziert und dabei Zeitplan, Versuchslimits und Lead-Status berücksichtigt.

Analytics-Dashboard

Übersicht mit KPIs, kampagnenbasiertem Funnel, Intent-Klassifikation und Zeitreihen-Diagrammen.

Integrationen und Provisionierung

Signierte ausgehende Webhooks mit Wiederholungen, Telefonnummern-Provisionierung mit KYC-Flow und ein Prepaid-Credits-System.

Architektur & Technologie

Next.js + NestJS + Python, EU-gehostet.

Eine Cross-Service-Architektur: ein Next.js Bediener-Dashboard, eine NestJS Multi-Mandanten-API als zentrale Datenquelle und ein separater Python KI-Sprachdienst. Jeder Dienst betreibt seine eigene Datenbank und integriert sich ausschließlich über HTTP und Webhooks. Durchgehend EU-gehostet.

Frontend

Next.js 16, React 19

TypeScript, Tailwind v4, TanStack Query & Form, Zod, Radix UI, Recharts

Backend

NestJS 11

Node.js 22, Prisma 5, JWT & MFA auth, throttling, Helmet

Data

PostgreSQL 15+

Zwei isolierte Datenbanken, Soft Deletes, unveränderliche Audit-Tabellen

AI Voice

Python + ElevenLabs

Sprache zu Text, LLM, Text zu Sprache end-to-end

Infra

Hetzner DE + Railway EU

Produktionsziel: GCP GKE, Cloud SQL mit CMEK, nur EU

Multi-Mandanten-Architektur

Jede Zeile trägt eine Org-ID und jede Abfrage ist aus dem JWT auf sie beschränkt, sodass kein mandantenübergreifender Zugriff möglich ist. Soft Deletes überall. Audit- und Compliance-Protokolle sind unveränderlich.

Isolierung

Org-bezogen · Soft Deletes

Compliance-gesteuertes Anrufen

Kein Anruf erfolgt ohne bestandene Prüfung von Einwilligung, Anrufsperre und Zeitfenster. Ergebnisse werden als unveränderliche Datensätze gespeichert, mit Aufzeichnungshinweisen nach Rechtsprechung.

Gate

Einwilligung · Sperrliste · Zeitfenster

EU-Datenspeicherung

Staging auf Hetzner Falkenstein und Railway Amsterdam. Produktion beschränkt auf GCP nur EU mit CMEK und privatem Cloud SQL, ohne US-Failover.

Region

Nur EU · kein US-Failover

Next.js 16React 19TypeScriptTailwind v4TanStack QueryTanStack FormZodRadix UIRechartsnext-intlBunNestJS 11Node.js 22Prisma 5PostgreSQLJWTMFAPythonElevenLabsHelmetBackblaze B2RollbarnodemailerDockerCoolifyHetznerRailwayGCPGKECloud SQLRedis

Erkenntnisse

Was wir beim Entwickeln gelernt haben.

01

Compliance ist Architektur.

DSGVO und Datenspeicherort haben den Stack von Anfang an geprägt. Nur-EU-Hosting ist festgelegt, Soft Deletes und unveränderliche Audit-Tabellen sind auf Schema-Ebene, und das Compliance-Gate läuft im Anrufpfad selbst, nicht als nachträgliche Berichterstattung.

02

Ein Anbieter für die Sprachschleife übertrifft eine zusammengesetzte Pipeline.

Das ursprüngliche Multi-Anbieter-Design wurde durch ElevenLabs end-to-end abgelöst. Weniger Integrations-Schnittstellen und geringere Latenz. Die alten Adapter bleiben als Failover-Naht erhalten.

03

Zustand nur modellieren, wenn er etwas bedeutet.

Der Lead-Status bleibt leer bis ein Anruf abgeschlossen ist, und 'kontaktiert' wird abgeleitet statt gespeichert. Das vermeidet denormalisierte Flags und Phantom-Zustände.

04

Was die API nicht durchsetzen kann, muss der Vertrag regeln.

Die Sprach-API bietet kein anrufbezogenes Training-Opt-out, daher wird diese Anforderung vertraglich im Auftragsverarbeitungsvertrag gebunden. Anbieter-Grenzen prägen die rechtliche Haltung.

Was das für Ihr Unternehmen bedeutet

Produktionserprobt. Entwickelt für regulierte Anrufumgebungen.

Bei Astos

KI-Sprachagenten führen regelkonforme ausgehende Anrufe in großem Maßstab durch.

wirdfür Sie

Für Ihr Unternehmen

Für jede regulierte Anrufoperation

Dieselbe Engine passt zu jedem Hochvolumen-Anruf-Team, das regelkonform bleiben muss.

Bei Astos

Jeder Anruf wird compliance-gated und audit-protokolliert.

wirdfür Sie

Für Ihr Unternehmen

Nachweisbarer Compliance-Nachweis

Sie können exakt nachweisen, welche Prüfungen bei jedem Anruf durchgeführt wurden – mit unveränderlichen Datensätzen.

Bei Astos

Vollständige EU-Datenspeicher-Architektur.

wirdfür Sie

Für Ihr Unternehmen

Entwickelt für DSGVO-sensible Branchen

Daten und Verarbeitung bleiben per Design in der EU – nicht per Konfiguration.

Häufig gefragt

Technische Fragen zu Astos.

Auf Staging laufen Backend, Frontend und Datenbank auf einem Hetzner-Server in Falkenstein, Deutschland. Der KI-Dienst und seine Datenbank laufen auf Railway EU West in Amsterdam. Die Produktion ist auf GCP, nur EU-Region, mit CMEK-Verschlüsselung und ohne US-Failover beschränkt.

Lassen Sie uns herausfinden, was KI für Ihr Unternehmen tun kann.

15 Minuten. Kostenlos. Unverbindlich.

Kein Verkaufsgespräch. Versprochen.