Unabhängiger Berater

KI-Infrastruktur, souveräne LLMs, Self-Hosting.

Ich helfe österreichischen Unternehmen, künstliche Intelligenz und kritische Dienste auf eigener Hardware zu betreiben — ohne Cloud-Bindung, ohne Datenabfluss, mit voller Kontrolle.

Erstgespräch anfragen Leistungen ansehen

01 / Leistungen

Vier Schwerpunkte.

Alles, was unten steht, betreibe ich selbst produktiv. Kein PowerPoint, kein Reseller-Geschäft.

KI-Infrastruktur

Inferenz auf Ihrer Hardware. Geplant, deployt, überwacht.

Ein einzelner GPU-Server oder ein Multi-Node-Setup. Modell-Routing, Auto-Scaling, Token-Throughput-Monitoring.

vLLM
SGLang
LiteLLM
Multi-GPU

Souveräne LLMs

Open-Source-Modelle on-prem. Audit-fähig, optional air-gapped.

Llama, Mistral, Qwen, DeepSeek — gehostet, gerouted, dokumentiert. Konform mit DSGVO und NISG 2026.

DSGVO
NISG 2026
On-Prem
Air-Gapped

RAG & Semantische Suche

Wissens-Retrieval auf eigenen Daten. Aufgesetzt und betrieben.

Embedding-Pipelines, Vector Stores, Re-Ranking, Eval-Loops. Für interne Dokumente, Code-Bases, Support-Tickets — auf Ihrer Infrastruktur.

pgvector
Qdrant
BGE / E5
Re-Ranking

KI-gestützte Entwicklung

Claude Code & Co. — eingeführt, abgesichert, gemessen.

Schulung, Workflow-Integration, Review-Pipelines, die KI-Output absichern. Realistische Erwartungen, messbare Resultate.

Claude Code
Codex
Reviews
Schulung

Self-Hosting

SaaS raus, eigene Server rein. Reproduzierbar und dokumentiert.

Mail, Identity, Monitoring, Backups, CI — auf einem Stack ohne Vendor-Lock-in. Proxmox als Basis für alles oben.

Proxmox
Vault
Stalwart
Wazuh

02 / Über

Stefan Starflinger.

Unabhängig, technisch, hands-on.

Ich betreibe denselben Stack, den ich empfehle: einen 4-Knoten-Proxmox-Cluster, einen GPU-Server mit zwei RTX PRO 6000, souveräne LLMs hinter LiteLLM, eigene CI-Runner, Monitoring, Mail- und Vault-Server.

Sitz in Österreich. Beratung auf Deutsch und Englisch.

03 / Kontakt

Kurz schreiben, was Sie vorhaben.

Antwort innerhalb eines Werktages.