ShortGPT Local: Social-Media-Videos per KI — in Minuten, nicht Stunden

Text rein, Video raus — automatische Shorts-Generierung komplett ohne Cloud

Python MoviePy Stable Diffusion edge-tts

🎬 Content Creation automatisiert — Text rein, Shorts-Video raus.

📞 02406 803 7603 ✉️ info@computerkumpel.de

💰 Warum KI-Videogenerierung Ihre Content-Strategie transformiert

Ein professionelles 60-Sekunden-Video kostet bei einer Agentur 500–2.000 € — und braucht 1–2 Wochen. ShortGPT Local produziert das gleiche Ergebnis in Minuten, für Cent-Beträge an Stromkosten. Der Hebel liegt nicht in der Technik, sondern in der Geschwindigkeit des Content-Outputs.

📝
Text-zu-Video
Einfaches Text-Script eingeben — das System generiert Storyboard, Bilder, Voiceover und finales Video.
🖼️
Bild-zu-Video
Dynamische Videos aus vorhandenen Bildern mit KI-generierten Animationen und Übergängen.
🔊
Natürliche Stimme
Integrierte TTS für natürliche deutsche Sprachausgabe. Untertitel automatisch synchronisiert.
📱
Alle Plattformen
YouTube Shorts, TikTok, Instagram Reels — native 9:16 Formate mit optimaler Qualität.

⚙️ Der automatisierte Video-Workflow

Fünf Schritte vom Text-Script zum fertigen Social-Media-Video.

📋
1. Script schreiben
Thema oder Volltext eingeben. Die KI erstellt bei Bedarf ein optimiertes Storyboard für Shorts.
🎨
2. Szenen generieren
KI erstellt Storyboard und generiert passende Bilder/Clips für jede Szene.
🔊
3. Vertonen
TTS generiert die Sprachspur. Untertitel werden automatisch mit Zeitstempeln erstellt.
🎬
4. Rendern
MoviePy + FFmpeg kombinieren Bilder, Audio und Effekte zum fertigen MP4 mit 30 fps.

💻 Technische Umsetzung

ShortGPT Local automatisiert die Erstellung von Kurzvideos — von Text oder Bildern zum fertigen Social-Media-Content. Vollständig lokal ohne Cloud-Dienste.

🚀 Schnellstart

# In das Projektverzeichnis wechseln
cd shortgptlocal

# Virtuelle Umgebung erstellen
python -m venv venv
source venv/bin/activate  # Linux/Mac
# oder: venv\Scripts\activate  # Windows

# Abhängigkeiten installieren
pip install -r requirements.txt

# ShortGPT Local starten
python shortgpt.py --input "mein_script.txt" --output video.mp4

🛠️ Tech Stack

Python 3.10+ MoviePy FFmpeg Stable Diffusion edge-tts Pillow Whisper

⚙️ Konfiguration

# config.yaml
video:
  width: 1080
  height: 1920  # 9:16 für Shorts/Reels
  fps: 30
  duration: 60  # Sekunden

ai:
  image_model: "stabilityai/stable-diffusion-xl-base-1.0"
  voice_language: "de"
  voice_name: "de-DE-KatjaNeural"

output:
  format: "mp4"
  quality: "high"
  add_subtitles: true

📋 Systemanforderungen

Python
3.10 oder höher.
RAM
16 GB Minimum, 32 GB+ empfohlen.
Speicher
10 GB für KI-Modelle.
GPU
Optional: NVIDIA GPU 8 GB+ VRAM für Bildgenerierung.

🎨 Video-Formate

YouTube Shorts
1080 × 1920 (9:16)
TikTok
1080 × 1920 (9:16)
Instagram Reels
1080 × 1920 (9:16)
Standard
1920 × 1080 (16:9)

⚡ Vom Text zum fertigen Short — in Minuten, nicht Tagen.

📞 02406 803 7603 ✉️ info@computerkumpel.de

🚀 Gebaut mit Vibecoding — in 5–7 Tagen statt 8–13 Wochen

👴 Klassische Entwicklung
  • 📋 2–3 Wochen Requirements Engineering
  • 🏗️ 2–3 Wochen Architektur & Design
  • 💻 3–4 Wochen Implementierung
  • 🧪 1–2 Wochen Testing
  • 🚢 1 Woche Deployment
  • ⏱️ Gesamt: 8–13 Wochen
🤖 Vibecoding-Ansatz
  • 🗣️ 0.5 Tage Prompt-Engineering
  • ⚡ 2–3 Tage iterative Generierung
  • 🔧 1–2 Tage Refinement & Debugging
  • ✅ 1 Tag Integration & Testing
  • 🚀 0.5 Tage Deployment
  • ⏱️ Gesamt: 5–7 Tage

🗣️ Der System-Prompt hinter diesem Projekt

Du bist ein Python-Experte für automatisierte Videoproduktion.

Aufgabe: Erstelle ein Tool zur automatischen Generierung von Kurzvideos 
(Shorts, Reels, TikTok) aus Text-Scripts oder Bildmaterial.

Pipeline:
1. Text-Script parsen → Storyboard (Szenen-Einteilung)
2. Bilder generieren (Stable Diffusion) oder aus Input extrahieren
3. Voiceover via TTS (edge-tts, deutsch: de-DE-KatjaNeural)
4. Untertitel synchronisiert generieren
5. Finales Video mit MoviePy + FFmpeg rendern

Technische Anforderungen:
- Python 3.10+, MoviePy für Video-Komposition
- Stable Diffusion (lokal via diffusers) für Bildgenerierung
- edge-tts für deutsche Sprachausgabe
- Pillow für Bildbearbeitung
- Whisper optional für automatische Untertitel-Generierung

Video-Spezifikation:
- 9:16 Format (1080×1920) für Shorts/Reels/TikTok
- 30 fps, konfigurierbare Dauer (15–60 Sek.)
- Hintergrundmusik und Übergangseffekte
- Branding-Overlay (Logo, Wasserzeichen)

🎯 Strategische Erkenntnisse aus diesem Projekt

Content Creation ist der perfekte Anwendungsfall für KI-Automatisierung — hohe Kosten, repetitive Muster, messbarer Output.

📈
Content-Skalierung ist der Hebel
1 Video pro Woche → 1.000 Views. 30 Videos pro Woche → 30.000+ Views. Die Content-Menge ist der stärkste Hebel im Social-Media-Algorithmus. KI-Automatisierung macht tägliches Posten ohne Personalaufstockung möglich.
🎯
Nischen-Content schlägt Massenware
KI erzeugt spezifischen Content für Nischen-Zielgruppen — Fachthemen, lokale Inhalte, Branchen-News. Während Agenturen auf Masse optimieren, kann KI auf Tiefe optimieren.
🔊
Voiceover ist der Qualitäts-Entscheider
Schlechtes TTS killt jedes Video. edge-tts (de-DE-KatjaNeural) liefert natürliche Stimmen auf Agentur-Niveau. Die Sprachqualität ist der Unterschied zwischen „KI-Müll" und „professionellem Content".
Kosten-Nutzen-Schere
Agentur-Video: 500–2.000 € / Stück. KI-Video: Stromkosten (~0,50 €) + 10 Min. Render-Zeit. Die Kostendifferenz ist so extrem, dass selbst eine 50% niedrigere Qualität noch wirtschaftlich wäre. Aber die Qualität ist gleich oder besser.

Bereit, Ihre Content-Produktion zu automatisieren?

Von 1 Video pro Woche zu 1 Video pro Tag — ohne zusätzliches Personal. Lassen Sie uns Ihre Content-Pipeline bauen.

🔍
Content-Audit
Welche Content-Formate eignen sich für KI-Automatisierung? Wir analysieren Ihre aktuelle Strategie und identifizieren Potenziale.
🧪
Pipeline-Prototyp
In 5–7 Tagen eine funktionierende Video-Pipeline mit Ihrem Branding, Ihrer Tonalität und Ihren Themen.
🤝
Vollautomatisierung
Von der Themen-Recherche über die Generierung bis zum automatischen Posten — Ihre Content-Maschine läuft 24/7.
📞 02406 803 7603 ✉️ info@computerkumpel.de