🎧 Hörbuch Generator

KI-gestützte Erstellung von Hörbüchern und Hörspielen

📋 Beschreibung

Dieses Projekt ist ein Python-basiertes Tool zur automatisierten Erstellung von Hörbüchern und Hörspielen aus Textvorlagen. Es nutzt moderne KI-Technologien zur Textanalyse, Sprachsynthese und Audioverarbeitung.

Der Workflow umfasst die Umwandlung von Geschichten in strukturierte Dialoge, die Zuweisung von Stimmen zu Charakteren mittels ElevenLabs TTS, Audio-Normalisierung und das Zusammenfügen zu finalen Hörbuch-Dateien mit optionaler Hintergrundmusik.

🛠️ Technologien

Python 3.12 Hauptprogrammiersprache
OpenAI GPT-4 Textanalyse & Strukturierung
ElevenLabs API KI-gestützte Sprachsynthese
Gradio Webbasierte GUI
FFmpeg Audioverarbeitung & Mischung
ebooklib ePub-Generierung
SpeechRecognition Automatische Untertitel
pysubs2 SRT-Untertitel-Generierung

⚙️ Hauptfunktionen

📁 Projektstruktur

🎯 Anwendungsbeispiele

Das System wurde erfolgreich für Märchen wie "Die Prinzessin auf der Erbse" und "Aschenputtel" eingesetzt. Dabei werden:

📍 Projektstandort

Lokaler Pfad: D:\arbeit\git\Hoerbuch_neu

Remote-System: Windows-Workstation (192.168.178.71) mit RTX 3060