OpenAI Modell-Training & Document Retrieval
Dieses Repository enthält experimentelle Skripte zur Interaktion mit der OpenAI API. Es umfasst sowohl ein Projekt zum Abrufen und Verarbeiten von Dokumenten (chatgpt-retrieval) als auch ältere Versuche zum Training eigener Modelle.
Der Fokus liegt auf der Verarbeitung von Textdateien und der Konvertierung in JSON-Formate für die weitere Nutzung mit OpenAI-Modellen.
Ein LangChain-basiertes Retrieval-System für Dokumente. Ermöglicht das Stellen von Fragen zu eigenen Dokumenten über eine Konversationsschnittstelle.
Python-Skripte zum Aufbereiten von Textdateien für KI-Training:
Enthält Trainingsdaten wie grundsatzprogramm.txt – ein politisches Grundsatzprogramm als Beispieldokument.
Dieses Projekt verwendet ältere OpenAI API-Aufrufe (z.B. openai.Model.create()), die mit der aktuellen API-Version nicht mehr kompatibel sind. Der Code dient primär archivarischen Zwecken.
Das chatgpt-retrieval Unterprojekt basiert auf einem YouTube-Tutorial und nutzt LangChain für modernes RAG (Retrieval-Augmented Generation).