KI-gestĂŒtzte Dokumentensuche mit Vektor-Embeddings
Custom Data ist ein Python-basiertes Projekt zur intelligenten Dokumentensuche. PDF-Dokumente werden extrahiert, in Vektor-Embeddings umgewandelt und in einer MySQL-Datenbank gespeichert. Ăber eine Web-OberflĂ€che können Nutzer semantische Suchanfragen stellen - die Suche findet Ă€hnliche Inhalte basierend auf Bedeutung, nicht nur auf exakte Keyword-Matches.
custom_data/
âââ data/ # PDF-Dokumente (HandbĂŒcher, Anleitungen)
âââ aa/ # Aleph Alpha Beispiel-Skripte
âââ alpha.py # Aleph Alpha API-Tests
âââ config.py # Datenbank- & API-Konfiguration
âââ embedding.py # PDF-Verarbeitung & Embedding-Generierung
âââ search.py # Semantische Suche mit Vektor-Vergleich
âââ summary.py # Zusammenfassungserstellung
âââ test.py # Test-Skript
âââ index.html # Web-Interface fĂŒr die Suche
âââ searchScript.php # PHP-Backend fĂŒr Suchanfragen
âââ index.php # Alternative PHP-Version
Entwickelt fĂŒr die Suche in technischen Dokumentationen (ca. 100+ PDF-HandbĂŒcher zu Lasersystemen, KĂŒhleinheiten, Sensoren). Statt starrer Keyword-Suche ermöglicht das System natĂŒrlichsprachliche Anfragen wie "Wie tausche ich den KĂŒhler?" und findet relevante Anleitungen unabhĂ€ngig von der exakten Formulierung.