Python-Tools zur CSV-Datenverarbeitung und Deduplizierung von Vereinskontakten
Python-basierte Datenverarbeitungstools für die Verwaltung und Bereinigung von Vereinskontakten aus dem deutschen Vereinsregister. Die Tools ermöglichen das Zusammenführen, Filtern und Bereinigen großer CSV-Datenbestände.
filter_contacts.py - Hauptskript zur Kontaktfilterungmerge_csv_files.py - Zusammenführung mehrerer CSV-Dateienvereinsregister_google_kontakte_part1-9.csv - Quelldaten (aufgeteilt)vereinsregister_google_kontakte_komplett.csv - Zusammengeführte Datenvereinsregister_google_kontakte_gefiltert.csv - Bereinigte AusgabeVereinsverzeichnis Stand 17.05.24-2.csv - Original-Vereinsdatenimportdatei.csv / importdatei_neu.csv - Import-Dateien# Alle CSV-Dateien mit dem Muster finden und zusammenführen
- Glob-Pattern: 'vereinsregister_google_kontakte*.csv'
- Duplikate entfernen mit drop_duplicates()
- Ausgabe: 'vereinsregister_google_kontakte_komplett.csv'
# Drei-stufige Filterung:
1. Duplikate entfernen (Name + Vereinsname)
2. Kontakte ohne Telefon UND E-Mail entfernen
3. Sortieren nach Name
4. Statistik-Ausgabe (Telefon/Email/both)
Ideal für die Aufbereitung von Kontaktdaten aus öffentlichen Registern für Marketing-Kampagnen, Vereinsnetzwerke oder CRM-Importe. Die Tools stellen sicher, dass nur validierte Kontakte mit erreichbaren Kontaktmöglichkeiten exportiert werden.