🗂️ Vereinsregister

Python-Tools zur CSV-Datenverarbeitung und Deduplizierung von Vereinskontakten

📋 Projektbeschreibung

Python-basierte Datenverarbeitungstools für die Verwaltung und Bereinigung von Vereinskontakten aus dem deutschen Vereinsregister. Die Tools ermöglichen das Zusammenführen, Filtern und Bereinigen großer CSV-Datenbestände.

🎯 Hauptfunktionen

  • CSV-Merging: Zusammenführen mehrerer CSV-Dateien (part1-9) zu einer kompletten Datei
  • Deduplizierung: Entfernen doppelter Kontakte basierend auf Name und Vereinsname
  • Kontaktfilterung: Filterung nach Telefonnummer und E-Mail-Verfügbarkeit
  • Statistische Auswertung: Übersicht über Kontaktqualität

🛠️ Technologien

Python Pandas CSV Data Cleaning UTF-8

📁 Dateistruktur

  • filter_contacts.py - Hauptskript zur Kontaktfilterung
  • merge_csv_files.py - Zusammenführung mehrerer CSV-Dateien
  • vereinsregister_google_kontakte_part1-9.csv - Quelldaten (aufgeteilt)
  • vereinsregister_google_kontakte_komplett.csv - Zusammengeführte Daten
  • vereinsregister_google_kontakte_gefiltert.csv - Bereinigte Ausgabe
  • Vereinsverzeichnis Stand 17.05.24-2.csv - Original-Vereinsdaten
  • importdatei.csv / importdatei_neu.csv - Import-Dateien

⚙️ Funktionsweise

merge_csv_files.py

# Alle CSV-Dateien mit dem Muster finden und zusammenführen
- Glob-Pattern: 'vereinsregister_google_kontakte*.csv'
- Duplikate entfernen mit drop_duplicates()
- Ausgabe: 'vereinsregister_google_kontakte_komplett.csv'

filter_contacts.py

# Drei-stufige Filterung:
1. Duplikate entfernen (Name + Vereinsname)
2. Kontakte ohne Telefon UND E-Mail entfernen
3. Sortieren nach Name
4. Statistik-Ausgabe (Telefon/Email/both)

💡 Anwendungsfall

Ideal für die Aufbereitung von Kontaktdaten aus öffentlichen Registern für Marketing-Kampagnen, Vereinsnetzwerke oder CRM-Importe. Die Tools stellen sicher, dass nur validierte Kontakte mit erreichbaren Kontaktmöglichkeiten exportiert werden.