CSV-Deduplizierungstool für Kontaktdaten
Python-Tool zum Entfernen von doppelten Kontakteinträgen aus einer CSV-Datei. Prüft auf Duplikate basierend auf Vorname, Nachname, Straße und Hausnummer und exportiert einzigartige Datensätze.
main.py - HauptskriptKontaktpersonen.csv - EingabedatenKontaktpersonen_einzigartig.csv - Bereinigte Daten (v1)Kontaktpersonen_einzigartig2.csv - Bereinigte Daten (v2)import pandas as pd
# CSV-Datei einlesen
df = pd.read_csv('Kontaktpersonen.csv',
sep=';',
header=None,
encoding='ISO-8859-1')
# Duplikate entfernen (Vorname, Nachname, Straße, Hausnr.)
df_unique = df.drop_duplicates(subset=[12, 13, 18, 19])
# Exportieren
df_unique.to_csv('Kontaktpersonen_einzigartig2.csv',
sep=';',
header=False,
index=False)