Excel-Tool: Automatisierte Datenverarbeitung mit Python

Datenbereinigung, Duplikatsuche & Reports — per Skript, nicht per Hand

Python openpyxl pandas XLSX

📊 Ihre Excel-Dateien. Automatisch verarbeitet. Heute.

📞 02406 803 7603 ✉️ info@computerkumpel.de

⏱️ Warum Excel automatisieren?

Ein durchschnittlicher Büro-Mitarbeiter verbringt 4–6 Stunden pro Woche mit manueller Excel-Datenverarbeitung. Das Tool übernimmt Routine-Aufgaben in Sekunden — fehlerfrei und wiederholbar.

🚀

Sekunden statt Stunden

10.000 Zeilen bereinigen in unter 3 Sekunden. Pivot-Tabellen per Konfiguration statt Copy-Paste.

✅

100% fehlerfrei

Keine Tippfehler, keine vergessenen Zeilen. Validierung und Konsistenz-Prüfung automatisch.

📈

Wiederholbar

Einmal konfiguriert, jederzeit ausführbar. Monatsabschluss auf Knopfdruck.

🔗

Integrierbar

Export als CSV, JSON, Datenbank oder direkt ins ERP-System. API-Anbindung möglich.

⚙️ Kernfunktionen

🧹 Datenbereinigung

Leerzeichen trimmen, Datumsformate normalisieren, Sonderzeichen entfernen, Null-Werte erkennen.

🔍 Duplikatsuche

Exakte & fuzzy Duplikate finden. Konfigurierbare Vergleichsspalten. Merge-Strategie wählbar.

📊 Pivot-Auswertung

Automatische Pivot-Tabellen aus YAML-Konfiguration. Summen, Mittelwerte, Kreuztabellen.

📑 Report-Generator

Formatierte Excel-Reports mit Charts, bedingter Formatierung und Zusammenfassungsblatt.

🔄 Batch-Verarbeitung

Ganzen Ordner mit Excel-Dateien in einem Durchlauf verarbeiten. Konsolidierung in eine Datei.

✉️ E-Mail-Versand

Fertige Reports automatisch per E-Mail versenden. Zeitgesteuert via Task-Scheduler oder Cron.

💻 Technische Umsetzung

import pandas as pd
from openpyxl import Workbook
from openpyxl.styles import Font, PatternFill, Alignment
from openpyxl.chart import BarChart, Reference

class ExcelProcessor:
    """Kern-Klasse für Excel-Automatisierung."""
    
    def __init__(self, config_path: str = 'excel_config.yaml'):
        with open(config_path) as f:
            self.config = yaml.safe_load(f)
    
    def clean_dataframe(self, df: pd.DataFrame) -> pd.DataFrame:
        """Bereinigt einen DataFrame nach konfigurierten Regeln."""
        rules = self.config.get('cleaning_rules', {})
        
        for col, rule in rules.items():
            if col not in df.columns:
                continue
            
            if rule.get('trim_whitespace'):
                df[col] = df[col].astype(str).str.strip()
            
            if rule.get('normalize_date'):
                df[col] = pd.to_datetime(df[col], errors='coerce')
            
            if rule.get('remove_special_chars'):
                df[col] = df[col].str.replace(r'[^\w\s]', '', regex=True)
        
        return df.drop_duplicates()
    
    def find_duplicates(self, df: pd.DataFrame, columns: list = None):
        """Findet Duplikate basierend auf konfigurierbaren Spalten."""
        cols = columns or self.config.get('dup_columns', df.columns.tolist())
        dup_mask = df.duplicated(subset=cols, keep=False)
        return df[dup_mask].sort_values(by=cols)
    
    def generate_report(self, df: pd.DataFrame, output_path: str):
        """Erstellt einen formatierten Excel-Report."""
        wb = Workbook()
        ws = wb.active
        ws.title = "Report"
        
        # Header formatieren
        header_fill = PatternFill(start_color="2563EB", fill_type="solid")
        header_font = Font(color="FFFFFF", bold=True, size=11)
        
        for col_idx, col_name in enumerate(df.columns, 1):
            cell = ws.cell(row=1, column=col_idx, value=col_name)
            cell.fill = header_fill
            cell.font = header_font
        
        # Daten schreiben
        for row_idx, row in df.iterrows():
            for col_idx, value in enumerate(row, 1):
                ws.cell(row=row_idx + 2, column=col_idx, value=value)
        
        # Auto-Fit Spaltenbreite
        for col in ws.columns:
            max_length = max(len(str(cell.value or '')) for cell in col)
            ws.column_dimensions[col[0].column_letter].width = min(max_length + 2, 50)
        
        wb.save(output_path)

⚡ Monatsabschluss in 5 Minuten statt 5 Stunden.

📞 02406 803 7603 ✉️ info@computerkumpel.de

Excel-Automatisierung, die sich in Wochen amortisiert.

Wir analysieren Ihre Excel-Workflows und bauen die passende Automatisierung.

🔍

Workflow-Analyse

Wir identifizieren repetitive Excel-Aufgaben mit dem größten Einsparpotenzial.

🔧

Maßanfertigung

Ihr persönliches Excel-Tool — exakt auf Ihre Daten und Prozesse zugeschnitten.

🎓

Schulung

Ihr Team lernt, das Tool selbst zu erweitern. Unabhängigkeit nach der Übergabe.

📞 02406 803 7603 ✉️ info@computerkumpel.de

💻 Code-Einblicke

Generische Code-Beispiele für Excel-Automatisierung.

📊 Excel mit pandas

import pandas as pd

# Excel-Datei laden
df = pd.read_excel('daten.xlsx', sheet_name='Tabelle1')

# Duplikate entfernen
df_clean = df.drop_duplicates(subset=['Email', 'Name'])

# Pivot-Tabelle erstellen
pivot = df.pivot_table(values='Umsatz', index='Kategorie', aggfunc='sum')

# Speichern
pivot.to_excel('report.xlsx')

🧹 Datenbereinigung

# Leere Zeilen entfernen
df = df.dropna(how='all')

# Leere Spalten entfernen
df = df.dropna(axis=1, how='all')

# Text bereinigen
df['Name'] = df['Name'].str.strip().str.title()
df['Email'] = df['Email'].str.lower().str.strip()

# Datum formatieren
df['Datum'] = pd.to_datetime(df['Datum'])