Excel-Tool: Automatisierte Datenverarbeitung mit Python

Datenbereinigung, Duplikatsuche & Reports — per Skript, nicht per Hand

Python openpyxl pandas XLSX

📊 Ihre Excel-Dateien. Automatisch verarbeitet. Heute.

📞 02406 803 7603 ✉️ info@computerkumpel.de

⏱️ Warum Excel automatisieren?

Ein durchschnittlicher Büro-Mitarbeiter verbringt 4–6 Stunden pro Woche mit manueller Excel-Datenverarbeitung. Das Tool übernimmt Routine-Aufgaben in Sekunden — fehlerfrei und wiederholbar.

🚀
Sekunden statt Stunden
10.000 Zeilen bereinigen in unter 3 Sekunden. Pivot-Tabellen per Konfiguration statt Copy-Paste.
100% fehlerfrei
Keine Tippfehler, keine vergessenen Zeilen. Validierung und Konsistenz-Prüfung automatisch.
📈
Wiederholbar
Einmal konfiguriert, jederzeit ausführbar. Monatsabschluss auf Knopfdruck.
🔗
Integrierbar
Export als CSV, JSON, Datenbank oder direkt ins ERP-System. API-Anbindung möglich.

⚙️ Kernfunktionen

🧹 Datenbereinigung
Leerzeichen trimmen, Datumsformate normalisieren, Sonderzeichen entfernen, Null-Werte erkennen.
🔍 Duplikatsuche
Exakte & fuzzy Duplikate finden. Konfigurierbare Vergleichsspalten. Merge-Strategie wählbar.
📊 Pivot-Auswertung
Automatische Pivot-Tabellen aus YAML-Konfiguration. Summen, Mittelwerte, Kreuztabellen.
📑 Report-Generator
Formatierte Excel-Reports mit Charts, bedingter Formatierung und Zusammenfassungsblatt.
🔄 Batch-Verarbeitung
Ganzen Ordner mit Excel-Dateien in einem Durchlauf verarbeiten. Konsolidierung in eine Datei.
✉️ E-Mail-Versand
Fertige Reports automatisch per E-Mail versenden. Zeitgesteuert via Task-Scheduler oder Cron.

💻 Technische Umsetzung

import pandas as pd
from openpyxl import Workbook
from openpyxl.styles import Font, PatternFill, Alignment
from openpyxl.chart import BarChart, Reference

class ExcelProcessor:
    """Kern-Klasse für Excel-Automatisierung."""
    
    def __init__(self, config_path: str = 'excel_config.yaml'):
        with open(config_path) as f:
            self.config = yaml.safe_load(f)
    
    def clean_dataframe(self, df: pd.DataFrame) -> pd.DataFrame:
        """Bereinigt einen DataFrame nach konfigurierten Regeln."""
        rules = self.config.get('cleaning_rules', {})
        
        for col, rule in rules.items():
            if col not in df.columns:
                continue
            
            if rule.get('trim_whitespace'):
                df[col] = df[col].astype(str).str.strip()
            
            if rule.get('normalize_date'):
                df[col] = pd.to_datetime(df[col], errors='coerce')
            
            if rule.get('remove_special_chars'):
                df[col] = df[col].str.replace(r'[^\w\s]', '', regex=True)
        
        return df.drop_duplicates()
    
    def find_duplicates(self, df: pd.DataFrame, columns: list = None):
        """Findet Duplikate basierend auf konfigurierbaren Spalten."""
        cols = columns or self.config.get('dup_columns', df.columns.tolist())
        dup_mask = df.duplicated(subset=cols, keep=False)
        return df[dup_mask].sort_values(by=cols)
    
    def generate_report(self, df: pd.DataFrame, output_path: str):
        """Erstellt einen formatierten Excel-Report."""
        wb = Workbook()
        ws = wb.active
        ws.title = "Report"
        
        # Header formatieren
        header_fill = PatternFill(start_color="2563EB", fill_type="solid")
        header_font = Font(color="FFFFFF", bold=True, size=11)
        
        for col_idx, col_name in enumerate(df.columns, 1):
            cell = ws.cell(row=1, column=col_idx, value=col_name)
            cell.fill = header_fill
            cell.font = header_font
        
        # Daten schreiben
        for row_idx, row in df.iterrows():
            for col_idx, value in enumerate(row, 1):
                ws.cell(row=row_idx + 2, column=col_idx, value=value)
        
        # Auto-Fit Spaltenbreite
        for col in ws.columns:
            max_length = max(len(str(cell.value or '')) for cell in col)
            ws.column_dimensions[col[0].column_letter].width = min(max_length + 2, 50)
        
        wb.save(output_path)

⚡ Monatsabschluss in 5 Minuten statt 5 Stunden.

📞 02406 803 7603 ✉️ info@computerkumpel.de

Excel-Automatisierung, die sich in Wochen amortisiert.

Wir analysieren Ihre Excel-Workflows und bauen die passende Automatisierung.

🔍
Workflow-Analyse
Wir identifizieren repetitive Excel-Aufgaben mit dem größten Einsparpotenzial.
🔧
Maßanfertigung
Ihr persönliches Excel-Tool — exakt auf Ihre Daten und Prozesse zugeschnitten.
🎓
Schulung
Ihr Team lernt, das Tool selbst zu erweitern. Unabhängigkeit nach der Übergabe.
📞 02406 803 7603 ✉️ info@computerkumpel.de