🔢 Tesseract Seven Segments – OCR für Digitalanzeigen

Trainierte Tesseract-Daten für 7-Segment-Ziffern mit OpenCV-Vorverarbeitung

TesseractOCROpenCVComputer Vision

📊 Was das Projekt macht

Speziell trainierte Tesseract-OCR-Daten für die LetsGoDigital-Schriftart, optimiert für 7-Segment-Digitalanzeigen (z.B. Stromzähler, Industriegeräte, Waagen). Inklusive OpenCV-Vorverarbeitungs-Pipeline für beste Erkennungsraten.

🔤
LetsGoDigital Font
Trainingsdaten für die digitale 7-Segment-Schriftart – Standard-Tesseract erkennt diese ohne Training nicht.
🖼️
OpenCV Pipeline
3-Schritt-Vorverarbeitung: Black & White → Gaussian Blur → Threshold für optimale OCR-Ergebnisse.
📊
Industrie-tauglich
Geeignet für Stromzähler, Temperaturanzeigen, Waagen, Industriesteuerungen – alle 7-Segment-Displays.

💻 OpenCV-Vorverarbeitungs-Pipeline

Die trainierte Daten-Datei allein reicht nicht – die folgende OpenCV-Pipeline ist für zuverlässige Erkennung essenziell:

3-Schritt-Bildvorverarbeitung (OpenCV)

import cv2
import pytesseract

# 1. Schwarz-Weiß-Konvertierung
img = cv2.imread('display.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 2. Gaussian Blur – Rauschen entfernen
blurred = cv2.GaussianBlur(gray, (5, 5), 0)

# 3. Threshold – klare Trennung Vordergrund/Hintergrund
_, threshold = cv2.threshold(
    blurred, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)

# OCR mit trainierten LetsGoDigital-Daten
custom_config = r'--oem 3 --psm 7 -l letsgodigital'
text = pytesseract.image_to_string(
    threshold, config=custom_config)
print(f"Erkannt: {text}")

Installation der Trainingsdaten

# Trainingsdaten in Tesseract-Verzeichnis kopieren
# Linux:
sudo cp letsgodigital.traineddata /usr/share/tesseract-ocr/4.00/tessdata/
# Windows:
copy letsgodigital.traineddata "C:\Program Files\Tesseract-OCR\tessdata\"

# Verfügbarkeit prüfen:
tesseract --list-langs | grep letsgo

Projekt-Struktur

Tesseract_sevenSegmentsLetsGoDigital-master/
├── Trained data/
│   └── letsgodigital.traineddata     # Die trainierte OCR-Datei
├── Font/
│   └── LetsGoDigital.ttf             # Die Schriftart-Datei
└── README.md                          # Dokumentation

🎯 Anwendungsfälle

Energiemonitoring

Strom-, Gas- und Wasserzähler automatisch ablesen – kein manuelles Abtippen von 7-Segment-Displays mehr.

🏭

Industrie 4.0

Alte Geräte ohne digitale Schnittstelle via Kamera+OCR in moderne Monitoring-Systeme integrieren.