📊 Was das Projekt macht
Speziell trainierte Tesseract-OCR-Daten für die LetsGoDigital-Schriftart, optimiert für 7-Segment-Digitalanzeigen (z.B. Stromzähler, Industriegeräte, Waagen). Inklusive OpenCV-Vorverarbeitungs-Pipeline für beste Erkennungsraten.
LetsGoDigital Font
Trainingsdaten für die digitale 7-Segment-Schriftart – Standard-Tesseract erkennt diese ohne Training nicht.
OpenCV Pipeline
3-Schritt-Vorverarbeitung: Black & White → Gaussian Blur → Threshold für optimale OCR-Ergebnisse.
Industrie-tauglich
Geeignet für Stromzähler, Temperaturanzeigen, Waagen, Industriesteuerungen – alle 7-Segment-Displays.
💻 OpenCV-Vorverarbeitungs-Pipeline
Die trainierte Daten-Datei allein reicht nicht – die folgende OpenCV-Pipeline ist für zuverlässige Erkennung essenziell:
3-Schritt-Bildvorverarbeitung (OpenCV)
import cv2
import pytesseract
# 1. Schwarz-Weiß-Konvertierung
img = cv2.imread('display.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 2. Gaussian Blur – Rauschen entfernen
blurred = cv2.GaussianBlur(gray, (5, 5), 0)
# 3. Threshold – klare Trennung Vordergrund/Hintergrund
_, threshold = cv2.threshold(
blurred, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
# OCR mit trainierten LetsGoDigital-Daten
custom_config = r'--oem 3 --psm 7 -l letsgodigital'
text = pytesseract.image_to_string(
threshold, config=custom_config)
print(f"Erkannt: {text}")
Installation der Trainingsdaten
# Trainingsdaten in Tesseract-Verzeichnis kopieren
# Linux:
sudo cp letsgodigital.traineddata /usr/share/tesseract-ocr/4.00/tessdata/
# Windows:
copy letsgodigital.traineddata "C:\Program Files\Tesseract-OCR\tessdata\"
# Verfügbarkeit prüfen:
tesseract --list-langs | grep letsgo
Projekt-Struktur
Tesseract_sevenSegmentsLetsGoDigital-master/
├── Trained data/
│ └── letsgodigital.traineddata # Die trainierte OCR-Datei
├── Font/
│ └── LetsGoDigital.ttf # Die Schriftart-Datei
└── README.md # Dokumentation
🎯 Anwendungsfälle
Energiemonitoring
Strom-, Gas- und Wasserzähler automatisch ablesen – kein manuelles Abtippen von 7-Segment-Displays mehr.
Industrie 4.0
Alte Geräte ohne digitale Schnittstelle via Kamera+OCR in moderne Monitoring-Systeme integrieren.