🚀 Bereit für Ihre digitale Transformation?
Vereinbaren Sie ein unverbindliches Strategiegespräch
📊 Business Value
Dieses Tool demonstriert fortgeschrittene Desktop-Automation: Computer Vision (OpenCV) erkennt UI-Elemente, Tesseract OCR liest Text aus Screenshots, und PyAutoGUI simuliert menschliche Mausbewegungen. Eine Blaupause für RPA-Projekte jeder Art.
⚙️ Automation Pipeline
Screenshot
mss (MSS) erstellt schnelle Bildschirmfotos in Graustufen für Template-Matching.
Template Match
OpenCV sucht Buttons mit 5 Skalierungsstufen und adaptivem Threshold.
Human Click
Mehrstufige Mausbewegung mit zufälligen Offsets und variabler Klick-Dauer.
Log & Repeat
Statistiken loggen, Tageslimit prüfen, nächsten User verarbeiten.
💻 Echter Code aus dem Projekt
Code aus D:\arbeit\git\instagramautoliker\instagram_auto_liker_improved.py.
~400 Zeilen professionelle Desktop-Automation mit vollständigem Error-Handling.
🏗️ Klassenstruktur mit Config (instagram_auto_liker_improved.py)
class InstagramAutoLiker:
def __init__(self, config_file: str = "config.json"):
self.config = self.load_config(config_file)
self.setup_logging()
self.liked_users: Set[str] = set()
self.stats = {
"users_processed": 0,
"posts_liked": 0,
"errors": 0,
"start_time": datetime.now()
}
# Fail-Safe aktivieren
pyautogui.FAILSAFE = True
pyautogui.PAUSE = self.config.get("base_delay", 0.1)
🔍 Multi-Scale OpenCV Template-Matching
def find_template_with_scale(self, template_path, threshold=None):
template = cv2.imread(template_full_path, cv2.IMREAD_GRAYSCALE)
img = self.screenshot_gray()
# 5 verschiedene Skalierungen testen
scales = [1.0, 0.9, 1.1, 0.8, 1.2]
for scale in scales:
w = int(template.shape[1] * scale)
h = int(template.shape[0] * scale)
scaled = cv2.resize(template, (w, h))
res = cv2.matchTemplate(img, scaled,
cv2.TM_CCOEFF_NORMED)
loc = np.where(res >= threshold)
if len(loc[0]) > 0:
pt = list(zip(*loc[::-1]))[0]
x, y = pt[0] + w//2, pt[1] + h//2
return (x, y)
return None
🧑 Menschliche Mausbewegung (Human Simulation)
def human_click(self, x: int, y: int):
if self.config["human_simulation"]:
# Zufällige Abweichung ±3 Pixel
x += random.randint(-3, 3)
y += random.randint(-3, 3)
# Bewegung in 2-4 Schritten
steps = random.randint(2, 4)
for i in range(steps):
ix = current_x + (x - current_x)*(i+1)/steps
iy = current_y + (y - current_y)*(i+1)/steps
pyautogui.moveTo(ix, iy, duration=random.uniform(0.1,0.3))
pyautogui.moveTo(x, y, duration=random.uniform(0.4,0.9))
pyautogui.mouseDown()
time.sleep(random.uniform(0.05, 0.15)) # Variable Klick-Dauer
pyautogui.mouseUp()
🤖 Haupt-Loop mit Limit-Check & Statistiken
def run_auto_liker(self):
for i in range(self.config["max_users"]):
if self.is_daily_limit_reached():
self.logger.warning("Tageslimit erreicht!")
break
# User-Profil suchen → klicken
if not self.find_and_click("profile.png"):
self.smart_scroll()
continue
self.stats["users_processed"] += 1
self.smart_pause(2, 4)
# Post finden → Like-Button klicken
if self.find_and_click("like.png"):
self.stats["posts_liked"] += 1
# Intelligente Pause + Scrollen
self.smart_scroll()
if (i+1) % 5 == 0:
self.log_statistics()
💻 Tech-Stack
🚀 RPA mit Computer Vision — jede Desktop-App automatisierbar
🎯 Strategische Erkenntnisse
RPA ohne API-Zugang
Viele Legacy-Systeme haben keine API. Computer Vision + GUI-Automation sind die einzige Integrationsmöglichkeit — und funktionieren überall.
Wo keine API ist, ist Computer Vision. Immer.
Human Simulation als Anti-Detection
Mehrstufige Mausbewegungen + zufällige Offsets machen Bot-Verhalten ununterscheidbar von menschlichem. Der Code-Aufwand lohnt sich 10x.
Nicht schneller sein — unauffälliger sein.
Template-basierte Automation
Statt auf feste Koordinaten zu klicken (zerbricht bei jeder Auflösungsänderung), sucht OpenCV visuelle Patterns. Robust gegenüber UI-Änderungen.
Niemals auf absolute Pixel-Positionen klicken.
RPA ist das Trojanische Pferd der KI
RPA öffnet Türen in Unternehmen. Sobald Prozesse automatisiert sind, folgen KI-Modelle für Entscheidungsfindung — der natürliche nächste Schritt.
RPA heute = KI-Projekte morgen.
Ihre Desktop-Prozesse automatisieren?
Als Brückenbauer zwischen Business und Technik unterstütze ich Sie bei RPA und Computer Vision — pragmatisch, ergebnisorientiert, ohne Berater-Bullshit.