⚙️ Wie der Workflow funktioniert
Der Prozess läuft vollautomatisch ab, sobald eine Datei in einem bestimmten Google Drive Ordner landet:
- Auslöser (Trigger): Der Workflow überwacht einen Google Drive Ordner (Die Ablage). Sobald eine neue Datei erstellt wird, startet der Prozess.
- Filterung: Es wird geprüft, ob die neue Datei wirklich ein Bild ist (MIME-Type enthält image/). Alle anderen Dateien werden ignoriert.
- Download: Das Bild wird von Google Drive in den n8n-Workflow heruntergeladen.
- KI-Analyse (Gemini): Das Bild wird an die Google Gemini API (Modell: gemini-2.0-flash) gesendet.
- Der Auftrag (Prompt): Die KI wird angewiesen, einen prägnanten, rein visuellen Alternativtext (max. 125 Zeichen) auf Deutsch zu erstellen.
- Verarbeitung: Ein Code-Node nimmt die Antwort der KI, erstellt einen Zeitstempel und formatiert den Text in eine übersichtliche Struktur.
- Upload: Eine neue Textdatei (.txt) mit der Analyse wird in einen anderen Google Drive Ordner (Das Ergebnis) hochgeladen.
- Fehlerbehandlung: Sollte an irgendeiner Stelle ein Fehler auftreten (z.B. API nicht erreichbar), wird eine E-Mail mit Details an einen Administrator gesendet.
Schritt-für-Schritt Einrichtungsanleitung
Da der Workflow spezifische Ordner-IDs und Zugangsdaten enthält, musst du ihn nach dem Import anpassen.
1. Workflow Importieren
- Öffne dein n8n Dashboard.
- Erstelle einen neuen Workflow.
- Klicke oben rechts auf das Menü (drei Punkte) → “Import from File” und wähle die .json Datei aus (oder kopiere den JSON-Code und drücke Strg+V im Editor).
2. Credentials (Zugangsdaten) einrichten
Du wirst sehen, dass einige Nodes rot markiert sind oder Warnungen anzeigen. Du musst folgende Credentials in n8n anlegen:
- Google Drive OAuth2 API:
- Benötigt für: Google Drive Trigger, Download Bild, Upload Textdatei.
- Du musst ein Projekt in der Google Cloud Console erstellen, die Drive API aktivieren und OAuth-Credentials (Client ID & Secret) erzeugen.
- Google Gemini API (Http Query Auth):
- Benötigt für: Gemini API Analyse.
- Hole dir einen API Key im Google AI Studio.
- Erstelle in n8n ein „Generic Credential Type“ -> “Header Auth” oder “Query Auth” und nenne den Parameter key und füge deinen API-Schlüssel als Wert ein. (Im Workflow ist „httpQueryAuth“ eingestellt).
- SMTP (E-Mail):
- Benötigt für: Send email (nur relevant für Fehlermeldungen).
- Hier trägst du die SMTP-Daten deines E-Mail-Providers ein.
3. Nodes konfigurieren
Gehe die Nodes nacheinander durch, um die fest codierten IDs durch deine eigenen zu ersetzen:
A. Google Drive Trigger
- Öffne den Node.
- Bei Folder to Watch: Lösche die ID, die dort steht. Wechsle den Modus ggf. auf “List” oder “From List” und wähle deinen gewünschten Eingangs-Ordner aus deinem Google Drive aus.
B. Gemini API Analyse
- Der Workflow nutzt das Modell gemini-2.0-flash. Dies ist ein sehr neues Modell.
- Falls du Fehlermeldungen bekommst, ändere die URL im Node von:
https://generativelanguage.googleapis.com/v1/models/gemini-2.0-flash:generateContent
zu
https://generativelanguage.googleapis.com/v1/models/gemini-1.5-flash:generateContent
C. Upload Textdatei
- Öffne den Node.
- Bei Folder ID: Wähle hier den Ziel-Ordner aus, in dem die Textdateien gespeichert werden sollen (z.B. “Fertige Alt-Texte”). Wichtig: Nimm nicht denselben Ordner wie beim Trigger, sonst könnte (theoretisch) eine Schleife entstehen, wenn du nicht aufpasst (obwohl der Dateityp-Filter das meist verhindert).
D. Send email (Optional)
- Ändere die From Email und To Email Adressen auf deine eigenen.
- Falls du keine Fehler-Mails brauchst, kannst du die Nodes On Error, Set message und Send email einfach löschen.
4. Testen
- Klicke unten auf “Test Workflow” (oder “Execute Workflow”).
- Lade manuell ein Bild (JPG oder PNG) in deinen Google Drive Eingangs-Ordner hoch.
- Beobachte in n8n, wie der Prozess durchläuft.
- Prüfe deinen Ziel-Ordner, ob die Textdatei angekommen ist.
Wichtiger Hinweis zum Prompt
Im Node “Gemini API Analyse” befindet sich im JSON-Body der Prompt (die Anweisung an die KI). Er lautet aktuell:
“Erstelle einen prägnanten und beschreibenden Alternativtext… Der Text sollte eine Zeichenlänge von 125 Zeichen nicht überschreiten.”
Wenn du längere Beschreibungen möchtest oder die Sprache ändern willst, kannst du diesen Text im JSON-Body des HTTP-Request-Nodes einfach anpassen.
