KI mit leerem Geldbeutel: Wie Sie heute noch anfangen können – ohne 200 Euro Abo im Monat
Kein Budget. Kein Team. Kein Unternehmensabo bei OpenAI oder Anthropic. Trotzdem wollen Sie KI nutzen – für Code, Texte, Bilder, Automatisierungen, Kundenanfragen, interne Abläufe. Die gute Nachricht: Das geht. Die großen Anbieter geben reichlich Rechenleistung ohne Berechnung ab. Und wenn Sie wissen, was Sie wie kombinieren, haben Sie Zugriff auf Werkzeuge, die früher nur großen Entwicklerteams zur Verfügung standen – in einem Setup, das keinen Monat hundert Euro kostet.
Dieser Artikel zeigt, wie das geht – konkret, mit echten Links, ehrlichen Einschränkungen und einem klaren Fahrplan für die nächsten 48 Stunden.
Warum die großen Anbieter kostenlos schenken
Google, Meta, Mistral und andere KI-Unternehmen verschenken Rechenkapazität nicht aus Großzügigkeit. Sie betreiben Marktentwicklung. Die Strategie ist einfach: Wenn Entwickler, Startups und Einzelpersonen heute mit einem Modell bauen, werden sie morgen zahlende Kunden – oder empfehlen das Modell weiter. Free Tier ist Akquisition auf Kosten der Infrastruktur.
Was das für Sie bedeutet: Millionen Dollar monatlicher Rechenkosten werden subventioniert, damit Sie überhaupt in Berührung kommen. Das Free Tier eines einzigen Anbieters reicht für viele Alltagsaufgaben. Wer vier oder fünf Anbieter kombiniert, hat ein breites Spektrum – und kommt selbst für produktive Anwendungen ohne Abo aus.
Es gibt einen zweiten Treiber: Open-Source-Modelle. Meta veröffentlicht die Llama-Familie, Google die Gemma-Reihe, Alibaba die Qwen-Familie. Diese Modelle können Sie herunterladen und auf eigener Hardware betreiben – ohne Lizenzkosten, ohne Datenweitergabe, ohne API-Limits. Vor zwei Jahren war das noch undenkbar.
Die kostenlose KI-Werkzeugkiste 2026
Chat, Texte und Recherche
Täglich kostenlose Nachrichten mit Claude Sonnet – einem der stärksten Modelle für Texte, Strukturierung, Dokumentenanalyse und komplexes Reasoning. Besonders gut für mehrstufige Aufgaben: "Lies dieses Dokument, fasse es zusammen und schreibe drei Varianten für einen LinkedIn-Post."
Limit: tägliches Nachrichtenkontingent. Kein API-Zugriff im Free Tier.
Gemini 2.5 Flash steht im Free Tier mit einem Kontextfenster von einer Million Tokens zur Verfügung. Das bedeutet: Sie können komplette Bücher, große Codebasen oder hunderte Seiten Dokumentation in einem Prompt einreichen und analysieren lassen. Neuere Gemini-Modelle im AI Studio erreichen sogar zwei Millionen Tokens Kontext. Für Dokumenten-Analyse unschlagbar. Über Google AI Studio auch per API abrufbar – kostenlos mit Ratenlimit.
API-Key in AI Studio erstellen: kostenlos, Ratenlimit ca. 15 Anfragen/Minute. Hinweis: Im kostenlosen AI Studio Free Tier nutzt Google Prompts standardmäßig zur Modellverbesserung – für private Experimente unkritisch, für vertrauliche Geschäftsdaten nicht geeignet.
Mistral ist ein europäisches Unternehmen mit Sitz in Paris – mit Infrastruktur und Datenschutzstandards, die für viele Unternehmen besonders interessant sind. Le Chat ist kostenlos, die API über console.mistral.ai im Free Tier ebenfalls. Stark für strukturierte Ausgaben, JSON-Erzeugung und deutschsprachige Texte. Mistral Small ist über die API günstig.
Europäischer Anbieter mit Infrastruktur und Datenschutzstandards, die für viele Unternehmen interessant sind. Free Tier mit Ratenlimit.
KI-gestützte Suche mit Quellenangaben. Nicht für generative Aufgaben, aber unschlagbar für Recherchen: aktuelle Marktnews, technische Dokumentation, Wettbewerberanalyse. Täglich mehrere freie Pro-Suchen, danach einfaches Basismodell mit Quellenangabe.
Täglich kostenlos – ausreichend für regelmäßige Recherchen.
Code schreiben und entwickeln lassen
Groq betreibt eigene Inference-Chips (LPUs – Language Processing Units), die Tokens deutlich schneller ausgeben als GPU-basierte Systeme. Das Ergebnis: Antworten in unter einer Sekunde, auch bei großen Modellen. Im Free Tier stehen Llama 3.3 70B und Kimi K2 zur Verfügung – beide stark für Code. Für Coding-Aufgaben aktuell eine der besten kostenlosen Optionen.
API-Key in Minuten erstellt, Ratenlimit pro Minute/Tag/Monat – für normalen Betrieb ausreichend.
Cline ist ein Open-Source-Coding-Agent direkt in VS Code. Sie beschreiben eine Aufgabe in natürlicher Sprache. Cline liest Dateien, schreibt Code, führt Befehle aus, prüft die Ausgabe und korrigiert Fehler – automatisch, Runde für Runde. Entscheidend: Sie wählen das Modell selbst. OpenRouter Free Tier oder lokales Ollama – keine zusätzlichen Kosten pro Nachricht.
Open Source, kostenlos. Modellkosten hängen vom gewählten Provider ab.
Für Einzelpersonen: 2.000 Autovervollständigungen und 50 Chat-Nachrichten pro Monat. Direkt in VS Code, JetBrains und anderen Editoren. Für gelegentliches Coding oder als Ergänzung zu Cline ausreichend. Aktivierung über github.com/settings/copilot – in zwei Minuten eingerichtet.
2.000 Completions/Monat gratis, kein Kreditkarte nötig.
Bilder erzeugen
Beste kostenlose Qualität für Text-in-Bild. Täglich freie Generierungen, ausgezeichnete Typografie im Bild – kein anderes kostenloses Tool macht das so gut.
FLUX, Stable Diffusion XL und hunderte weitere Modelle direkt im Browser. Viele Spaces lassen sich ohne Account testen. Verfügbarkeit und Limits hängen vom jeweiligen Projekt ab – Warteschlangen und zeitweise Ausfälle sind möglich.
Tägliches Gratisguthaben, viele Modelle (FLUX, eigene Leonardo-Modelle), gut für Produktbilder, Konzeptillustrationen und Social-Media-Grafiken.
Monatlich kostenlose Credits. Adobe positioniert Firefly als besonders auf kommerzielle Nutzung ausgerichtete Bild-KI – trainiert auf lizenzierten Daten.
OpenRouter: eine API, über 300 Modelle
OpenRouter ist der Schlüssel für alle, die KI per API nutzen wollen – ohne sich an einen einzigen Anbieter zu binden. Sie melden sich einmal an, erhalten einen API-Key und sprechen damit Modelle von Anthropic, Google, Meta, Mistral, Cohere, DeepSeek, Qwen und über 50 weiteren Anbietern an.
Das Wichtigste: Die API ist OpenAI-kompatibel. Jedes Tool, jedes Skript und jeder Coding-Agent, der ursprünglich für OpenAI gebaut wurde, funktioniert in vielen Fällen mit minimalen Anpassungen – meist reicht es, Base-URL und Key zu tauschen. Das bedeutet: Ihr Setup funktioniert mit dem Model, das heute am günstigsten ist, und Sie wechseln morgen in einer Zeile.
Dauerhaft kostenlose Modelle (Stand Juni 2026):
meta-llama/llama-3.2-3b-instruct:free– schnelles kleines Modell, Alltags- und Coding-Aufgabengoogle/gemma-3-1b-it:free– Googles kleines instruiertes Modellmistralai/mistral-7b-instruct:free– Klassiker, solide für Texte und Strukturierungqwen/qwen3-8b:free– starkes Reasoning-Modell, gut für strukturierte Ausgabendeepseek/deepseek-r1:free– DeepSeeks Reasoning-Modell, sehr stark für komplexe Aufgaben
Vollständige Liste mit Limits: openrouter.ai/models → Filter "Free"
Der praktische Einstieg in Python:
from openai import OpenAI
client = OpenAI(
base_url="https://openrouter.ai/api/v1",
api_key="sk-or-..." # Ihr OpenRouter-Key
)
response = client.chat.completions.create(
model="deepseek/deepseek-r1:free",
messages=[{"role": "user", "content": "Erklaere den Unterschied zwischen REST und GraphQL"}]
)
print(response.choices[0].message.content)
Ollama: KI lokal – auf Ihrem Rechner oder Server
Ollama hat das Betreiben lokaler KI-Modelle so einfach gemacht, dass es kaum zu glauben ist. Zwei Befehle in der Shell, und ein vollständiges Sprachmodell läuft auf Ihrem Rechner – ohne Cloud-Verbindung, ohne API-Gebühren. Ihre Prompts bleiben standardmäßig auf Ihrem eigenen System.
# 1. Installation (Linux oder macOS)
curl -fsSL https://ollama.com/install.sh | sh
# 2. Modell herunterladen und starten
ollama run llama3.2:3b
# 3. Alternativ: Googles kompaktes Gemma
ollama run gemma3:1b
# Modelle verwalten
ollama list
ollama rm modellname
Nach dem Start hat Ollama eine OpenAI-kompatible REST-API auf http://localhost:11434/v1. Das bedeutet: Cline, n8n, LangChain, Open Interpreter und jedes andere Tool, das mit OpenAI-APIs umgeht, funktioniert sofort auch mit Ollama – Sie ändern nur die URL.
Welches Modell für welche Aufgabe?
| Modell | RAM | Stärken | Schwäche |
|---|---|---|---|
gemma3:1b |
~1,5 GB | Experimente, kurze Zusammenfassungen | Komplexes Reasoning |
llama3.2:3b |
~2,5 GB | Texte, einfacher Code, FAQ | Komplexer Code, lange Kontexte |
mistral:7b |
~5 GB | Code, Strukturierung, Deutsch | Sehr lange Dokumente |
llama3.3:70b |
~45 GB (GPU) | Eines der stärksten frei verfügbaren Open-Source-Modelle | Braucht dedizierten GPU-Server |
Hetzner: der kleine Server, der nicht schläft
Free-Tier-Modelle laufen auf fremden Servern mit Nutzungslimits. Für produktive Automatisierungen brauchen Sie einen eigenen Server, der rund um die Uhr erreichbar ist. Hetzner Cloud ist die erste Adresse für günstige deutsche Infrastruktur: Rechenzentren in Nürnberg, Falkenstein und Helsinki, DSGVO-konform, stündliche Abrechnung.
| Typ | CPU / RAM | Preis/Mon. | Ollama-Eignung |
|---|---|---|---|
| CX22 | 2 vCPU / 4 GB | ~3,79 € | gemma3:1b, llama3.2:3b auf CPU |
| CX32 | 4 vCPU / 8 GB | ~6,40 € | mistral:7b flüssig |
| CX52 | 8 vCPU / 32 GB | ~20,39 € | Mixtral 8x7B, CodeLlama 34B |
| GEX44 (GPU) | 4 vCPU / 32 GB + RTX 4000 | ~35 € | Große Open-Source-Modelle (mit Quantisierung / CPU-Offloading) |
Der GPU-Server für 35 Euro monatlich ist günstiger als ein Team-Abo bei einem KI-Anbieter. Wer nur experimentiert: Hetzner rechnet stundengenau ab. Server anlegen, testen, wieder löschen – bezahlt werden nur die tatsächlich genutzten Stunden.
n8n: Automatisierungen ohne Programmieren
n8n ist ein Open-Source-Workflow-Automatisierer – ähnlich wie Zapier oder Make, aber selbst hostbar und ohne monatliche Kosten. Installiert auf dem Hetzner-Server, öffnen Sie die Weboberfläche und bauen Automatisierungen durch Zusammenklicken von Knoten.
# n8n per Docker auf dem Hetzner-Server starten
docker run -d --name n8n \
--restart unless-stopped \
-p 5678:5678 \
-v ~/.n8n:/home/node/.n8n \
n8nio/n8n
# Weboberfläche erreichbar unter:
# http://ihre-server-ip:5678
n8n hat native Knoten für Ollama, OpenRouter, OpenAI, Anthropic und viele andere KI-Dienste. Konkrete Automatisierungen ohne Programmieren:
- E-Mail empfangen → KI zusammenfassen → Antwort vorformulieren
- Formular-Eingang → KI kategorisieren → in CRM eintragen
- Neues Dokument in Ordner → KI analysieren → Zusammenfassung per E-Mail
- Webhook von Website → Ollama-Anfrage → Antwort zurückgeben
- Geplanter Job → Marktdaten abrufen → KI zusammenfassen → Slack-Nachricht
Wer lieber Code schreibt: LangChain (Python) und Langflow (visuell, Python-basiert) bieten mehr Kontrolle für komplexere Abläufe – beide Open Source und selbst hostbar.
Software erstellen lassen: der Coding-Agent in der Praxis
Mit dem richtigen Setup können Sie große Teile einer Software durch Beschreibung erzeugen lassen. Cline liest Dateien, schreibt oder ändert Code, führt Befehle aus, prüft die Ausgabe und korrigiert Fehler – weitgehend automatisiert. Sie genehmigen jeden Schritt oder stellen Cline auf Autopilot.
Konkrete Aufgaben, die mit Cline + Groq Free Tier ohne Kosten funktionieren:
- PHP-Klasse für E-Mail-Versand mit Retry-Logik und Logging
- Python-Skript zum Auslesen einer CSV-Datei und Erstellen eines HTML-Reports
- REST-API-Endpunkt in Node.js mit Authentifizierung und Rate Limiting
- SQL-Abfragen für eine bestehende Datenbankstruktur
- Bash-Skripte für Cronjobs, automatische Backups, Server-Monitoring
- WordPress-Plugin-Grundgerüst mit Admin-Seite und Shortcode
- Selenium-Skript für automatisiertes Web-Testing
Open Interpreter geht noch weiter: Es führt generierten Code direkt auf Ihrem Rechner aus. "Analysiere diese CSV und erstelle eine Grafik" – und es passiert. Open Source, mit lokalem Ollama nutzbar, keine Datenweitergabe.
Was früher ein Team aus Backend-Entwickler, Datenbankadmin und DevOps-Ingenieur gebraucht hätte, lässt sich heute in einem Prompt beschreiben. Die Qualität hängt stark davon ab, wie präzise Sie formulieren und wie viel Kontext Sie mitgeben. Gute Prompts sind keine Magie – es ist eine Fähigkeit, die sich in wenigen Stunden entwickelt.
Das vollständige 10-Euro-KI-Stack
Ehrliche Grenzen
- Kleine Modelle sind weniger präzise. Gemma 3 1B ist kein GPT-4. Für einfache Aufgaben reicht es. Für komplexe Architekturen brauchen Sie stärkere Modelle – dann ein paar Cents pro Anfrage.
- CPU-Inferenz ist langsam. 5–15 Tokens/Sekunde auf CX22. Für Echtzeit-Anwendungen mit vielen Anfragen brauchen Sie GPU oder Cloud-API.
- Free-Tier-Limits können Pipelines unterbrechen. Wenn Groq das Tageslimit erreicht, muss Ihr System auf ein anderes Modell zurückfallen. Robuste Systeme brauchen Fallback-Logik.
- Datenschutz bei Cloud-APIs. Free-Tier-APIs verarbeiten Daten auf fremden Servern. Beim Google AI Studio Free Tier werden Prompts standardmäßig zur Modellverbesserung genutzt. Für sensible oder vertrauliche Daten muss das Modell lokal laufen.
- Produktive Systeme brauchen Planung. Ein Automatisierungsskript ist in Stunden gebaut. Ein zuverlässiges System mit Monitoring und Fehlerbehandlung ist ein echtes Projekt.
48-Stunden-Fahrplan: heute noch anfangen
- Stunde 1: OpenRouter-Account erstellen
Auf openrouter.ai anmelden, API-Key erstellen, im Playground das Modelldeepseek/deepseek-r1:freetesten. Keine Kreditkarte, kein Abo. - Stunde 2: Ollama installieren
curl -fsSL https://ollama.com/install.sh | shundollama run gemma3:1b. Erstes Gespräch direkt im Terminal führen – z. B. "Schreibe mir eine Zusammenfassung von folgendem Text:" - Stunde 3: Cline in VS Code einrichten
Plugin aus dem Marketplace installieren, OpenRouter-Key eintragen, Modell wählen. Erste Aufgabe: "Schreibe ein Python-Skript, das meine wichtigsten Dateien in einem Ordner mit Größe auflistet." Ergebnis sofort ausführbar. - Tag 2, Stunde 1: Hetzner-Server anlegen
CX22 auf hetzner.com/cloud, Ubuntu 24.04, Standort Nürnberg. Nach 30 Sekunden läuft der Server. SSH-Key einrichten, Ollama installieren, testen. Bei Nichtnutzen einfach löschen – stündliche Abrechnung. - Tag 2, Stunde 2: n8n per Docker starten
Docker auf dem Server installieren, n8n-Container starten. Ersten Workflow bauen: Webhook-Eingang → Ollama-Knoten → Antwort zurückgeben. Erreichbar unter der Server-IP, Port 5678. - Tag 2, Rest: Erste echte Aufgabe automatisieren
Nehmen Sie eine echte, wiederkehrende Aufgabe aus Ihrem Alltag. Beschreiben Sie sie als Ablauf. Bauen Sie den Workflow in n8n oder lassen Sie Cline ein Skript dafür schreiben.
Es gibt keinen perfekten Moment zum Anfangen. Die Tools sind reif genug, die Kosten niedrig genug, die Dokumentation gut genug. Was fehlt, ist der erste Schritt – und der kostet nichts.
Mehr zu KI-Lösungen für Unternehmen
Was wir für Unternehmen bauen – von einfachen Automatisierungsskripten bis zu vollständigen Agentensetups mit eigenem Server, Modell-Routing und Monitoring – zeigen wir in unserem KI-Lösungen Überblick. Oder lesen Sie unsere weiteren Ratgeber zu KI-Themen.
Wir richten das für Sie ein
Server, Ollama, n8n, Coding-Agent, Modell-Routing – alles gehört Ihnen. Kein Abo, kein Lock-in. Schreiben Sie kurz, worum es geht:
Beschreiben Sie Ihr Anliegen
Schreiben Sie uns kurz, worum es geht. Wir prüfen die Anfrage und melden uns per E-Mail mit dem nächsten Schritt.
Veröffentlicht am 08. Juni 2026. Alle genannten Dienste, Preise und Modelle entsprechen dem Stand bei Veröffentlichung und können sich ändern. Links zu Drittanbietern sind redaktionelle Empfehlungen ohne Vergütung.