Empfang Telefon, Chat, Termine, Rückruf
Dokumentation Angebote, Protokolle, Rechnungen
Betrieb Mail, Touren, Projekte, Recruiting
Branchen-Fachwissen SHK, Elektro, Maler
Sichtbarkeit Blog, Google-Profil, Audit
Für Ihre Branche KI-Lösungen für 8 Branchen
Open Source & KI Eigene Plattformen statt SaaS-Inseln
Verkündigung digital Werkzeuge für Gemeinden
Beispiele aus dem Haus KI-Anwendungen, die wir selbst betreiben
Übersicht Alle 56 Produkte auf einer Seite
Alle KI-Lösungen →
Beispiele aus dem Haus
Computer & Laptops PC, Mac, Kaufberatung
Mobilgeräte Smartphone, TV, Fotos
Peripherie & Netzwerk Drucker, WLAN, NAS
Smart Home & IoT Automation, PV, Homeoffice
Alle Hardware-Leistungen →
IT-Infrastruktur VPN, Netzwerk, DSGVO
Business-Software Buchhaltung, Kasse, Zeiterfassung
Web & Marketing Webseite, SEO, WordPress, Newsletter
Entwicklung & Beratung KI-Tools, Automation, Wartung, Beratung
Krypto & Web3 Steuern, Wallets, Mining, DePIN
Monitoring & IoT Sensoren, Dashboards, Alarmierung
Branchen-IT Spezialisierte IT für kleine Betriebe
Service & Recht Termin, Verträge, Karriere
Alle Unternehmens-Leistungen →
spuerwerk© Mess-Module Temperatur, CO₂, Strom, …
spuerwerk© Branchen I Apotheke, Praxis, Hotel, …
spuerwerk© Branchen II Lager, Logistik, Werkstatt, …
linkx© Hub + Module Schlauer QR-Code mit Funktion
linkx© Module II Karte, Wache, Wahl, …
naturwerk© Bürger-Tech gegen Umweltgift
Weitere Submarken bildwache, fermentwerk, kurierwerk, spaehwerk
diffus© Modi I Privat, Erbe, B2B, Versicherung
diffus© Modi II Pflege, Miete, Reise, Sammler, Logistik
Alle Submarken →
KI-Wissen08. Juni 2026 · 20 Min. Lesezeit

KI mit leerem Geldbeutel: Wie Sie heute noch anfangen können – ohne 200 Euro Abo im Monat

Laptop mit deutschem KI-Chat auf dem Bildschirm, Post-it KI kostet nichts

Kein Budget. Kein Team. Kein Unternehmensabo bei OpenAI oder Anthropic. Trotzdem wollen Sie KI nutzen – für Code, Texte, Bilder, Automatisierungen, Kundenanfragen, interne Abläufe. Die gute Nachricht: Das geht. Die großen Anbieter geben reichlich Rechenleistung ohne Berechnung ab. Und wenn Sie wissen, was Sie wie kombinieren, haben Sie Zugriff auf Werkzeuge, die früher nur großen Entwicklerteams zur Verfügung standen – in einem Setup, das keinen Monat hundert Euro kostet.

Dieser Artikel zeigt, wie das geht – konkret, mit echten Links, ehrlichen Einschränkungen und einem klaren Fahrplan für die nächsten 48 Stunden.

Warum die großen Anbieter kostenlos schenken

Google, Meta, Mistral und andere KI-Unternehmen verschenken Rechenkapazität nicht aus Großzügigkeit. Sie betreiben Marktentwicklung. Die Strategie ist einfach: Wenn Entwickler, Startups und Einzelpersonen heute mit einem Modell bauen, werden sie morgen zahlende Kunden – oder empfehlen das Modell weiter. Free Tier ist Akquisition auf Kosten der Infrastruktur.

Was das für Sie bedeutet: Millionen Dollar monatlicher Rechenkosten werden subventioniert, damit Sie überhaupt in Berührung kommen. Das Free Tier eines einzigen Anbieters reicht für viele Alltagsaufgaben. Wer vier oder fünf Anbieter kombiniert, hat ein breites Spektrum – und kommt selbst für produktive Anwendungen ohne Abo aus.

Es gibt einen zweiten Treiber: Open-Source-Modelle. Meta veröffentlicht die Llama-Familie, Google die Gemma-Reihe, Alibaba die Qwen-Familie. Diese Modelle können Sie herunterladen und auf eigener Hardware betreiben – ohne Lizenzkosten, ohne Datenweitergabe, ohne API-Limits. Vor zwei Jahren war das noch undenkbar.

Die kostenlose KI-Werkzeugkiste 2026

Chat, Texte und Recherche

Claude.ai → claude.ai

Täglich kostenlose Nachrichten mit Claude Sonnet – einem der stärksten Modelle für Texte, Strukturierung, Dokumentenanalyse und komplexes Reasoning. Besonders gut für mehrstufige Aufgaben: "Lies dieses Dokument, fasse es zusammen und schreibe drei Varianten für einen LinkedIn-Post."

Limit: tägliches Nachrichtenkontingent. Kein API-Zugriff im Free Tier.

Google Gemini → gemini.google.com

Gemini 2.5 Flash steht im Free Tier mit einem Kontextfenster von einer Million Tokens zur Verfügung. Das bedeutet: Sie können komplette Bücher, große Codebasen oder hunderte Seiten Dokumentation in einem Prompt einreichen und analysieren lassen. Neuere Gemini-Modelle im AI Studio erreichen sogar zwei Millionen Tokens Kontext. Für Dokumenten-Analyse unschlagbar. Über Google AI Studio auch per API abrufbar – kostenlos mit Ratenlimit.

API-Key in AI Studio erstellen: kostenlos, Ratenlimit ca. 15 Anfragen/Minute. Hinweis: Im kostenlosen AI Studio Free Tier nutzt Google Prompts standardmäßig zur Modellverbesserung – für private Experimente unkritisch, für vertrauliche Geschäftsdaten nicht geeignet.

Mistral Le Chat → chat.mistral.ai

Mistral ist ein europäisches Unternehmen mit Sitz in Paris – mit Infrastruktur und Datenschutzstandards, die für viele Unternehmen besonders interessant sind. Le Chat ist kostenlos, die API über console.mistral.ai im Free Tier ebenfalls. Stark für strukturierte Ausgaben, JSON-Erzeugung und deutschsprachige Texte. Mistral Small ist über die API günstig.

Europäischer Anbieter mit Infrastruktur und Datenschutzstandards, die für viele Unternehmen interessant sind. Free Tier mit Ratenlimit.

Perplexity → perplexity.ai

KI-gestützte Suche mit Quellenangaben. Nicht für generative Aufgaben, aber unschlagbar für Recherchen: aktuelle Marktnews, technische Dokumentation, Wettbewerberanalyse. Täglich mehrere freie Pro-Suchen, danach einfaches Basismodell mit Quellenangabe.

Täglich kostenlos – ausreichend für regelmäßige Recherchen.

Code schreiben und entwickeln lassen

Groq → console.groq.com

Groq betreibt eigene Inference-Chips (LPUs – Language Processing Units), die Tokens deutlich schneller ausgeben als GPU-basierte Systeme. Das Ergebnis: Antworten in unter einer Sekunde, auch bei großen Modellen. Im Free Tier stehen Llama 3.3 70B und Kimi K2 zur Verfügung – beide stark für Code. Für Coding-Aufgaben aktuell eine der besten kostenlosen Optionen.

API-Key in Minuten erstellt, Ratenlimit pro Minute/Tag/Monat – für normalen Betrieb ausreichend.

Cline / Roo Code (VS Code Plugin) → VS Code Marketplace

Cline ist ein Open-Source-Coding-Agent direkt in VS Code. Sie beschreiben eine Aufgabe in natürlicher Sprache. Cline liest Dateien, schreibt Code, führt Befehle aus, prüft die Ausgabe und korrigiert Fehler – automatisch, Runde für Runde. Entscheidend: Sie wählen das Modell selbst. OpenRouter Free Tier oder lokales Ollama – keine zusätzlichen Kosten pro Nachricht.

Open Source, kostenlos. Modellkosten hängen vom gewählten Provider ab.

GitHub Copilot Free → github.com/copilot

Für Einzelpersonen: 2.000 Autovervollständigungen und 50 Chat-Nachrichten pro Monat. Direkt in VS Code, JetBrains und anderen Editoren. Für gelegentliches Coding oder als Ergänzung zu Cline ausreichend. Aktivierung über github.com/settings/copilot – in zwei Minuten eingerichtet.

2.000 Completions/Monat gratis, kein Kreditkarte nötig.

Bilder erzeugen

Ideogram → ideogram.ai

Beste kostenlose Qualität für Text-in-Bild. Täglich freie Generierungen, ausgezeichnete Typografie im Bild – kein anderes kostenloses Tool macht das so gut.

Hugging Face Spaces → huggingface.co

FLUX, Stable Diffusion XL und hunderte weitere Modelle direkt im Browser. Viele Spaces lassen sich ohne Account testen. Verfügbarkeit und Limits hängen vom jeweiligen Projekt ab – Warteschlangen und zeitweise Ausfälle sind möglich.

Leonardo.ai → leonardo.ai

Tägliches Gratisguthaben, viele Modelle (FLUX, eigene Leonardo-Modelle), gut für Produktbilder, Konzeptillustrationen und Social-Media-Grafiken.

Adobe Firefly → firefly.adobe.com

Monatlich kostenlose Credits. Adobe positioniert Firefly als besonders auf kommerzielle Nutzung ausgerichtete Bild-KI – trainiert auf lizenzierten Daten.

OpenRouter: eine API, über 300 Modelle

OpenRouter ist der Schlüssel für alle, die KI per API nutzen wollen – ohne sich an einen einzigen Anbieter zu binden. Sie melden sich einmal an, erhalten einen API-Key und sprechen damit Modelle von Anthropic, Google, Meta, Mistral, Cohere, DeepSeek, Qwen und über 50 weiteren Anbietern an.

Das Wichtigste: Die API ist OpenAI-kompatibel. Jedes Tool, jedes Skript und jeder Coding-Agent, der ursprünglich für OpenAI gebaut wurde, funktioniert in vielen Fällen mit minimalen Anpassungen – meist reicht es, Base-URL und Key zu tauschen. Das bedeutet: Ihr Setup funktioniert mit dem Model, das heute am günstigsten ist, und Sie wechseln morgen in einer Zeile.

Dauerhaft kostenlose Modelle (Stand Juni 2026):

  • meta-llama/llama-3.2-3b-instruct:free – schnelles kleines Modell, Alltags- und Coding-Aufgaben
  • google/gemma-3-1b-it:free – Googles kleines instruiertes Modell
  • mistralai/mistral-7b-instruct:free – Klassiker, solide für Texte und Strukturierung
  • qwen/qwen3-8b:free – starkes Reasoning-Modell, gut für strukturierte Ausgaben
  • deepseek/deepseek-r1:free – DeepSeeks Reasoning-Modell, sehr stark für komplexe Aufgaben

Vollständige Liste mit Limits: openrouter.ai/models → Filter "Free"

Der praktische Einstieg in Python:

from openai import OpenAI

client = OpenAI(
  base_url="https://openrouter.ai/api/v1",
  api_key="sk-or-..." # Ihr OpenRouter-Key
)

response = client.chat.completions.create(
  model="deepseek/deepseek-r1:free",
  messages=[{"role": "user", "content": "Erklaere den Unterschied zwischen REST und GraphQL"}]
)
print(response.choices[0].message.content)

Ollama: KI lokal – auf Ihrem Rechner oder Server

Ollama hat das Betreiben lokaler KI-Modelle so einfach gemacht, dass es kaum zu glauben ist. Zwei Befehle in der Shell, und ein vollständiges Sprachmodell läuft auf Ihrem Rechner – ohne Cloud-Verbindung, ohne API-Gebühren. Ihre Prompts bleiben standardmäßig auf Ihrem eigenen System.

# 1. Installation (Linux oder macOS)
curl -fsSL https://ollama.com/install.sh | sh

# 2. Modell herunterladen und starten
ollama run llama3.2:3b

# 3. Alternativ: Googles kompaktes Gemma
ollama run gemma3:1b

# Modelle verwalten
ollama list
ollama rm modellname

Nach dem Start hat Ollama eine OpenAI-kompatible REST-API auf http://localhost:11434/v1. Das bedeutet: Cline, n8n, LangChain, Open Interpreter und jedes andere Tool, das mit OpenAI-APIs umgeht, funktioniert sofort auch mit Ollama – Sie ändern nur die URL.

Welches Modell für welche Aufgabe?

Modell RAM Stärken Schwäche
gemma3:1b ~1,5 GB Experimente, kurze Zusammenfassungen Komplexes Reasoning
llama3.2:3b ~2,5 GB Texte, einfacher Code, FAQ Komplexer Code, lange Kontexte
mistral:7b ~5 GB Code, Strukturierung, Deutsch Sehr lange Dokumente
llama3.3:70b ~45 GB (GPU) Eines der stärksten frei verfügbaren Open-Source-Modelle Braucht dedizierten GPU-Server

Hetzner: der kleine Server, der nicht schläft

Free-Tier-Modelle laufen auf fremden Servern mit Nutzungslimits. Für produktive Automatisierungen brauchen Sie einen eigenen Server, der rund um die Uhr erreichbar ist. Hetzner Cloud ist die erste Adresse für günstige deutsche Infrastruktur: Rechenzentren in Nürnberg, Falkenstein und Helsinki, DSGVO-konform, stündliche Abrechnung.

Typ CPU / RAM Preis/Mon. Ollama-Eignung
CX22 2 vCPU / 4 GB ~3,79 € gemma3:1b, llama3.2:3b auf CPU
CX32 4 vCPU / 8 GB ~6,40 € mistral:7b flüssig
CX52 8 vCPU / 32 GB ~20,39 € Mixtral 8x7B, CodeLlama 34B
GEX44 (GPU) 4 vCPU / 32 GB + RTX 4000 ~35 € Große Open-Source-Modelle (mit Quantisierung / CPU-Offloading)

Der GPU-Server für 35 Euro monatlich ist günstiger als ein Team-Abo bei einem KI-Anbieter. Wer nur experimentiert: Hetzner rechnet stundengenau ab. Server anlegen, testen, wieder löschen – bezahlt werden nur die tatsächlich genutzten Stunden.

n8n: Automatisierungen ohne Programmieren

n8n ist ein Open-Source-Workflow-Automatisierer – ähnlich wie Zapier oder Make, aber selbst hostbar und ohne monatliche Kosten. Installiert auf dem Hetzner-Server, öffnen Sie die Weboberfläche und bauen Automatisierungen durch Zusammenklicken von Knoten.

# n8n per Docker auf dem Hetzner-Server starten
docker run -d --name n8n \
  --restart unless-stopped \
  -p 5678:5678 \
  -v ~/.n8n:/home/node/.n8n \
  n8nio/n8n

# Weboberfläche erreichbar unter:
# http://ihre-server-ip:5678

n8n hat native Knoten für Ollama, OpenRouter, OpenAI, Anthropic und viele andere KI-Dienste. Konkrete Automatisierungen ohne Programmieren:

  • E-Mail empfangen → KI zusammenfassen → Antwort vorformulieren
  • Formular-Eingang → KI kategorisieren → in CRM eintragen
  • Neues Dokument in Ordner → KI analysieren → Zusammenfassung per E-Mail
  • Webhook von Website → Ollama-Anfrage → Antwort zurückgeben
  • Geplanter Job → Marktdaten abrufen → KI zusammenfassen → Slack-Nachricht

Wer lieber Code schreibt: LangChain (Python) und Langflow (visuell, Python-basiert) bieten mehr Kontrolle für komplexere Abläufe – beide Open Source und selbst hostbar.

Software erstellen lassen: der Coding-Agent in der Praxis

Mit dem richtigen Setup können Sie große Teile einer Software durch Beschreibung erzeugen lassen. Cline liest Dateien, schreibt oder ändert Code, führt Befehle aus, prüft die Ausgabe und korrigiert Fehler – weitgehend automatisiert. Sie genehmigen jeden Schritt oder stellen Cline auf Autopilot.

Konkrete Aufgaben, die mit Cline + Groq Free Tier ohne Kosten funktionieren:

  • PHP-Klasse für E-Mail-Versand mit Retry-Logik und Logging
  • Python-Skript zum Auslesen einer CSV-Datei und Erstellen eines HTML-Reports
  • REST-API-Endpunkt in Node.js mit Authentifizierung und Rate Limiting
  • SQL-Abfragen für eine bestehende Datenbankstruktur
  • Bash-Skripte für Cronjobs, automatische Backups, Server-Monitoring
  • WordPress-Plugin-Grundgerüst mit Admin-Seite und Shortcode
  • Selenium-Skript für automatisiertes Web-Testing

Open Interpreter geht noch weiter: Es führt generierten Code direkt auf Ihrem Rechner aus. "Analysiere diese CSV und erstelle eine Grafik" – und es passiert. Open Source, mit lokalem Ollama nutzbar, keine Datenweitergabe.

Was früher ein Team aus Backend-Entwickler, Datenbankadmin und DevOps-Ingenieur gebraucht hätte, lässt sich heute in einem Prompt beschreiben. Die Qualität hängt stark davon ab, wie präzise Sie formulieren und wie viel Kontext Sie mitgeben. Gute Prompts sind keine Magie – es ist eine Fähigkeit, die sich in wenigen Stunden entwickelt.

Das vollständige 10-Euro-KI-Stack

Gesamtkosten: ca. 3,79 €/Monat
1
Hetzner CX22 · 3,79 €/Mon.
Server-Basis: immer erreichbar, feste IPv4, Nürnberg oder Falkenstein, Ubuntu 24.04 LTS, stündliche Abrechnung.
2
Ollama + Gemma 3 1B · 0 €
Lokales Modell für private Aufgaben ohne Limit. 24/7 verfügbar, Prompts bleiben auf dem eigenen System. Ideal für häufige kleine Aufgaben.
3
OpenRouter Free Tier · 0 €
Fallback auf stärkere Modelle: DeepSeek R1 für Reasoning, Llama 3.2 für schnelle Antworten. Ein Key, mehrere kostenlose Modelle.
4
n8n (Self-Hosted) · 0 €
Workflow-Automatisierung per Docker: Webhooks, KI-Knoten, APIs und Datenbanken visuell verbinden. Weboberfläche im Browser.
5
Cline in VS Code · 0 €
Coding-Agent im Editor. Verbunden mit OpenRouter oder Ollama. Schreibt, testet und korrigiert Code auf Beschreibung hin.
6
Hugging Face Spaces · 0 €
FLUX und Stable Diffusion direkt im Browser – kein Account, kein Limit, für Gelegenheits-Bildgenerierung ausreichend.

Ehrliche Grenzen

  • Kleine Modelle sind weniger präzise. Gemma 3 1B ist kein GPT-4. Für einfache Aufgaben reicht es. Für komplexe Architekturen brauchen Sie stärkere Modelle – dann ein paar Cents pro Anfrage.
  • CPU-Inferenz ist langsam. 5–15 Tokens/Sekunde auf CX22. Für Echtzeit-Anwendungen mit vielen Anfragen brauchen Sie GPU oder Cloud-API.
  • Free-Tier-Limits können Pipelines unterbrechen. Wenn Groq das Tageslimit erreicht, muss Ihr System auf ein anderes Modell zurückfallen. Robuste Systeme brauchen Fallback-Logik.
  • Datenschutz bei Cloud-APIs. Free-Tier-APIs verarbeiten Daten auf fremden Servern. Beim Google AI Studio Free Tier werden Prompts standardmäßig zur Modellverbesserung genutzt. Für sensible oder vertrauliche Daten muss das Modell lokal laufen.
  • Produktive Systeme brauchen Planung. Ein Automatisierungsskript ist in Stunden gebaut. Ein zuverlässiges System mit Monitoring und Fehlerbehandlung ist ein echtes Projekt.

48-Stunden-Fahrplan: heute noch anfangen

  1. Stunde 1: OpenRouter-Account erstellen
    Auf openrouter.ai anmelden, API-Key erstellen, im Playground das Modell deepseek/deepseek-r1:free testen. Keine Kreditkarte, kein Abo.
  2. Stunde 2: Ollama installieren
    curl -fsSL https://ollama.com/install.sh | sh und ollama run gemma3:1b. Erstes Gespräch direkt im Terminal führen – z. B. "Schreibe mir eine Zusammenfassung von folgendem Text:"
  3. Stunde 3: Cline in VS Code einrichten
    Plugin aus dem Marketplace installieren, OpenRouter-Key eintragen, Modell wählen. Erste Aufgabe: "Schreibe ein Python-Skript, das meine wichtigsten Dateien in einem Ordner mit Größe auflistet." Ergebnis sofort ausführbar.
  4. Tag 2, Stunde 1: Hetzner-Server anlegen
    CX22 auf hetzner.com/cloud, Ubuntu 24.04, Standort Nürnberg. Nach 30 Sekunden läuft der Server. SSH-Key einrichten, Ollama installieren, testen. Bei Nichtnutzen einfach löschen – stündliche Abrechnung.
  5. Tag 2, Stunde 2: n8n per Docker starten
    Docker auf dem Server installieren, n8n-Container starten. Ersten Workflow bauen: Webhook-Eingang → Ollama-Knoten → Antwort zurückgeben. Erreichbar unter der Server-IP, Port 5678.
  6. Tag 2, Rest: Erste echte Aufgabe automatisieren
    Nehmen Sie eine echte, wiederkehrende Aufgabe aus Ihrem Alltag. Beschreiben Sie sie als Ablauf. Bauen Sie den Workflow in n8n oder lassen Sie Cline ein Skript dafür schreiben.

Es gibt keinen perfekten Moment zum Anfangen. Die Tools sind reif genug, die Kosten niedrig genug, die Dokumentation gut genug. Was fehlt, ist der erste Schritt – und der kostet nichts.

Mehr zu KI-Lösungen für Unternehmen

Was wir für Unternehmen bauen – von einfachen Automatisierungsskripten bis zu vollständigen Agentensetups mit eigenem Server, Modell-Routing und Monitoring – zeigen wir in unserem KI-Lösungen Überblick. Oder lesen Sie unsere weiteren Ratgeber zu KI-Themen.

KI-Lösungen ansehen Alle Ratgeber

Wir richten das für Sie ein

Server, Ollama, n8n, Coding-Agent, Modell-Routing – alles gehört Ihnen. Kein Abo, kein Lock-in. Schreiben Sie kurz, worum es geht:

Beschreiben Sie Ihr Anliegen

Schreiben Sie uns kurz, worum es geht. Wir prüfen die Anfrage und melden uns per E-Mail mit dem nächsten Schritt.

Veröffentlicht am 08. Juni 2026. Alle genannten Dienste, Preise und Modelle entsprechen dem Stand bei Veröffentlichung und können sich ändern. Links zu Drittanbietern sind redaktionelle Empfehlungen ohne Vergütung.

Weiterlesen — verwandte Artikel

KI-Architektur

Mixture of Agents: was passiert, wenn drei KIs gleichzeitig antworten

Drei Sprachmodelle parallel, ein viertes synthetisiert. Was die Methode wirklich besser macht, was sie kostet und wann sich der Aufwand für ein mittelständisches Unternehmen lohnt.

KI-Wissen

MiroFish – wie eine Open-Source-KI tausende Agenten in eine Simulation schickt, um die Zukunft zu lesen

Im März 2026 ging eine chinesische Open-Source-KI viral: tausende simulierte Agenten, die wie eine Mini-Gesellschaft auf Ereignisse reagieren. Was MiroFish kann, wo es Grenzen hat und warum deutsche Mittelständler die Technik kennen sollten.

KI-Wissen

Text-to-CAD: Wie LLMs jetzt anfangen, 3D-Modelle zu bauen – mit Live-Demo

Aus einem einzigen Prompt entsteht ein STEP-File. Optisch sauber, mechanisch noch nicht. Was Open-Source-Projekte wie STEP-LLM und CADAM gerade können – und was das für Werkstätten, Konstrukteure und 3D-Druck-Hobbyisten bedeutet. Mit parametrischer Live-Demo im Browser.

Häufig gestellte Fragen

Welche KI-Tools gibt es wirklich ohne Kosten?

Google Gemini 2.5 Flash (Free Tier mit 1 Million Tokens Kontext), Mistral Le Chat, Groq (extrem schnelle Inferenz mit Llama und Kimi), Hugging Face Spaces, Claude.ai (täglich freie Nachrichten), ChatGPT (GPT-4o-mini) und Perplexity (täglich freie KI-Suche) sind alle ohne Kreditkarte nutzbar. OpenRouter bündelt über 300 Modelle und bietet dauerhaft kostenlose Kontingente für mehrere davon.

Was kann ich mit Ollama lokal machen?

Mit Ollama laufen Open-Source-Modelle wie Llama 3.2, Mistral, Gemma oder Phi lokal auf Ihrem Rechner oder Server – ohne Internetverbindung, ohne Datenweitergabe, ohne laufende Kosten. Llama 3.2 3B passt auf einen Rechner mit 6 GB RAM. Größere Modelle wie Llama 3.3 70B brauchen eine GPU, liefern aber GPT-4-ähnliche Ergebnisse. Ollama hat eine OpenAI-kompatible API – jedes Tool, das OpenAI nutzen kann, funktioniert auch mit Ollama.

Wofür brauche ich einen eigenen Server?

Ein Hetzner CX22 (2 vCPU, 4 GB RAM, ca. 3,79 Euro netto/Monat) läuft rund um die Uhr, hat eine feste IP und ermöglicht öffentlich erreichbare Dienste. Darauf laufen Ollama, n8n für Automatisierungen, eigene APIs, Webhooks und Datenbanken. Kein Heimbüro-Rechner, der schläft. Kein ISP, der eingehende Ports blockiert.

Was ist OpenRouter und wie nutze ich es?

OpenRouter ist eine einheitliche API für über 300 Modelle von Anthropic, Google, Meta, Mistral und vielen anderen. Sie zahlen nur für Nutzung, ohne Grundgebühr. Mehrere Modelle sind dauerhaft kostenlos – darunter Llama 3.2 3B, Gemma 3, Mistral 7B, Qwen 3 8B und DeepSeek R1. Die API ist OpenAI-kompatibel: Sie tauschen nur URL und Key aus.

Kann ich damit wirklich Software schreiben lassen?

Ja. Mit Cline (VS-Code-Plugin, Open Source) als Coding-Agent und OpenRouter oder lokalem Ollama als Modell-Backend können Sie PHP, Python, JavaScript, SQL und Bash-Skripte durch Beschreibung erzeugen lassen. Der Agent liest Dateien, schreibt Code, führt Tests aus und korrigiert Fehler – automatisch, Runde für Runde.

Was ist der Unterschied zwischen Free Tier und lokalem Betrieb?

Free Tier: fremder Server, Nutzungslimit, keine Datenkontrolle. Lokal mit Ollama: volle Kontrolle, DSGVO-konform, kein Limit, keine Datenweitergabe. Der sinnvolle Mittelweg: Ollama für produktive Daueraufgaben mit sensiblen Daten, Free Tier für gelegentliche starke Modelle ohne Limit-Druck.

Welches Modell empfehlen Sie für den Einstieg?

Für schnelle Aufgaben ohne Kosten: Groq mit Llama 3.3 70B oder Kimi K2 – sehr schnell. Für lange Dokumente: Google Gemini 2.5 Flash (1M Token Kontext, Free Tier). Für Coding: DeepSeek R1 über OpenRouter. Lokal: Gemma 3 1B als Einstieg, Llama 3.2 3B wenn mehr RAM vorhanden.

Wie kombiniere ich mehrere KI-Tools zu einem System?

n8n (Open Source, selbst hostbar) verbindet KI-Modelle mit Webhooks, APIs und Datenbanken – visuell, ohne Programmieren. Native Knoten für Ollama und OpenRouter sind vorhanden. Wer mehr Kontrolle will: LangChain in Python oder einfache HTTP-Requests gegen die OpenRouter-API.

Kann Netzhandwerker beim Aufbau helfen?

Ja. Wir richten KI-Setups ein – Server, Ollama, n8n, Coding-Agent, Modell-Routing. Alles gehört Ihnen: Lizenz + Service statt Abo. Für einen konkreten Anwendungsfall oder ein komplettes Setup sprechen Sie uns an: 02562 187 99 13 oder über das Kontaktformular.

Cookie-EinwilligungWir nutzen technisch notwendige Cookies und laden externe Inhalte wie Terminbuchung oder Kartenmaterial nur nach Ihrer Zustimmung. Unsere Reichweitenmessung läuft cookielos auf unserem eigenen Server. Mehr erfahren