stevennoack.de / Lesestück
≈ 8 Min. Lesezeit Mein Angebot →
Ein Lesestück · April 2026

Etwas hat sich verschoben.
Leise. Aber für immer.

Die KI hat ihren Wohnort gewechselt. Bis vor kurzem lebte sie in den Rechenzentren grosser Konzerne, jetzt zieht sie in die Hosentasche jedes Menschen, der ein halbwegs aktuelles Smartphone besitzt. Was das für dein Wissen bedeutet, wenn du Wissen hast, das Menschen brauchen, ist die eigentliche Geschichte.

Steven Noack Aus dem Oderbruch, ohne Eile Geschrieben im April 2026

Stell dir eine Bibliothek vor.

Bisher war es so: Wer eine Bibliothek bauen wollte, baute ein Gebäude. Stellte Regale hinein. Bezahlte Bibliothekare. Wer etwas wissen wollte, musste hingehen — physisch oder digital. Die Bibliothek war ein Ort.

Was jetzt passiert: Du schreibst die Inhalte deiner Bibliothek auf eine kleine Karte. Diese Karte gibst du Menschen. In ihrem Kopf bauen sie sich die Bibliothek selbst auf, ohne dass du je ein Gebäude besitzen musstest.

Ungefähr das passiert gerade mit Wissen und KI. Die "Bibliothek" also die Sprachintelligenz ist neuerdings im Smartphone deines Lesers eingebaut. Du musst sie nicht mehr betreiben. Du gibst nur die Karte mit deinen Inhalten.

DEIN WISSEN die Karte SMARTPHONE eingebaut ● 100% LOKAL DU GIBST NUR DIE KARTE
Der Wechsel01

Drei Jahre lang war KI woanders.

Jeder, der mit KI gearbeitet hat, kennt das gleiche Bild: Du tippst etwas in ein Eingabefeld, dein Gerät schickt es übers Internet zu einem Rechenzentrum meist in Kalifornien, dort wird gerechnet, die Antwort kommt zurück. Schnell, ja. Aber der eigentliche Vorgang fand an einem Ort statt, der nicht deiner war.

Das hatte Folgen, die wir uns abgewöhnt hatten zu hinterfragen: Jede Frage ein Datenpaket nach draussen. Jede Antwort eine kleine Cloud-Rechnung. Jeder Anbieter, der seinen Dienst kostenlos macht, irgendwo ein Geschäftsmodell, das nicht mehr nur aus Abonnements besteht. Und wer es professionell nutzen wollte, Therapeuten, Anwälte, Lehrer, landete in einer Endlosschleife aus Datenschutzklärungen, US-Cloud-Diskussionen und Auftragsverarbeitungsverträgen.

Im Frühjahr 2026 hat sich das geändert. Nicht mit einem Knall, sondern leise. Google hat ein Sprachmodell veröffentlicht, das klein genug ist, um auf einem normalen Smartphone zu laufen und gleichzeitig gut genug, um nützlich zu sein. Was vorher nur in einem Rechenzentrum lief, läuft nun in deiner Hosentasche. Offline. Ohne Konto. Ohne dass irgendjemand mitliest.

Die KI ist vom Mietshaus in dein Zuhause gezogen.

Das klingt nach einer technischen Spielerei, ist aber das Gegenteil. Es ist die Voraussetzung dafür, dass KI in Bereiche kommt, in die sie bisher nicht durfte. Krankenakten. Therapie-Notizen. Anwaltsgespräche. Schulische Förderpläne. Coaching-Tagebücher. Alles, was bisher zu sensibel war, um es einer fremden Wolke anzuvertrauen, kann jetzt vor Ort verarbeitet werden.

Wo der Unterschied liegt02

Zwei Welten, nebeneinander.

Damit klar wird, was sich tatsächlich verschoben hat, hier eine Gegenüberstellung. Was war, was ist:

Bis Frühjahr 2026

KI in der Cloud

Du tippst etwas, dein Gerät schickt es ins Netz, ein Rechenzentrum antwortet. Funktioniert nur online.

  • Internet zwingend nötig
  • Daten verlassen das Gerät
  • Pro Anfrage entstehen Kosten
  • Anbieter sieht alles mit
  • DSGVO-Vertragsketten nötig
  • Kann jederzeit abgeschaltet werden
Seit Frühjahr 2026

KI auf dem Gerät

Du tippst etwas, dein Smartphone rechnet selbst, die Antwort kommt ohne dass je etwas das Gerät verlässt.

  • Funktioniert offline
  • Daten bleiben lokal
  • Keine laufenden Anfrage-Kosten
  • Niemand sieht mit
  • DSGVO automatisch erfüllt
  • Funktioniert auch in 10 Jahren noch
Was das mit dir zu tun hat03

Du hast vermutlich schon, was nötig ist.

Wenn du ein Coach bist, eine Therapeutin, ein Verlag, ein Trainer, dann besitzt du etwas, das in dieser neuen Welt einen ganz neuen Wert bekommt: strukturiertes Wissen. In deinem Kopf, in deinen Büchern, auf deiner Website, in deinen Skripten, in den Antworten, die du auf Klient-Mails schon hundertmal getippt hast.

Bisher war dieses Wissen passiv. Es lag in einem Buch oder auf einer Webseite und wartete darauf, gelesen zu werden. Wer eine Frage hatte, musste suchen, scrollen, blättern. Im Idealfall fand er die Antwort, oft fand er sie nicht.

Mit lokaler KI verändert sich das. Dein Wissen kann ansprechbar werden. Jemand fragt etwas, in seiner Sprache und bekommt eine Antwort, die aus deinem Material destilliert ist, in deinem Stil, mit deinen Grenzen. Auf seinem Smartphone. Ohne dass du eine App entwickeln, ein Rechenzentrum mieten oder Datenschutz-Verträge mit irgendjemandem schliessen müsstest.

Das Werkzeug dafür heisst Skill. Eine kleine Datei, die der KI im Smartphone deines Lesers sagt: "Hier sind die Inhalte. Hier ist der Stil. Hier sind die Grenzen. Antworte aus diesem Wissen."

Verwandt. Was das parallel für das offene Web bedeutet, warum dein Wissen nicht nur auf Smartphones, sondern auch für Browser-Agenten und Recherche-Bots zugänglich werden sollte, habe ich in der Vision ausführlicher beschrieben. Die beiden Stücke gehören zusammen: lokal auf dem Gerät und strukturiert im Web.

Beispiel, die Coachin mit Website

Anna hat fünf Jahre lang Texte geschrieben.

Anna ist Coachin für berufliche Neuausrichtung. Ihre Website hat 80 Blogartikel, ein Methoden-Manifest, drei FAQ-Seiten und eine kleine Sammlung von Fallbeispielen. Klienten lesen vorm Erstgespräch oft nur die Hälfte davon.

Mit einem Skill wird das anders. Anna gibt das gesammelte Material einmal in eine strukturierte Form. Ab dann können ihre Klienten in der Edge-Gallery-App fragen: "Ich überlege, mit 47 nochmal zu studieren, wie würdest du da rangehen?" und bekommen eine Antwort, die nach Anna klingt, weil sie aus Annas Texten destilliert ist. Mit Annas Vorbehalten, Annas Beispielen, Annas typischer Rückfrage. Und einem klaren Hinweis, wann ein echtes Gespräch sinnvoller wäre als weiterzufragen.

Anna selbst tut dafür: nichts. Ihre Website bleibt wie sie ist. Sie hat einmal das Material strukturiert, einmal die Datei verteilt und das war's.

Das Schöne an Annas Fall: Sie musste nichts neu erschaffen. Sie hatte das Wissen längst auf ihrer Website, ausgedrückt in ihrer Sprache, mit ihren Beispielen. Der Skill ist im Grunde nur eine Brücke zwischen dem, was schon da war, und der Stelle, an der ihre Klienten Fragen haben.

Beispiel, der Verlag mit Buch

Ein Sachbuch, 320 Seiten, über Pflanzenheilkunde.

Ein kleiner Fachverlag hat im Herbst ein Buch über mitteleuropäische Heilpflanzen veröffentlicht. Aufwändig recherchiert, schön gemacht und wie die meisten Sachbücher: Käufer lesen die ersten 80 Seiten, der Rest bleibt Nachschlagewerk. Bei Bedarf. Wenn man weiss, wo nachschlagen.

Die Lektorin schlägt vor: Lass uns das Buch parallel als Skill anbieten. Käufer scannen einen QR-Code im Innendeckel, laden den Skill, und können dem Buch fortan Fragen stellen. "Mein Sohn hat seit drei Tagen leichten Husten ohne Fieber, was sagt das Buch dazu?" Der Skill antwortet aus dem Buchinhalt, im Stil der Autorin, mit klarem Verweis auf relevante Kapitel und einer Grenze: keine Diagnosen, beim geringsten Zweifel zur Ärztin.

Für den Verlag ist das nicht nur ein Service, sondern ein Verkaufsargument. Das Buch hört nicht beim letzten Kapitel auf zu wirken, es begleitet den Leser jahrelang.

Das Material war auch hier längst da. Es brauchte nur einen Übersetzer zwischen dem statischen Buch und der Form, in der die KI im Smartphone es sinnvoll nutzen kann.

Für die, die es genau wissen wollen04

Die technische Tiefe.

Bis hierher war alles Bild. Wer bei Bildern bleibt, kann jetzt zur nächsten Sektion springen. Wer aber konkret wissen will, wie das technisch funktioniert, was eine Skill-Datei eigentlich ist und warum das alles gerade jetzt möglich wird, die folgenden Abschnitte sind für dich. Klick auf, was dich interessiert.

Was läuft da eigentlich auf dem Smartphone?

Ein Sprachmodell namens Gemma 4, ein offenes Modell von Google DeepMind, das in zwei Grössen verfügbar ist (E2B und E4B, "Effective 2/4 Billion Parameter"). Die kleinere Variante kommt mit unter 1,5 GB RAM aus und läuft damit auch auf Mittelklasse-Geräten. Ausgeführt wird sie über eine Laufzeitumgebung namens LiteRT-LM, die Google für genau diesen Zweck optimiert hat mit 2-bit/4-bit Quantisierung und speicher-gemappten Embeddings.

Das Drumherum übernimmt die Google AI Edge Gallery: eine kostenlose App für Android (12+) und iOS (17+), die das Modell ausführt, eine Chat-Oberfläche bietet und Skills laden kann. Open Source unter Apache-2.0-Lizenz.

Wie sieht ein Skill konkret aus?

Im einfachsten Fall: eine einzige Markdown-Datei namens SKILL.md mit einem Frontmatter-Block (Metadaten) und einem Anweisungs-Teil. Der Frontmatter sagt der KI, wofür dieser Skill da ist; die Anweisungen werden in den Kontext geladen, wenn der Skill aktiv ist:

---
name: pflanzenheilkunde
description: Beantwortet Fragen aus dem
  Buch "Heilpflanzen Mitteleuropas".
homepage: https://verlag.de/buch
---

# Anweisungen

Du bist der digitale Begleiter zum Buch
"Heilpflanzen Mitteleuropas". Du antwortest
ausschliesslich aus den Inhalten des Buches.
Bei Fragen, die das Buch nicht abdeckt,
sagst du das ehrlich.

## Grenzen
- Keine Diagnosen.
- Bei akuten Beschwerden: Ärztin/Arzt.
- Bei Schwangerschaft: besondere Vorsicht.

Optional kann ein Skill um eine HTML-Datei mit JavaScript erweitert werden, dann sind interaktive Elemente möglich (Rechner, geführte Übungen, visuelle Karten). Diese Datei läuft in einer versteckten Webview innerhalb der App.

Was, wenn ich schon eine API oder JSON-Endpunkte habe?

Das ist ein wichtiger Punkt, viele professionell gepflegte Websites haben heute strukturierte Daten, die direkt nutzbar wären. Ein Coach mit einer ausführlichen Website hat oft eine Sitemap, ein RSS-Feed, manchmal sogar ein JSON-API ihres CMS. Ein Verlag hat einen Buchkatalog mit Metadaten. Eine Therapeutin hat strukturierte FAQ-Seiten.

Der Skill kann diese Daten auf zwei Wegen einbinden:

Eingebacken (statisch): Die Inhalte werden einmal aus deiner Quelle gezogen, strukturiert und in die Skill-Datei eingearbeitet. Vorteil: läuft komplett offline, keine Live-Verbindung nötig. Nachteil: Aktualisierungen erfordern ein neues Skill-File.

Live abgefragt (dynamisch): Der Skill enthält JavaScript-Logik, die zur Laufzeit deine API oder einen JSON-Endpunkt anspricht, z.B. um aktuelle Termine, Preise oder neue Artikel zu holen. Vorteil: immer aktuell. Nachteil: dafür braucht der Nutzer in dem Moment Internet, und du brauchst einen Endpunkt, der Anfragen verträgt.

In der Praxis ist oft eine Mischung sinnvoll: Stammwissen statisch eingebacken, dynamische Daten live nachgeladen. Wer schon eine gut gepflegte Website mit klarer Struktur hat, ist hier deutlich näher dran als jemand, der bei null anfängt.

Was unterscheidet das von ChatGPT-Custom-GPTs?

Drei Dinge, die zentral sind:

Wo gerechnet wird. Ein Custom GPT läuft auf OpenAI-Servern. Jede Anfrage geht durch deren Infrastruktur. Ein Skill in der AI Edge Gallery läuft komplett auf dem Smartphone des Nutzers, niemand sieht die Anfragen.

Wer den Zugang kontrolliert. Ein Custom GPT braucht einen ChatGPT-Account (kostenpflichtig für die meisten Funktionen). Ein Skill braucht nur die kostenlose Edge-Gallery-App. Wer offline ist, kann den Custom GPT nicht nutzen, den Skill schon.

Wer das Modell bereitstellt. Bei OpenAI ist das Modell ein Geschäftsgeheimnis. Bei Gemma 4 sind die Modellgewichte öffentlich (Apache-2.0), das Format ist offen, das App-Backend ebenfalls Open Source. Wenn Google das Projekt morgen einstellt, läuft der Skill weiter, bei OpenAI bist du im Regen.

Wo wird die Skill-Datei gespeichert? Brauche ich einen Server?

Du brauchst keine eigene Server-Infrastruktur. Drei Möglichkeiten:

1. Lokal verteilt: Die Datei wird per AirDrop, Mail, USB-Stick übergeben und lokal in der App importiert. Funktioniert für kleine Gruppen.

2. Über GitHub Pages oder Cloudflare Pages: Beide bieten kostenloses statisches Hosting, auch für kommerzielle Nutzung. Du bekommst eine URL, die deine Nutzer in der App eintippen, fertig. Voraussetzung: korrekte MIME-Types (GitHub Pages braucht eine leere .nojekyll-Datei, sonst werden Markdown-Dateien als HTML interpretiert).

3. Eigene Domain: Wenn du eine eigene Website betreibst, kannst du die Skill-Dateien dort als Unterverzeichnis bereitstellen, z.B. unter deinedomain.de/skill/. Kostet keinen zusätzlichen Cent.

Was ist mit Updates? Müssen Nutzer den Skill neu installieren?

Wenn der Skill von einer URL geladen wurde, prüft die App regelmässig auf Aktualisierungen. Du änderst die Datei am Hosting-Ort, beim nächsten App-Start sehen deine Nutzer die neue Version, ohne etwas zu tun. Bei lokal importierten Skills muss der Nutzer die Datei manuell ersetzen. Daher der URL-Weg für die meisten Anwendungsfälle die bessere Wahl.

Wer haftet für falsche Antworten?

Eine ehrliche Frage ohne einfache Antwort. Rechtlich liegt die Verantwortung bei dem, der den Skill veröffentlicht, also bei dir, wenn du der Anbieter des Wissens bist. Praktisch lässt sich das Risiko stark reduzieren, indem im Skill klare Eskalations-Regeln definiert sind: Wann verweist der Skill auf einen echten Fachmenschen? Wann auf den Notruf? Welche Fragen lehnt er grundsätzlich ab?

Diese Regeln sind kein juristisches Fangnetz, aber sie verschieben das Risikoprofil deutlich. Wer mit Heilberufen, Rechts- oder Finanzthemen arbeitet, sollte vor der Veröffentlichung kurz mit dem zuständigen Berufsverband oder einer Anwältin sprechen.

Begriffe05

Klein, aber nützlich.

Wenn du etwas zum nachschlagen brauchst:

▸ On-Device-KI
KI-Modell, das direkt auf dem Endgerät rechnet, ohne dass Daten ins Internet gehen.
▸ Skill
Eine Datei mit Anweisungen, die einer KI ein neues Wissensgebiet oder eine Persona gibt.
▸ Gemma 4
Offenes Sprachmodell von Google. Klein genug fürs Smartphone, gut genug zum Arbeiten.
▸ Edge Gallery
Kostenlose App von Google, die offene Modelle wie Gemma 4 lokal ausführt. Android & iOS.
▸ SKILL.md
Markdown-Datei, in der ein Skill definiert wird. Persona, Anweisungen, Grenzen.
▸ Inferenz
Der Vorgang, bei dem ein KI-Modell aus Eingabe eine Antwort berechnet.
▸ Endpunkt
Eine URL, hinter der eine Datei oder ein Dienst liegt. Hier: wo dein Skill geladen wird.
▸ Webview
Versteckter Mini-Browser in einer App. Kann JavaScript ausführen für interaktive Skill-Teile.
Zum Schluss

Was sich gerade verschiebt, ist keine Modeerscheinung. Es ist eine strukturelle Veränderung. Die Werkzeuge, mit denen Wissen weitergegeben werden kann, haben sich verbreitert und sie sind erstmals leise genug geworden, um auch in sensible Bereiche zu passen. Was du daraus machst, ist deine Entscheidung. Ich bin nur jemand, der zugesehen hat und es spannend findet, daran mitzubauen.

Übrigens, falls du wissen willst, wie ich helfe →