Zurück zum Blogannouncement

Wie wir einen KI-News-Aggregator mit selbstgehostetem BitNet gebaut haben

y0.exchange Team·28. Februar 2026

Das Problem: zu viel Rauschen, zu wenig Signal

Wer AI und Krypto verfolgt, kennt das Problem. Dutzende Quellen, Hunderte Artikel pro Tag, und die meisten davon sind entweder Duplikate, Füllmaterial oder irrelevant. Wir wollten einen Feed, der nur das zeigt, was wirklich wichtig ist — ohne manuelle Kuratierung.

Deshalb haben wir news.y0.exchange gebaut: eine KI-gestützte News-Intelligence-Plattform, die 40+ vertrauenswürdige Quellen aggregiert und jeden Artikel durch eine zweistufige KI-Pipeline laufen lässt.

Die Architektur: zwei KI-Modelle, zwei Aufgaben

Die Kernidee ist einfach — ein schnelles, günstiges Modell zum Filtern und ein leistungsstarkes Modell zur Anreicherung.

Stufe 1: BitNet b1.58 (selbstgehostet)

Wir betreiben BitNet b1.58 2B auf unserem eigenen Server. Das ist ein 1-Bit-quantisiertes Sprachmodell von Microsoft Research — extrem leichtgewichtig mit einer Inferenzzeit von ca. 30 Millisekunden pro Artikel auf einer einfachen CPU.

BitNet übernimmt den ersten Durchlauf:

  • Relevanzfilterung — geht es wirklich um AI oder Krypto?
  • Sentiment-Erkennung — bullisch, bärisch oder neutral
  • Wichtigkeitsbewertung — 0 bis 10
  • Kategorieklassifizierung — AI, Krypto, DeFi oder AI-Krypto-Crossover

Der Vorteil des Self-Hostings: keine API-Kosten, keine Rate-Limits. Das gesamte Tagesvolumen wird kostenlos verarbeitet.

Stufe 2: Claude Sonnet (API)

Artikel mit Wichtigkeit >= 4 werden an Claude Sonnet weitergeleitet, das KI-Zusammenfassungen, Kernpunkte, zusätzliche Tags und ein Actionability-Flag generiert.

Dieser zweistufige Ansatz hält die API-Kosten minimal — BitNet filtert ~60% der Artikel heraus.

Intelligente Deduplizierung: drei Ebenen

  1. URL-Hash — SHA256 fängt exakte Duplikate ab
  2. Titel-Trigramm-Ähnlichkeit — erkennt Umschreibungen innerhalb von 48 Stunden
  3. BitNet semantische Prüfung — erkennt Artikel, die dieselbe Geschichte anders erzählen

Warum selbstgehostetes BitNet die Schlüsselentscheidung war

  • Kosten: 0 € — läuft auf demselben VPS
  • Latenz: ~30ms — schneller als jeder API-Roundtrip
  • Datenschutz — Artikelinhalte verlassen nie unsere Infrastruktur
  • Keine GPU nötig — BitNets 1-Bit-Quantisierung läuft effizient auf der CPU

Der Tech-Stack

  • Backend: NestJS + TypeScript, MongoDB, Redis, Bull-Queues
  • Frontend: Next.js 14, Tailwind CSS, SWR
  • KI: Selbstgehostetes BitNet b1.58 2B + Claude Sonnet API
  • Analytik: Selbstgehostetes Umami
  • Infrastruktur: Docker auf Hetzner

Schau es dir an: news.y0.exchange.