AI Engineering From Scratch Deep Dive: Der...

Dieses Repo ist kein Framework und kein Wochenend-Tutorial. Es ist ein strukturiertes Lernsystem: Lektionsordner, ausführbarer Code, Dokumentationen, Quizze, generierte Website-Daten, Agent-Skills, Prompts, Skripte und Beitragsregeln für Leute, die den Stack unterhalb des API-Aufrufs verstehen wollen.

Get the latest on AI, LLMs & developer tools

New MCP servers, model updates, and guides like this one — delivered weekly.

Redaktioneller Hinweis

Dieser Artikel verwendet das GitHub-Repo, README, die Roadmap, Anforderungen, Skripte, Site-Build-Dateien, Issues, PRs, die Website, Reddit, X-Suche und Artikel von Drittanbietern, die am 2. Juni 2026 gesammelt wurden. Das README und die Website zeigen möglicherweise unterschiedliche Lektionsanzahlen, daher konzentriert sich der Artikel auf die Struktur statt auf volatile Zahlen.

1. ai-engineering-from-scratch in einem Satz

AI Engineering From Scratch ist ein Open-Source-KI-Curriculum-Repo, in dem jede Lektion darauf abzielt, das Konzept zu vermitteln, es von Grund auf zu implementieren, es mit Produktionsbibliotheken zu vergleichen und ein wiederverwendbares Artefakt wie einen Prompt, Skill, Agenten oder MCP-Server bereitzustellen.

Bereich	Detail	Warum es wichtig ist
Repository	rohitg00/ai-engineering-from-scratch	https://github.com/rohitg00/ai-engineering-from-scratch
Primäre Sprache	Python	Primäre GitHub-Sprache zum Recherchezeitpunkt.
Lizenz	MIT	Gebündelte oder binäre Lizenzen gegebenenfalls separat prüfen.
Erstellt	18. März 2026	Während der Recherche wurden keine GitHub-Releases gefunden; der Main-Branch und die Website werden aktiv aktualisiert.

2. Warum es wichtig ist

Das Repo ist wichtig, weil viele KI-Entwickler zwar eine API aufrufen können, aber die Mathematik, das Modellverhalten, Retrieval-Fehler, Agent-Loops, Evaluierungs-Harnesses oder Produktions-Tradeoffs unter diesem Aufruf nicht erklären können.

Die Prämisse des Lehrplans ist einfach: Bauen Sie zuerst selbst die kleinere Version und verwenden Sie dann das Framework. Dieses Muster macht PyTorch, Transformers, LangGraph, MCP und produktives RAG weniger magisch.

Die stärkste Zielgruppe ist der arbeitende Ingenieur, der einen langen Weg statt einer Playlist sucht. Es ist besonders relevant für Teams, die KI-Enthusiasmus in dauerhafte interne Fähigkeiten umwandeln wollen.

3. Architektur und Denkmodell

Das Repository ist in Phasen und Lektionen gegliedert. Jede Lektion folgt einer konsistenten Form mit Dokumentationen, Code, Quizzen und Outputs, während Skripte Lektionen prüfen, Kataloge erstellen, Skills installieren und die öffentliche Website generieren.

Bereich	Detail	Warum es wichtig ist
Lehrplan	`phases/<phase>/<lesson>/`	Lektionsordner enthalten Dokumentationen, ausführbaren Code, Quiz-JSON und wiederverwendbare Outputs.
Roadmap	`ROADMAP.md`	Kanonische Phasenstruktur, geschätzte Zeit und Lektionsabdeckung.
Website	`site/build.js`, Website-Daten	Erstellt die öffentliche Leseerfahrung aus Repository-Inhalten.
Skill-Helfer	`.claude/skills/find-your-level`, `check-understanding`	Agent-unterstützte Platzierung und Phasen-Quizzes.
Outputs	`phases/**/outputs/`	Prompts, Skills, Agenten und MCP-bezogene Artefakte, die durch Lektionen erzeugt werden.
Skripte	`scripts/build_catalog.py`, `install_skills.py`, `lesson_run.py`, `audit_lessons.py`	Kataloggenerierung, Skill-Installation, Code-Prüfungen und Audits der Lektionsinvarianten.
CI	`.github/workflows/curriculum.yml`	Automatisiert Audits und die Synchronisierung von Website/README.
Regeln für Mitwirkende	`AGENTS.md`, `CONTRIBUTING.md`, `LESSON_TEMPLATE.md`	Hält das Lektionsformat und die Beiträge von KI-Agenten diszipliniert.

4. Kleinster End-to-End-Setup

Die folgenden Befehle stammen aus der Repository-Dokumentation und wurden mit dem aktuellen Recherche-Snapshot abgeglichen. Behandle sie als Startpunkt und lies anschließend die verlinkte README, bevor du in einer Produktionsumgebung installierst.

git clone https://github.com/rohitg00/ai-engineering-from-scratch.git
cd ai-engineering-from-scratch

# Run a first lesson implementation
python phases/01-math-foundations/01-linear-algebra-intuition/code/vectors.py

# Install Python dependencies when needed
python -m pip install -r requirements.txt

Eine kleine erste Aufgabe sollte die Integration beweisen, bevor du sie mit kritischen Daten oder großen Workspaces verbindest.

# Find your starting point inside a supported agent
/find-your-level

# Check a phase after studying
/check-understanding 3

# Inspect the generated catalog
python3 scripts/build_catalog.py --stdout

# Install lesson skills into a target skill directory
python3 scripts/install_skills.py <target-dir> --phase 14

# Validate lesson code without running heavy jobs
python3 scripts/lesson_run.py

5. Technischer Deep Dive

5.1 Die Lektionsschleife ist das Produkt

Die README beschreibt ein wiederkehrendes Muster: Problem, Konzept, Erstellen, Anwenden, Veröffentlichen. Diese Struktur ist wichtiger als die Anzahl der Lektionen, da sie ein konzeptionelles Verständnis vor der Nutzung von Frameworks erzwingt.

Zum Beispiel kann eine Lektion ein Konzept in reinem Python implementieren, es dann mit einer Bibliothek vergleichen und anschließend einen Prompt oder Skill exportieren, der Ihnen später bei der Anwendung des Konzepts hilft.

lesson/
  docs/en.md     # explanation
  code/          # runnable implementation
  quiz.json      # check understanding
  outputs/       # prompt, skill, agent, or MCP artifact

5.2 Der Lehrplan steigt von den Grundlagen bis zu Agenten auf

Die Phasenstruktur beginnt mit Setup und Mathematik, geht dann über zu ML, Deep Learning, Vision, NLP, Sprache, Transformern, generativer KI, LLMs, multimodalen Systemen, Tools, Agenten, Produktion, Sicherheit und Abschlussprojekten.

Diese Breite macht es nützlich als Referenzhandbuch, aber auch einschüchternd. Der `/find-your-level` Skill ist eine praktische Antwort: Beginnen Sie nicht bei Phase Null, wenn Ihre eigentliche Lücke bei der Agenten-Evaluierung oder produktivem RAG liegt.

5.3 Outputs machen Lektionen wiederverwendbar

Ein charakteristisches Muster ist, dass Lektionen nicht nur mit Wissen enden. Sie erzeugen Artefakte: Prompts, Skills, Agent-Templates oder MCP-bezogene Outputs. Das bedeutet, dass das Gelernte direkt in Ihren täglichen Coding-Agent-Workflow einfließen kann.

Der aktuelle Top-Level-Output-Index sollte nicht als vollständige Darstellung betrachtet werden. Die Outputs auf Lektionsebene und die Installationsskripte sind der praktische Mechanismus zur Erkundung.

5.4 Agent-Engineering ist ein wesentliches Rückgrat.

Die auf Agenten fokussierten Phasen des Repos decken Agent-Loops, ReWOO, Reflexion, Tree of Thoughts, Function Calling, Memory, LangGraph, AutoGen, CrewAI, Benchmarks, Observability, Prompt-Injection-Abwehr, Verification Gates, Handoffs und Workbench-Scaffolding ab.

Dies ist wertvoll, da viele Agent-Tutorials die langweiligen Teile überspringen: State, Evaluation, Security, Recovery, Handoffs und Tool-Fehler. Ein Lehrplan, der diese Teile verbindet, ist nützlicher als ein weiterer Hello-World-Agent.

5.5 Qualität ist nach wie vor ein bewegliches Ziel.

Der Issue-Tracker zeigt normale Wachstumsschmerzen für einen schnelllebigen Lehrplan: Bias bei der Antwortposition in Quizzen, Rendering-Bugs, Diskrepanzen bei Dataset-Pfaden, Python/PyTorch-Kompatibilität, Tabellenformatierung, Diagramm-Rendering, Übersetzung und Sprachabdeckung.

Das macht das Repo nicht schwach. Es bedeutet, dass Leser die Lektionen während des Durcharbeitens verifizieren und das Repo eher als aktiven Open-Source-Lehrplan denn als poliertes Lehrbuch betrachten sollten.

6. Praxis: Falsch vs. richtig

Falsch	Richtig	Grund
Betrachten Sie es als Zertifikatskurs.	Betrachten Sie es als praktischen Open-Source-Lernpfad und Referenzhandbuch.	Der Maintainer hat sich explizit gegen eine Positionierung als Zertifikat ausgesprochen.
Überspringen Sie die Grundlagen, um sich dann später über den Schwierigkeitsgrad der Lektionen zu beschweren.	Verwenden Sie `/find-your-level` und folgen Sie den Abhängigkeiten für Ihre Wissenslücken.	Der Lehrplan ist bewusst aufeinander aufbauend gestaltet.
Gehen Sie davon aus, dass jeder Sprach-Track die gleiche Tiefe hat.	Überprüfen Sie den aktuellen Lektionscode für Python, TypeScript, Rust oder Julia, bevor Sie sich für einen Pfad entscheiden.	Offene Issues diskutieren die starke Python-Lastigkeit.
Lesen Sie nur die Dokumentation.	Führen Sie den Code aus, beantworten Sie die Quizfragen und nutzen Sie die generierten Outputs.	Das Repo ist auf die Praxis des Build/Use/Ship ausgelegt.

7. Häufige Fehler und aktuelle Probleme

Der Issue Tracker ist wichtig, weil diese Repos jung sind und sich schnell bewegen. Der Artikel nutzt Issues als Risikosignale, nicht als Beweis dafür, dass ein Projekt unbrauchbar ist.

Bereich	Detail	Warum es wichtig ist
Quiz-Bias	Issue #240 berichtet, dass der Bias bei der Antwortposition auf main weiterhin besteht.	Nutzen Sie Quizze als Übung, nicht als formale Bewertung.
Diagramm-Rendering	Issue #233 meldet ein nicht gerendertes Phase 16 Kommunikationsdiagramm.	Das Rendering einiger Websites/Dokumentationen kann Inhaltsaktualisierungen verzögern.
Tabellen	Issue #193 meldet fehlerhafte Tabellen.	Überprüfen Sie das rohe Markdown, wenn die Formatierung der Website falsch aussieht.
Python 3.14	Issue #192 weist auf Probleme bei der Verfügbarkeit von PyTorch CUDA-Wheels hin.	Verwenden Sie für ML-Lektionen bekannte, funktionierende Python-Versionen.
Dataset-Pfade	Issue #179 verfolgt eine Pfad-Diskrepanz im Rotten Tomatoes-Datensatz.	Rechnen Sie mit gelegentlichen Abweichungen der Datenquellen.
Sprachabdeckung	Issue #168 verfolgt das Hinzufügen von Rust-Implementierungen im gesamten Lehrplan.	Das Repository ist umfangreich, aber nicht jeder Sprachpfad ist vollständig.

8. Performance-, Skalierungs- und Kostennotizen

Die meisten frühen Lektionen sind kostengünstig auszuführen. Spätere Lektionen, die PyTorch, Transformers, multimodale Modelle, lokale Inferenz, Fine-Tuning oder Capstone-Systeme beinhalten, können mehr Rechenleistung und API-Zugriff erfordern.

Das praktische Setup besteht darin, Lektionen in kleinen Schritten auszuführen, eine stabile Python-Version festzulegen und GPU-intensive oder API-intensive Lektionen erst zu beginnen, nachdem Sie deren Dokumentation und Abhängigkeitsanforderungen gelesen haben.

Für Teams sind die Skripte und Skills des Repositorys nützlich für die Lehrplangovernance. Sie können Phasen zuweisen, Audits durchführen, ausgewählte Skills installieren und einen gemeinsamen Fortschritt beibehalten, anstatt jeden anzuweisen, Hunderte von Dateien zu durchsuchen.

9. Für wen es geeignet ist

Verwenden, wenn	Überspringen, wenn
Sie können programmieren und möchten KI-Systeme unterhalb der API-Schicht verstehen.	Sie sind ein absoluter Programmieranfänger.
Sie suchen einen langen Weg von Mathematik bis hin zu LLMs, Agents, MCP, Infra und Safety.	Sie suchen ein kurzes Wochenend-Tutorial.
Sie lernen durch das Implementieren und Bereitstellen wiederverwendbarer Artefakte.	Sie möchten nur Videos oder hochgradige Essays.
Ihr Team benötigt ein Open-Source-KI-Weiterbildungsrückgrat.	Sie benötigen eine akkreditierte Zertifizierung oder eine formale Bewertung.

10. Community-Signal

Webartikel bezeichnen das Repo als ein großes, kostenloses Referenzhandbuch für KI-Engineering und vergleichen es oft mit einem studienähnlichen Pfad. Einige dieser Artikel verwenden veraltete Lektionszahlen, daher sollten diese als dynamische Metadaten betrachtet werden.

Die Reddit-Diskussion ist nützlich, da sie sowohl Begeisterung als auch Skepsis enthält: Fragen zur KI-gestützten Autorenschaft, Überforderung von Anfängern, API-Kosten und ob Lektionen zu fortgeschrittenen Agenten die Zuverlässigkeit ausreichend tiefgehend behandeln.

Der GitHub Issue-Tracker zeigt einen lebendigen Lehrplan: Übersetzungs-PRs, Anfragen für Rust-Tracks, Quiz-Fehler, Rendering-Korrekturen, Lektionsverknüpfungen und Website-Verbesserungen.

11. Das Urteil: Lohnt sich die Nutzung?

Unsere Einschätzung

Nutzen Sie AI Engineering From Scratch, wenn Sie einen ernsthaften, praxisorientierten Pfad von den Grundlagen bis zum KI-System-Engineering suchen. Überspringen Sie es, wenn Sie einen ausgefeilten Zertifikatskurs, eine gleichmäßige Reife über alle Sprach-Tracks hinweg oder ein schnelles Rezept zum App-Bau benötigen.

12. Das große Ganze

Dieses Repo ist Teil einer umfassenderen Korrektur in der KI-Ausbildung. Nach Jahren von API-first-Demos müssen Ingenieure zunehmend Daten, Mathematik, Modellverhalten, Evaluierung, Agenten, Protokolle und Produktionsfehler-Modi verstehen.

Die wichtigste Gewohnheit, die es vermittelt, ist nicht ein bestimmter Algorithmus. Es ist das Muster, den kleinen Mechanismus zu bauen, bevor man dem großen Framework vertraut.

13. Häufig gestellte Fragen

F: Ist AI Engineering From Scratch ein Framework?

Nein. Es ist ein Lehrplan und ein Referenz-Repo mit Lektionen, Code, Quizzen, Outputs, Skripten und einer öffentlichen Website.

F: Wo sollte ich anfangen?

Verwenden Sie `/find-your-level`, wenn Sie einen Agenten mit den installierten Fähigkeiten haben. Beginnen Sie ansonsten dort, wo Ihre Voraussetzungen am schwächsten sind: Mathematik, ML, Deep Learning, LLMs, Agenten oder Produktion.

F: Benötige ich eine GPU?

Nicht für alle Lektionen. Frühe Lektionen sind leichtgewichtig, während Deep Learning, lokale Modelle, Fine-Tuning und multimodale Lektionen von einer GPU oder Cloud-Computing profitieren können.

F: Bietet es Zertifikate an?

Nein. Das Repo ist als praktisches Open-Source-Lernangebot positioniert, nicht als akkreditiertes Zertifikatsprogramm.

F: Sind die Lektionen nur in Python?

Python ist der dominierende praktische Pfad, während das README auch auf TypeScript, Rust und Julia verweist. Überprüfen Sie den Code-Ordner jeder Lektion, bevor Sie von einer Abdeckung ausgehen.

F: Was sind die integrierten Fähigkeiten?

Die Fähigkeiten auf oberster Ebene umfassen `/find-your-level` für die Platzierung und `/check-understanding <phase>` für Phasen-Quizze. Lektions-Outputs enthalten weitere Prompts und Fähigkeiten.

14. Glossar

Bereich	Detail	Warum es wichtig ist
Von Grund auf	Implementierung des Kernmechanismus vor der Verwendung eines Frameworks.	Der zentrale Lehrstil des Lehrplans.
Lektions-Artefakt	Ein Prompt, eine Fähigkeit, ein Agent oder ein MCP-bezogener Output.	Etwas Wiederverwendbares nach der Lektion.
MCP	Model Context Protocol.	Wird in späteren Tool- und Agenten-Phasen verwendet.
RAG	Retrieval-augmented generation.	Ein wichtiges LLM-Engineering-Muster.
Agenten-Schleife	Kontrollzyklus aus Modell, Tool-Aufruf, Beobachtung und nächstem Schritt.	Zentrales Konzept des Agenten-Engineerings.
Katalog	Generierte JSON-Ansicht von Phasen, Lektionen, Code und Ausgaben.	Erstellt aus Repository-Dateien.
Capstone	Ein größeres End-to-End-Projekt, das viele Lektionen kombiniert.	Nachweis des Verständnisses in der späten Phase.

15. Alle Quellen und Links

Primärquellen

Issues und PRs

Community und Web

Interne Links

16. Tabelle zur Quellenzuordnung

Bereich	Detail	Warum es wichtig ist
README und Roadmap	Lehrplan-Struktur, Setup, Philosophie, Phasenaufbau.	Primärquelle.
Skripte und Workflows	Katalog, Lektionsprüfungen, Skill-Installation, CI-Verhalten.	Architekturquelle.
Issues und PRs	Quiz, Rendering, Dataset, Python, Übersetzung und Vorbehalte zur Sprachabdeckung.	Aktualitätssignal.
Website	Öffentliche Leseerfahrung und Abweichungen bei der Zählung.	Offizielle Webquelle.
Reddit und Artikel	Community-Begeisterung, Skepsis und Darstellung durch Dritte.	Sekundärquelle.

Related Guides

Guides & Features

AI Engineering From Scratch Deep Dive: Der Open-Source-Lehrplan für den manuellen Aufbau von KI-Systemen

1. ai-engineering-from-scratch in einem Satz

2. Warum es wichtig ist

3. Architektur und Denkmodell

4. Kleinster End-to-End-Setup

5. Technischer Deep Dive

5.1 Die Lektionsschleife ist das Produkt

5.2 Der Lehrplan steigt von den Grundlagen bis zu Agenten auf

5.3 Outputs machen Lektionen wiederverwendbar

5.4 Agent-Engineering ist ein wesentliches Rückgrat.

5.5 Qualität ist nach wie vor ein bewegliches Ziel.

6. Praxis: Falsch vs. richtig

7. Häufige Fehler und aktuelle Probleme

8. Performance-, Skalierungs- und Kostennotizen

9. Für wen es geeignet ist

10. Community-Signal

11. Das Urteil: Lohnt sich die Nutzung?

12. Das große Ganze

13. Häufig gestellte Fragen

F: Ist AI Engineering From Scratch ein Framework?

F: Wo sollte ich anfangen?

F: Benötige ich eine GPU?

F: Bietet es Zertifikate an?

F: Sind die Lektionen nur in Python?

F: Was sind die integrierten Fähigkeiten?

14. Glossar

15. Alle Quellen und Links

Primärquellen

Issues und PRs

Community und Web

Interne Links

16. Tabelle zur Quellenzuordnung

Related Guides

Humanizer Skill Guide

Mastering Agent Skills

Antigravity Workflows Guide

How to Change Antigravity Themes

How to Change Language

Antigravity Security Guide

1. ai-engineering-from-scratch in einem Satz

2. Warum es wichtig ist

3. Architektur und Denkmodell

4. Kleinster End-to-End-Setup

5. Technischer Deep Dive

5.1 Die Lektionsschleife ist das Produkt

5.2 Der Lehrplan steigt von den Grundlagen bis zu Agenten auf

5.3 Outputs machen Lektionen wiederverwendbar

5.4 Agent-Engineering ist ein wesentliches Rückgrat.

5.5 Qualität ist nach wie vor ein bewegliches Ziel.

6. Praxis: Falsch vs. richtig

7. Häufige Fehler und aktuelle Probleme

8. Performance-, Skalierungs- und Kostennotizen

9. Für wen es geeignet ist

10. Community-Signal

11. Das Urteil: Lohnt sich die Nutzung?

12. Das große Ganze

13. Häufig gestellte Fragen

F: Ist AI Engineering From Scratch ein Framework?

F: Wo sollte ich anfangen?

F: Benötige ich eine GPU?

F: Bietet es Zertifikate an?

F: Sind die Lektionen nur in Python?

F: Was sind die integrierten Fähigkeiten?

14. Glossar

15. Alle Quellen und Links

Primärquellen

Issues und PRs

Community und Web

Interne Links

16. Tabelle zur Quellenzuordnung

Get the Ultimate Antigravity Cheat Sheet

Related Guides

Humanizer Skill Guide

Mastering Agent Skills

Antigravity Workflows Guide

How to Change Antigravity Themes

How to Change Language

Antigravity Security Guide