KI Deep Dive

AI Engineering From Scratch Deep Dive: Der Open-Source-Lehrplan für den manuellen Aufbau von KI-Systemen

AI Engineering From Scratch ist ein unter MIT lizenziertes Curriculum und Referenzhandbuch für den manuellen Aufbau von KI-Systemen, beginnend mit mathematischen und ML-Grundlagen bis hin zu Deep Learning, Transformern, LLMs, Tools, Agenten, MCP, Infrastruktur, Sicherheit und Abschlussprojekten.

Aktualisiert im Juni 2026
AI Engineering From Scratch Guide-Hero, der die geschichteten Lehrplanphasen von Mathematik bis hin zu LLMs, Agenten, Produktionsinfrastruktur, Prompts, Skills und MCP-Servern zeigt

Dieses Repo ist kein Framework und kein Wochenend-Tutorial. Es ist ein strukturiertes Lernsystem: Lektionsordner, ausführbarer Code, Dokumentationen, Quizze, generierte Website-Daten, Agent-Skills, Prompts, Skripte und Beitragsregeln für Leute, die den Stack unterhalb des API-Aufrufs verstehen wollen.

Get the latest on AI, LLMs & developer tools

New MCP servers, model updates, and guides like this one — delivered weekly.

Redaktioneller Hinweis

Dieser Artikel verwendet das GitHub-Repo, README, die Roadmap, Anforderungen, Skripte, Site-Build-Dateien, Issues, PRs, die Website, Reddit, X-Suche und Artikel von Drittanbietern, die am 2. Juni 2026 gesammelt wurden. Das README und die Website zeigen möglicherweise unterschiedliche Lektionsanzahlen, daher konzentriert sich der Artikel auf die Struktur statt auf volatile Zahlen.

1. ai-engineering-from-scratch in einem Satz

AI Engineering From Scratch ist ein Open-Source-KI-Curriculum-Repo, in dem jede Lektion darauf abzielt, das Konzept zu vermitteln, es von Grund auf zu implementieren, es mit Produktionsbibliotheken zu vergleichen und ein wiederverwendbares Artefakt wie einen Prompt, Skill, Agenten oder MCP-Server bereitzustellen.

BereichDetailWarum es wichtig ist
Repositoryrohitg00/ai-engineering-from-scratchhttps://github.com/rohitg00/ai-engineering-from-scratch
Primäre SprachePythonPrimäre GitHub-Sprache zum Recherchezeitpunkt.
LizenzMITGebündelte oder binäre Lizenzen gegebenenfalls separat prüfen.
Erstellt18. März 2026Während der Recherche wurden keine GitHub-Releases gefunden; der Main-Branch und die Website werden aktiv aktualisiert.

2. Warum es wichtig ist

Das Repo ist wichtig, weil viele KI-Entwickler zwar eine API aufrufen können, aber die Mathematik, das Modellverhalten, Retrieval-Fehler, Agent-Loops, Evaluierungs-Harnesses oder Produktions-Tradeoffs unter diesem Aufruf nicht erklären können.

Die Prämisse des Lehrplans ist einfach: Bauen Sie zuerst selbst die kleinere Version und verwenden Sie dann das Framework. Dieses Muster macht PyTorch, Transformers, LangGraph, MCP und produktives RAG weniger magisch.

Die stärkste Zielgruppe ist der arbeitende Ingenieur, der einen langen Weg statt einer Playlist sucht. Es ist besonders relevant für Teams, die KI-Enthusiasmus in dauerhafte interne Fähigkeiten umwandeln wollen.

3. Architektur und Denkmodell

Das Repository ist in Phasen und Lektionen gegliedert. Jede Lektion folgt einer konsistenten Form mit Dokumentationen, Code, Quizzen und Outputs, während Skripte Lektionen prüfen, Kataloge erstellen, Skills installieren und die öffentliche Website generieren.

BereichDetailWarum es wichtig ist
Lehrplan`phases/<phase>/<lesson>/`Lektionsordner enthalten Dokumentationen, ausführbaren Code, Quiz-JSON und wiederverwendbare Outputs.
Roadmap`ROADMAP.md`Kanonische Phasenstruktur, geschätzte Zeit und Lektionsabdeckung.
Website`site/build.js`, Website-DatenErstellt die öffentliche Leseerfahrung aus Repository-Inhalten.
Skill-Helfer`.claude/skills/find-your-level`, `check-understanding`Agent-unterstützte Platzierung und Phasen-Quizzes.
Outputs`phases/**/outputs/`Prompts, Skills, Agenten und MCP-bezogene Artefakte, die durch Lektionen erzeugt werden.
Skripte`scripts/build_catalog.py`, `install_skills.py`, `lesson_run.py`, `audit_lessons.py`Kataloggenerierung, Skill-Installation, Code-Prüfungen und Audits der Lektionsinvarianten.
CI`.github/workflows/curriculum.yml`Automatisiert Audits und die Synchronisierung von Website/README.
Regeln für Mitwirkende`AGENTS.md`, `CONTRIBUTING.md`, `LESSON_TEMPLATE.md`Hält das Lektionsformat und die Beiträge von KI-Agenten diszipliniert.

4. Kleinster End-to-End-Setup

Die folgenden Befehle stammen aus der Repository-Dokumentation und wurden mit dem aktuellen Recherche-Snapshot abgeglichen. Behandle sie als Startpunkt und lies anschließend die verlinkte README, bevor du in einer Produktionsumgebung installierst.

git clone https://github.com/rohitg00/ai-engineering-from-scratch.git
cd ai-engineering-from-scratch

# Run a first lesson implementation
python phases/01-math-foundations/01-linear-algebra-intuition/code/vectors.py

# Install Python dependencies when needed
python -m pip install -r requirements.txt

Eine kleine erste Aufgabe sollte die Integration beweisen, bevor du sie mit kritischen Daten oder großen Workspaces verbindest.

# Find your starting point inside a supported agent
/find-your-level

# Check a phase after studying
/check-understanding 3

# Inspect the generated catalog
python3 scripts/build_catalog.py --stdout

# Install lesson skills into a target skill directory
python3 scripts/install_skills.py <target-dir> --phase 14

# Validate lesson code without running heavy jobs
python3 scripts/lesson_run.py

5. Technischer Deep Dive

5.1 Die Lektionsschleife ist das Produkt

Die README beschreibt ein wiederkehrendes Muster: Problem, Konzept, Erstellen, Anwenden, Veröffentlichen. Diese Struktur ist wichtiger als die Anzahl der Lektionen, da sie ein konzeptionelles Verständnis vor der Nutzung von Frameworks erzwingt.

Zum Beispiel kann eine Lektion ein Konzept in reinem Python implementieren, es dann mit einer Bibliothek vergleichen und anschließend einen Prompt oder Skill exportieren, der Ihnen später bei der Anwendung des Konzepts hilft.

lesson/
  docs/en.md     # explanation
  code/          # runnable implementation
  quiz.json      # check understanding
  outputs/       # prompt, skill, agent, or MCP artifact

5.2 Der Lehrplan steigt von den Grundlagen bis zu Agenten auf

Die Phasenstruktur beginnt mit Setup und Mathematik, geht dann über zu ML, Deep Learning, Vision, NLP, Sprache, Transformern, generativer KI, LLMs, multimodalen Systemen, Tools, Agenten, Produktion, Sicherheit und Abschlussprojekten.

Diese Breite macht es nützlich als Referenzhandbuch, aber auch einschüchternd. Der `/find-your-level` Skill ist eine praktische Antwort: Beginnen Sie nicht bei Phase Null, wenn Ihre eigentliche Lücke bei der Agenten-Evaluierung oder produktivem RAG liegt.

5.3 Outputs machen Lektionen wiederverwendbar

Ein charakteristisches Muster ist, dass Lektionen nicht nur mit Wissen enden. Sie erzeugen Artefakte: Prompts, Skills, Agent-Templates oder MCP-bezogene Outputs. Das bedeutet, dass das Gelernte direkt in Ihren täglichen Coding-Agent-Workflow einfließen kann.

Der aktuelle Top-Level-Output-Index sollte nicht als vollständige Darstellung betrachtet werden. Die Outputs auf Lektionsebene und die Installationsskripte sind der praktische Mechanismus zur Erkundung.

5.4 Agent-Engineering ist ein wesentliches Rückgrat.

Die auf Agenten fokussierten Phasen des Repos decken Agent-Loops, ReWOO, Reflexion, Tree of Thoughts, Function Calling, Memory, LangGraph, AutoGen, CrewAI, Benchmarks, Observability, Prompt-Injection-Abwehr, Verification Gates, Handoffs und Workbench-Scaffolding ab.

Dies ist wertvoll, da viele Agent-Tutorials die langweiligen Teile überspringen: State, Evaluation, Security, Recovery, Handoffs und Tool-Fehler. Ein Lehrplan, der diese Teile verbindet, ist nützlicher als ein weiterer Hello-World-Agent.

5.5 Qualität ist nach wie vor ein bewegliches Ziel.

Der Issue-Tracker zeigt normale Wachstumsschmerzen für einen schnelllebigen Lehrplan: Bias bei der Antwortposition in Quizzen, Rendering-Bugs, Diskrepanzen bei Dataset-Pfaden, Python/PyTorch-Kompatibilität, Tabellenformatierung, Diagramm-Rendering, Übersetzung und Sprachabdeckung.

Das macht das Repo nicht schwach. Es bedeutet, dass Leser die Lektionen während des Durcharbeitens verifizieren und das Repo eher als aktiven Open-Source-Lehrplan denn als poliertes Lehrbuch betrachten sollten.

6. Praxis: Falsch vs. richtig

FalschRichtigGrund
Betrachten Sie es als Zertifikatskurs.Betrachten Sie es als praktischen Open-Source-Lernpfad und Referenzhandbuch.Der Maintainer hat sich explizit gegen eine Positionierung als Zertifikat ausgesprochen.
Überspringen Sie die Grundlagen, um sich dann später über den Schwierigkeitsgrad der Lektionen zu beschweren.Verwenden Sie `/find-your-level` und folgen Sie den Abhängigkeiten für Ihre Wissenslücken.Der Lehrplan ist bewusst aufeinander aufbauend gestaltet.
Gehen Sie davon aus, dass jeder Sprach-Track die gleiche Tiefe hat.Überprüfen Sie den aktuellen Lektionscode für Python, TypeScript, Rust oder Julia, bevor Sie sich für einen Pfad entscheiden.Offene Issues diskutieren die starke Python-Lastigkeit.
Lesen Sie nur die Dokumentation.Führen Sie den Code aus, beantworten Sie die Quizfragen und nutzen Sie die generierten Outputs.Das Repo ist auf die Praxis des Build/Use/Ship ausgelegt.

7. Häufige Fehler und aktuelle Probleme

Der Issue Tracker ist wichtig, weil diese Repos jung sind und sich schnell bewegen. Der Artikel nutzt Issues als Risikosignale, nicht als Beweis dafür, dass ein Projekt unbrauchbar ist.

BereichDetailWarum es wichtig ist
Quiz-BiasIssue #240 berichtet, dass der Bias bei der Antwortposition auf main weiterhin besteht.Nutzen Sie Quizze als Übung, nicht als formale Bewertung.
Diagramm-RenderingIssue #233 meldet ein nicht gerendertes Phase 16 Kommunikationsdiagramm.Das Rendering einiger Websites/Dokumentationen kann Inhaltsaktualisierungen verzögern.
TabellenIssue #193 meldet fehlerhafte Tabellen.Überprüfen Sie das rohe Markdown, wenn die Formatierung der Website falsch aussieht.
Python 3.14Issue #192 weist auf Probleme bei der Verfügbarkeit von PyTorch CUDA-Wheels hin.Verwenden Sie für ML-Lektionen bekannte, funktionierende Python-Versionen.
Dataset-PfadeIssue #179 verfolgt eine Pfad-Diskrepanz im Rotten Tomatoes-Datensatz.Rechnen Sie mit gelegentlichen Abweichungen der Datenquellen.
SprachabdeckungIssue #168 verfolgt das Hinzufügen von Rust-Implementierungen im gesamten Lehrplan.Das Repository ist umfangreich, aber nicht jeder Sprachpfad ist vollständig.

8. Performance-, Skalierungs- und Kostennotizen

Die meisten frühen Lektionen sind kostengünstig auszuführen. Spätere Lektionen, die PyTorch, Transformers, multimodale Modelle, lokale Inferenz, Fine-Tuning oder Capstone-Systeme beinhalten, können mehr Rechenleistung und API-Zugriff erfordern.

Das praktische Setup besteht darin, Lektionen in kleinen Schritten auszuführen, eine stabile Python-Version festzulegen und GPU-intensive oder API-intensive Lektionen erst zu beginnen, nachdem Sie deren Dokumentation und Abhängigkeitsanforderungen gelesen haben.

Für Teams sind die Skripte und Skills des Repositorys nützlich für die Lehrplangovernance. Sie können Phasen zuweisen, Audits durchführen, ausgewählte Skills installieren und einen gemeinsamen Fortschritt beibehalten, anstatt jeden anzuweisen, Hunderte von Dateien zu durchsuchen.

9. Für wen es geeignet ist

Verwenden, wennÜberspringen, wenn
Sie können programmieren und möchten KI-Systeme unterhalb der API-Schicht verstehen.Sie sind ein absoluter Programmieranfänger.
Sie suchen einen langen Weg von Mathematik bis hin zu LLMs, Agents, MCP, Infra und Safety.Sie suchen ein kurzes Wochenend-Tutorial.
Sie lernen durch das Implementieren und Bereitstellen wiederverwendbarer Artefakte.Sie möchten nur Videos oder hochgradige Essays.
Ihr Team benötigt ein Open-Source-KI-Weiterbildungsrückgrat.Sie benötigen eine akkreditierte Zertifizierung oder eine formale Bewertung.

10. Community-Signal

Webartikel bezeichnen das Repo als ein großes, kostenloses Referenzhandbuch für KI-Engineering und vergleichen es oft mit einem studienähnlichen Pfad. Einige dieser Artikel verwenden veraltete Lektionszahlen, daher sollten diese als dynamische Metadaten betrachtet werden.

Die Reddit-Diskussion ist nützlich, da sie sowohl Begeisterung als auch Skepsis enthält: Fragen zur KI-gestützten Autorenschaft, Überforderung von Anfängern, API-Kosten und ob Lektionen zu fortgeschrittenen Agenten die Zuverlässigkeit ausreichend tiefgehend behandeln.

Der GitHub Issue-Tracker zeigt einen lebendigen Lehrplan: Übersetzungs-PRs, Anfragen für Rust-Tracks, Quiz-Fehler, Rendering-Korrekturen, Lektionsverknüpfungen und Website-Verbesserungen.

11. Das Urteil: Lohnt sich die Nutzung?

Unsere Einschätzung

Nutzen Sie AI Engineering From Scratch, wenn Sie einen ernsthaften, praxisorientierten Pfad von den Grundlagen bis zum KI-System-Engineering suchen. Überspringen Sie es, wenn Sie einen ausgefeilten Zertifikatskurs, eine gleichmäßige Reife über alle Sprach-Tracks hinweg oder ein schnelles Rezept zum App-Bau benötigen.

12. Das große Ganze

Dieses Repo ist Teil einer umfassenderen Korrektur in der KI-Ausbildung. Nach Jahren von API-first-Demos müssen Ingenieure zunehmend Daten, Mathematik, Modellverhalten, Evaluierung, Agenten, Protokolle und Produktionsfehler-Modi verstehen.

Die wichtigste Gewohnheit, die es vermittelt, ist nicht ein bestimmter Algorithmus. Es ist das Muster, den kleinen Mechanismus zu bauen, bevor man dem großen Framework vertraut.

13. Häufig gestellte Fragen

F: Ist AI Engineering From Scratch ein Framework?

Nein. Es ist ein Lehrplan und ein Referenz-Repo mit Lektionen, Code, Quizzen, Outputs, Skripten und einer öffentlichen Website.

F: Wo sollte ich anfangen?

Verwenden Sie `/find-your-level`, wenn Sie einen Agenten mit den installierten Fähigkeiten haben. Beginnen Sie ansonsten dort, wo Ihre Voraussetzungen am schwächsten sind: Mathematik, ML, Deep Learning, LLMs, Agenten oder Produktion.

F: Benötige ich eine GPU?

Nicht für alle Lektionen. Frühe Lektionen sind leichtgewichtig, während Deep Learning, lokale Modelle, Fine-Tuning und multimodale Lektionen von einer GPU oder Cloud-Computing profitieren können.

F: Bietet es Zertifikate an?

Nein. Das Repo ist als praktisches Open-Source-Lernangebot positioniert, nicht als akkreditiertes Zertifikatsprogramm.

F: Sind die Lektionen nur in Python?

Python ist der dominierende praktische Pfad, während das README auch auf TypeScript, Rust und Julia verweist. Überprüfen Sie den Code-Ordner jeder Lektion, bevor Sie von einer Abdeckung ausgehen.

F: Was sind die integrierten Fähigkeiten?

Die Fähigkeiten auf oberster Ebene umfassen `/find-your-level` für die Platzierung und `/check-understanding <phase>` für Phasen-Quizze. Lektions-Outputs enthalten weitere Prompts und Fähigkeiten.

14. Glossar

BereichDetailWarum es wichtig ist
Von Grund aufImplementierung des Kernmechanismus vor der Verwendung eines Frameworks.Der zentrale Lehrstil des Lehrplans.
Lektions-ArtefaktEin Prompt, eine Fähigkeit, ein Agent oder ein MCP-bezogener Output.Etwas Wiederverwendbares nach der Lektion.
MCPModel Context Protocol.Wird in späteren Tool- und Agenten-Phasen verwendet.
RAGRetrieval-augmented generation.Ein wichtiges LLM-Engineering-Muster.
Agenten-SchleifeKontrollzyklus aus Modell, Tool-Aufruf, Beobachtung und nächstem Schritt.Zentrales Konzept des Agenten-Engineerings.
KatalogGenerierte JSON-Ansicht von Phasen, Lektionen, Code und Ausgaben.Erstellt aus Repository-Dateien.
CapstoneEin größeres End-to-End-Projekt, das viele Lektionen kombiniert.Nachweis des Verständnisses in der späten Phase.

15. Alle Quellen und Links

Interne Links

16. Tabelle zur Quellenzuordnung

BereichDetailWarum es wichtig ist
README und RoadmapLehrplan-Struktur, Setup, Philosophie, Phasenaufbau.Primärquelle.
Skripte und WorkflowsKatalog, Lektionsprüfungen, Skill-Installation, CI-Verhalten.Architekturquelle.
Issues und PRsQuiz, Rendering, Dataset, Python, Übersetzung und Vorbehalte zur Sprachabdeckung.Aktualitätssignal.
WebsiteÖffentliche Leseerfahrung und Abweichungen bei der Zählung.Offizielle Webquelle.
Reddit und ArtikelCommunity-Begeisterung, Skepsis und Darstellung durch Dritte.Sekundärquelle.

Related Guides

Sponsored AI assistant. Recommendations may be paid.