Praxisbuch Large Language Models

Name: Praxisbuch Large Language Models | Sprache mit KI verarbeiten und generieren
Brand: O'Reilly
Price: 39.9 EUR
Availability: OnlineOnly

Sprache mit KI verarbeiten und generieren

Jay Alammar Maarten Grootendorst(Author)

O'Reilly (Publisher)

1st Edition

Published on 28. October 2025

434 pages

E-Book

PDF with digital watermarking

System requirements

978-3-96010-931-0 (ISBN)

€39.90incl. 7% vat

System requirements

for PDF with digital watermarking

E-Book Single Licence to 17.06.2026

Available for download

Description

Alles über E-Books | Antworten auf Fragen rund um E-Books, Kopierschutz und Dateiformate finden Sie in unserem Info- & Hilfebereich.

Alles über E-Books, Kopierschutz & Dateiformate finden Sie in unserem Info- & Hilfebereich.

Alle Werkzeuge und Techniken für die praktische Arbeit mit LLMs - Das Handbuch für das intuitive Verständnis von LLMs: Mit zahlreichen Visualisierungen, die Konzepte schnell zugänglich machen - Themen sind die Sprachverarbeitung - Textklassifikation, Suche oder Cluster - und die Sprachgenerierung - vom Prompt Engineering bis zur Retrieval Augmented Generation (RAG) - Die Autoren haben mit ihren beliebten Blogs Millionen von Entwickler*innen geholfen, Machine Learning und KI zu verstehen Diese umfassende und anschauliche Einführung in die Welt der LLMs beschreibt sowohl konzeptionelle Grundlagen als auch konkrete Anwendungen und nützliche Tools. Tauchen Sie in das Innenleben von LLMs ein und erkunden Sie ihre Architekturen, Einsatzbereiche, Trainingsmethoden und Feintuning-Techniken. Mit seiner einzigartigen Mischung aus intuitiv verständlichen Illustrationen und praxisbezogenen Erläuterungen ist dieses Buch die ideale Ausgangsbasis für alle, die die Möglichkeiten von KI-Systemen voll ausschöpfen möchten. Sie lernen, vortrainierte Transformer-LLMs von Hugging Face für Anwendungsfälle wie das Verfassen von Texten oder für Inhaltszusammenfassungen einzusetzen. Sie erfahren außerdem, wie Sie Suchsysteme erstellen und vorhandene Bibliotheken und vortrainierte Modelle für Textklassifikation, Suche und Clustering nutzen. - Verstehen Sie die Architektur von Transformer-basierten Sprachmodellen, die bei der Textgenerierung und -repräsentation hervorragende Ergebnisse liefern - Entwerfen Sie fortgeschrittene LLM-Pipelines, um Textdokumente zu clustern und die darin enthaltenen Themen zu erforschen - Erstellen Sie semantische Suchmaschinen, die über den Abgleich von Schlagwörtern hinausgehen und auf Methoden wie Dense Retrieval und Reranking basieren - Lernen Sie, wie Sie generative Modelle optimal einsetzen - vom Prompt Engineering bis hin zur Retrieval Augmented Generation (RAG) - Entwickeln Sie ein tieferes Verständnis dafür, wie LLMs trainiert und für spezifische Anwendungen optimiert werden, beispielsweise durch Feintuning generativer Modelle, Contrastive Fine-Tuning und In-Context-Learning

More details

Other editions

Persons

Content

Cover
Hinweise zur Benutzung
Stimmen zu: Praxisbuch Large Language Models
Titel
Impressum
Inhalt
Vorwort
Teil I: Die Funktionsweise von Sprachmodellen verstehen
1 Einführung in Large Language Models
Was ist Language AI?
Die jüngsten Entwicklungen im Bereich der Language AI
Darstellung von Sprache als ein Bag-of-Words
Verbesserte Vektordarstellungen mit Dense Vector Embeddings
Arten von Embeddings
Kontext mit Attention codieren und decodieren
Attention Is All You Need
Representation-Modelle - rein Encoder-basierte Modelle (»Encoder-only«)
Generative Modelle - rein Decoder-basierte Modelle (»Decoder-only«)
Das Jahr der generativen KI
Die sich wandelnde Definition von Large Language Models
Wie sich das Training von Large Language Models im Vergleich zu traditionellen Ansätzen unterscheidet
Anwendungsmöglichkeiten und Nutzen von Large Language Models
LLMs verantwortungsvoll entwickeln und nutzen
Limited Resources Are All You Need - LLMs auch ohne große Rechenressourcen trainieren und verwenden
Schnittstellen zur Nutzung von LLMs
Proprietäre, nicht frei zugängliche Modelle
Frei zugängliche Modelle
Open-Source-Frameworks
Ihren ersten Text mit einem LLM generieren
Zusammenfassung
2 Tokns und Embeddings
Tokenisierung bei LLMs
Wie Tokenizer die Eingaben für das Sprachmodell aufbereiten
LLMs herunterladen und ausführen
Welche Faktoren sind bei der Tokenisierung entscheidend?
Tokenisierung auf Wort-, Wortteil-, Zeichen- und Byte-Ebene
Ein Vergleich verschiedener trainierter Tokenizer
Faktoren, die darüber entscheiden, wie sich ein Tokenizer verhält
Token-Embeddings
Sprachmodelle halten Embeddings für das Vokabular ihres Tokenizers vor
Kontextualisierte Word-Embeddings mit Sprachmodellen erstellen
Text-Embeddings (für Sätze oder ganze Dokumente)
Wie Word-Embeddings jenseits von LLMs genutzt werden können
Vortrainierte Word-Embeddings nutzen
Der Word2vec-Algorithmus und Training mittels Contrastive Learning
Empfehlungssysteme aufbauen, die auf Embeddings basieren
Songs mithilfe von Embeddings empfehlen
Embedding-Modelle zur Empfehlung von Songs trainieren
Zusammenfassung
3 Ein Blick ins Innere von Large Language Models
Ein erster Überblick über Transformer-Modelle
Die Ein- und Ausgaben eines Transformer-basierten LLM
Die einzelnen Komponenten, die beim Forward-Pass durchlaufen werden
Auswahl eines einzelnen Tokens anhand einer Wahrscheinlichkeitsverteilung (Sampling/Decodierung)
Parallele Verarbeitung von Tokens und Kontextlänge
Schnellere Generierung durch Zwischenspeichern von Schlüsseln und Werten
Ein Blick ins Innere des Transformer-Blocks
Verbesserungen an der Transformer-Architektur
Effizienterer Attention-Mechanismus
Der Transformer-Block
Positional-Embeddings (RoPE)
Weitere Vorschläge und Verbesserungen im Hinblick auf die Architektur
Zusammenfassung
Teil II: Vortrainierte Sprachmodelle verwenden
4 Textklassifikation
Sentimentanalyse von Spielfilmrezensionen
Texte mit Representation-Modellen klassifizieren
Ein geeignetes Modell auswählen
Ein aufgabenspezifisches Modell verwenden
Texte mit Embedding-Modellen klassifizieren
Überwachte Klassifikation
Was aber, wenn Ihnen keine gelabelten Daten zur Verfügung stehen?
Texte mit generativen Modellen klassifizieren
Texte mit T5-(Text-to-Text-Transfer-Transformer-)Modellen klassifizieren
Texte mit ChatGPT klassifizieren
Zusammenfassung
5 Clustering von Texten und Topic Modeling
ArXiv-Artikel aus dem Forschungsbereich Computation and Language
Die bewährte Pipeline beim Text-Clustering
Dokumente in Embeddings umwandeln
Die Dimensionierung der Embeddings verringern
Die dimensionsreduzierten Embeddings zu Clustern zusammenfassen
Die gebildeten Cluster inspizieren
Vom Clustern von Texten hin zum Topic Modeling
BERTopic: ein modulares Topic-Modeling-Framework
Der modulare Aufbau des BERTopic-Frameworks
Einen besonderen Baustein hinzufügen
Ein zusätzlicher Baustein zur Textgenerierung
Zusammenfassung
6 Prompt Engineering
Textgenerierungsmodelle verwenden
Ein geeignetes Textgenerierungsmodell wählen
Textgenerierungsmodelle laden
Einfluss auf die Ausgabe eines Modells nehmen
Einführung in das Prompt Engineering
Die grundlegenden Elemente eines Prompts
Prompts formulieren, die Anweisungen enthalten (Instruction-based Prompting)
Fortgeschrittene Prompt-Engineering-Techniken
Prompts komplexer gestalten
In-Context Learning - Beispiele bereitstellen
Prompt Chaining - Aufgaben in mehrere Teilaspekte aufteilen
Logisches Schließen mit generativen Modellen (Reasoning)
Chain-of-Thought - erst nachdenken, dann antworten
Self-Consistency - Auswahl aus mehreren Antwortmöglichkeiten
Tree-of-Thought - über Zwischenschritte zur besten Antwort gelangen
Modellausgaben validieren
Beispiele bereitstellen
Vorgaben machen und Modellausgaben beschränken
Zusammenfassung
7 Fortgeschrittene Techniken und Tools im Bereich der Textgenerierung
Optimierungen hinsichtlich der Verwendung von Modellen - quantisierte Modelle mit dem LangChain-Framework laden
Chains - die Anwendungsmöglichkeiten von LLMs noch erweitern
Prompt-Templates mit einem LLM verketten
Mehrere Prompts miteinander verketten
Einen Speicher bereitstellen - LLMs ermöglichen, sich an Gespräche zu erinnern
Conversation Buffer - LLMs den gesamten Gesprächsverlauf bereitstellen
Windowed Conversation Buffer - LLMs einen Teil des Gesprächsverlaufs bereitstellen
Conversation Summary - LLMs eine Zusammenfassung des Gesprächsverlaufs bereitstellen
Agenten - ein aus mehreren LLMs bestehendes System entwickeln
Die treibende Kraft hinter Agenten - Schritt-für-Schritt-Reasoning
ReAct im LangChain-Framework verwenden
Zusammenfassung
8 Semantische Suche und Retrieval-Augmented Generation
Einführung in semantische Such- und RAG-Systeme
Semantische Suche auf Basis von LLMs
Dense-Retrieval-Systeme
Reranking-Systeme
Metriken zur Evaluierung von Retrieval-Systemen
Retrieval-Augmented Generation (RAG)
Suchsysteme zu RAG-Systemen erweitern
Ein Beispiel für eine auf Fakten basierende Generierung (Grounded Generation) mit einem gemanagten LLM
Ein Beispiel für ein RAG-System, bei dem das Modell lokal betrieben wird
Fortgeschrittene Techniken im Bereich der RAG-Systeme
RAG-Systeme evaluieren
Zusammenfassung
9 Multimodale Large Language Models
Vision Transformer
Multimodale Embedding-Modelle
CLIP - Modelle, die eine Verbindung zwischen Texten und Bildern herstellen können
Wie werden bei CLIP multimodale Embeddings generiert?
OpenCLIP
CLIP mit der sentence-transformers-Bibliothek laden
Multimodale Textgenerierungsmodelle erstellen
BLIP-2 - Modelle erstellen, die auf Basis von Texten und Bildern logische Schlüsse ziehen können
Multimodale Eingabedaten aufbereiten
1. Anwendungsfall: Bildbeschriftungen erstellen
2. Anwendungsfall: Chatmodelle erstellen, die multimodale Prompts unterstützen
Zusammenfassung
Teil III: Sprachmodelle trainieren und feintunen
10 Text-Embedding-Modelle erstellen
Embedding-Modelle
Was genau ist Contrastive Learning?
SBERT
Embedding-Modelle erstellen
Kontrastive Beispiele erstellen
Das Modell trainieren
Differenziertere Evaluierung
Verlustfunktionen
Embedding-Modelle feintunen
Embedding-Modelle mit gelabelten Datensätzen feintunen
Augmented SBERT
Embedding-Modelle mit ungelabelten Daten feintunen
Transformer-based Sequential Denoising Auto-Encoder (TSDAE)
TSDAE zur Domain Adaptation nutzen
Zusammenfassung
11 Representation-Modelle für die Klassifikation feintunen
Klassifikation mit gelabelten Daten
Ein vortrainiertes BERT-Modell feintunen
Schichten eines Modells einfrieren
Few-Shot-Klassifikation
SetFit - Modelle mit nur wenigen Trainingsbeispielen auf effiziente Weise feintunen
Modelle für die Few-Shot-Klassifikation feintunen
Bereits vortrainierte Modelle mittels Masked Language Modeling weiter vortrainieren
Named-Entity Recognition
Daten für die Named-Entity Recognition aufbereiten
Modelle für die Named-Entity Recognition feintunen
Zusammenfassung
12 Generative Modelle feintunen
Die drei Schritte beim Training von LLMs - Pretraining, Supervised Fine-Tuning und Preference Tuning
Supervised Fine-Tuning (SFT)
Vollständiges Feintuning (Full Fine-Tuning)
Parameter-efficient Fine-Tuning (PEFT)
Instruction Tuning mit dem QLoRA-Verfahren
Instruktionsdaten über ein Template bereitstellen
Modelle quantisieren
Die Konfiguration für das LoRA-Verfahren festlegen
Die Parameter für das Training festlegen
Das Modell trainieren
Gewichte des QLoRa-Modells mit denen des Basismodells zusammenführen
Generative Modelle evaluieren
Metriken auf Wortebene
Benchmarks
Leaderboards
Automatisierte Evaluierung
Evaluierung durch Menschen
Modelle darauf ausrichten, was Nutzer erwarten - Preference Tuning, Alignment und Reinforcement Learning from Human Feedback
Die Preference Evaluation mithilfe von Reward-Modellen automatisieren
Die Ein- und Ausgaben des Reward-Modells
Ein Reward-Modell trainieren
Preference Tuning ohne zusätzliches Training eines Reward-Modells
Preference Tuning mittels DPO
Templates für Präferenzdatensätze erstellen
Das Modell quantisieren
Parameter für das Training festlegen
Das Modell trainieren
Zusammenfassung
Schlussbemerkung
Fußnoten
Index

System requirements

Save as PDF Copy link into clipboard

Schweitzer Fachinformationen

Praxisbuch Large Language Models

Description

More details

Other editions

Additional editions

Persons

Content

System requirements