Self-Supervised Learning (SSL)

Self-Supervised Learning ist ein Paradigma des maschinellen Lernens, bei dem ein Modell aus den Daten selbst Lernziele generiert — ohne manuell beschriftete Labels. Es überbrückt die Lücke zwischen überwachtem und unüberwachtem Lernen.

Details

Grundprinzip

Input: ungelabeltes Datum (Bild, Text, Video, Audio)
Aufgabe: Vorhersage eines Teils des Inputs aus einem anderen Teil
→ Keine externen Labels nötig — der Input ist sein eigenes Label

SSL-Paradigmen

MethodeIdeeBeispiel
Masked PredictionTeil verbergen → vorhersagenBERT (Text), MAE (Bild)
Contrastive LearningÄhnliche Daten annähern, verschiedene entfernenSimCLR, MoCo
Predictive SSLZukünftigen Zustand vorhersagenGPT (nächstes Token), JEPA (latent)
Cross-Modal SSLModalität A aus Modalität B vorhersagenCLIP (Text→Bild), AudioCLIP

NeuroAI-Parallele

SSL ist biologisch plausibeler als supervised learning:

Wichtige Modelle

  • BERT (Bidirectional Encoder Representations): maskiertes Sprachmodell
  • GPT (autoregressive): nächstes Token vorhersagen
  • SimCLR/MoCo: visuelles Contrastive Learning
  • DINO/DINOv2: Transformer für Vision, ohne Labels, starke Features
  • JEPA (JEPA – Joint-Embedding Predictive Architecture as World Model): Vorhersage im latenten Raum, kein Pixel-Reconstruction

Warum SSL so mächtig ist

  • Skalierbar auf unbegrenzte Datenmenge (Web = riesige ungelabelte Datenquelle)
  • Lernt robuste, transferierbare Repräsentationen
  • Grundlage für LLMs (Large Language Models): GPT-Pretraining = SSL

See also

Tags: ai machine-learning deep-learning
Superlink: 050 🧠Neuroscience

Verbindungen

Created: 06/05/26