ai-generated methods-of-ai exam-prep

Mo 1. Juni 2026, 10:00 · Wachsbleiche Raum 50/315 · Prüfer: Kai-Uwe Kühnberger

Schwerpunkte (mit ihm vereinbart): (Local) Search · CSP · Machine Learning.
Erlaubt: alles mitbringen (→ dieses Sheet + Paper-Cheatsheet ausdrucken!). Keine Slides nötig.


🗺️ Ablauf der gesamten Prüfung

#PhaseDauer (ca.)Was passiert
1Begrüßung / Ankommen1–2 minSmalltalk, kurz durchatmen. Nicht sofort lossprinten.
2Paper-Präsentation10–15 minDu redest weitgehend frei (siehe Redeplan unten).
3Diskussion zum PaperoffenKühnberger hakt nach: Methode, Kritik, Einordnung.
4Offene AI-Diskussion + SchwerpunkteoffenBreites AI-Basiswissen + Tiefe in Search · CSP · ML.
5Abschluss / NotekurzKurze Rückmeldung.

Steuer-Trick

Lass am Ende der Präsentation bewusst Haken offen, die in deine Schwerpunkte führen (klassische Search/BFS-DFS-A*, neuro-symbolische Hybride, Scaling/ML). Dann geht die Diskussion dorthin, wo du stark bist.


⏱️ Die 15 min: 3 Blöcke (kurz vorstellen → kritisch bewerten → einordnen)

BlockZeitInhalt
1. Vorstellen~5 minRQ → Setup → gelernter Algorithmus → Ergebnisse
2. Kritisch bewerten~4 minStärken + Schwächen — hier punktest du
3. Einordnen~4 minLLM-Reasoning-Debatte · Scaling/Emergence · Neuro-symbolische KI · klassische Search

Faustregel: Wenige Punkte sauber > alles aufzählen.


🎤 Block 1 — Vorstellen (~5 min, Sprech-Gerüst)

  1. Was & warum„Transformers Struggle to Learn to Search”, Saparov et al. 2024. Thema = Search, die Grundlage von Reasoning/Planning. Frage: zu wenig Daten, zu wenig Parameter, oder Architektur-Limit?
  2. Testbed — minimal: Graph-Connectivity (DAG, Start→Ziel, nächsten Knoten ausgeben). = Proof-Search in Logik (Knoten=Fakten, Kanten=Implikationen) → Untergrenze für Kompetenz.
  3. Schwierigkeit = Lookahead — wie weit vorausschauen, bevor man den 1. Zug sicher festlegt. Limitless data → „zu wenig Daten” ausgeschlossen.
  4. Methodischer Kern = Trainingsverteilung — Naïve → nur kleine Lookaheads → Shortcuts. Nur Balanced (Lookahead uniform, Shortcuts raus) → lernt Suche fast perfekt. 1. Botschaft: ob ein Transformer Suche lernt, hängt stark an den Daten.
  5. Echte Contribution = Mechanistic Interpretability — Activation Patching, Computation-Graph rekonstruieren ohne Algorithmus anzunehmen → gefunden: Exponential Path-Merging (jeder Knoten speichert erreichbare Menge; pro Layer Union → verdoppelt sich → Suche exponentiell in Layern ≈ transitive Hülle in log-Tiefe).
  6. 3 Ergebnisse — (i) größere Graphen → schwerer, mehr Parameter helfen nicht; (ii) CoT (DFS/Selection-Inference) → konstante Layer, scheitert aber weiter auf großen Graphen; (iii) Fazit: Scaling allein gibt keine robuste Suche → braucht anderes Training (Curriculum) / Architektur (Looped Transformers).

60-Sek-Notfallversion

„Kleine Transformer lernen Graph-Suche fast perfekt — aber nur mit künstlich balancierter Verteilung, die Shortcuts entfernt. Mechanistisch: Exponential Path-Merging (erreichbare Mengen verdoppeln pro Layer). Größere Graphen brechen das — und weder mehr Parameter noch CoT fixen es. Fazit: robuste Suche ist kein reines Scaling-Problem.”


⚔️ Block 2 — Kritik (Leitlinie: Learnability ≠ Expressivity)

  • Titel überreizt: zeigt Trainier­barkeit (Seed-Varianz, Verteilungssensitivität, Nicht-Konvergenz), nicht ein Repräsentations-Limit. Merrill & Sabharwal: CoT-Transformer können Suche darstellen (∈ P ⊇ Connectivity); das eigene Positiv-Ergebnis (Balanced) zeigt: dieselbe Architektur lernt Suche → also Daten/Optimierung, nicht Architektur.
  • Rebuttal parat: „Aber mehr Parameter helfen nicht (Fig. 7)!” → bleibt ein Trainier­barkeits-Statement im winzigen Regime, sagt nichts über Repräsentierbarkeit / Frontier-Scale.
  • Extrapolations-Lücke: dim 16, ≤60M Params — 3–4 Größenordnungen unter GPT-Klasse.
  • Mech-interp-Methode = echte, wiederverwendbare Contribution (fair bleiben → Credit geben).

🌐 Block 3 — Einordnen (Brücken in deine Schwerpunkte)

  • Reasoning vs. Pattern-Matching (Kambhampati, Bachmann & Nagarajan).
  • Scaling-Laws & Emergence — Wei vs. Schaeffer („mirage”) → Paper = Gegenbeispiel zum Scaling-Optimismus.
  • 🌟 Neuro-symbolische KI (Kühnbergers Turf!): klassische Search (BFS/DFS/A*) ist beweisbar korrekt & skaliert; gelernte Transformer nur approximativ → Argument für Hybride (Suche an symbolische Solver auslagern).
  • Brücke (Local) Search: Path-Merging = paralleler, transitive-Hülle-artiger Aufbau aller Knoten gleichzeitig — nicht sequentielle Frontier-Expansion wie BFS/DFS; ~log(L) Layer. CoT-DFS-Variante ↔ Vorlesungs-DFS.

Vor der Prüfung

Block-1-Script 3× laut mit Timer sprechen. Blöcke 2 & 3 frei aus Bullets. Tiefe via quiz_paper-transformers-search_28-05-26 + Quiz Exam Schwerpunkte.


Voll-Dossier: pruefung_paper-transformers-search_25-05-26 · Paper-Inhalt-Spick: Cheatsheet_Paper-Transformers-Search · Superlink: Methods of AI Lecture