ChatGPT hat eindrucksvoll gezeigt, wie das Lernen von Auswahlstrategien auf Basis von menschliches Feedback die Performance von Sprachmodellen verbessern konnte (bei der initialen Nutzbarkeit von Chat-GPT versus dem GPT-3 Basismodell). Viele der Techniken zum...

Aktives Lernen mit Benutzerinteraktion: Skalierbare Systeme für interaktive Modellverbesserung
