office@sdil.de

0721 608-41706

PipesAI: Strukturierung und Ausführung von ML-Trainingspipelines und deren Versionierung

PipesAI ist eine leichtgewichtiges Python-Framework, welches eine einfache Möglichkeit zur Erstellung von Pipelines für Datenverarbeitungs- und Analyseaufgaben bietet. Es ermöglicht es, die Pipelines schnell und einfach zu testen und zu validieren, um sicherzustellen, dass die Daten korrekt verarbeitet und generiert werden.

Dafür definiert PipesAI klare Verantwortungsbereiche für die Datenbereitstellung und den Datenzugriff in Form von Ressourcen und deren Lese-/Schreibzugriff sowie für die Datenverarbeitung und -generierung in Form von sog. Stages. Dadurch wird auch eine klare und entkoppelte Möglichkeit zur Formulierung von Unittests für bestimmte Stages bereitgestellt, um sicherzustellen, dass jede Stage in der Pipeline die gewünschten Daten generiert.

Die Bibliothek ermöglicht es Entwicklern, Pipelines für eine Vielzahl von Anwendungen zu erstellen, von der Datenverarbeitung und -analyse bis hin zur maschinellen Lernmodellierung. Dabei wird ein hohes Maß an Abstraktion bereitgestellt welches die Implementierung vereinfacht und die Code-Wartung erleichtert.

Kontakt: constanze.hasterok [at] iosb.fraunhofer.de