Springe zum Inhalt
Ein Laptop auf dessen Bildschirm ein Bücherregal zu sehen ist.

Text Mining mit der „Temi-Box“

Das Python-Paket Temi-Box ermöglicht die Bearbeitung komplexer Text Mining-Aufgaben ohne tiefgehende Programmierkenntnisse.

Die stetig wachsende Menge digital verfügbarer Textdaten und Fortschritte in der natürlichen Sprachverarbeitung (NLP) haben Text Mining zu einer Schlüsseltechnologie gemacht. Die „Temi-Box“ ist ein modularer Baukasten für das Text Mining, der die automatisierte Textklassifikation, Themenzuordnung und Clusterbildung erleichtert, ohne dass tiefgehende Programmierkenntnisse erforderlich sind. Entwickelt anhand der Verschlagwortung und Themenzuordnung von Publikationen für die IAB-Infoplattform und finanziert durch EU-Mittel, steht sie als Open-Source-Projekt zur Verfügung. Dieser Forschungsbericht dokumentiert die Entwicklung und Anwendung der Temi-Box, veranschaulicht ihre Nutzungsmöglichkeiten und interpretiert die erzielten Ergebnisse.

IAB-Forschungsbericht 13/2025: Text Mining mit der „Temi-Box“