Big Data

Die aktuell diskutierten Ansätze im Bereich Big Data (NoSQL, Hadoop) stammen alle aus dem Open Source Bereich. Daher waren die OSBI-Anbieter die ersten, die Big Data-Erweiterungen angeboten haben.

Pentaho war der erste BI- Anbieter mit einer komfortablen Hadoop-Integration, bei der alle Verarbeitungsbausteine des ETL-Werkzeugs innerhalb des Hadoop-Clusters zur Verfügung stehen.

Dies übertrifft die aktuellen „Einbindungen“ vieler kommerzieller Anbieter, die häufig nur den Aufruf von Pig-Scripts o.ä. aus dem ihrem Werkzeug heraus erlauben, das heißt die eigentliche Hadoop-Verarbeitung muss außerhalb des Werkzeugs realisiert werden.

Ergebnisse eines Hadoop-ETL-Laufs können ohne Zwischenspeicherung als Quelle für Reports verwendet werden. Die OS ETL-Werkzeuge bieten Konnektoren für die gängigen NoSQL-Datenbanken.