Sunday, 8 March 2015

Kettle / Pentaho Data Integration

Kettle adalah aplikasi ETL (Extract, Transformation and Load) open source yang sangat populer, dan merupakan salah satu yang terbaik di pasar BI dunia saat ini.

Khusus di Indonesia, Kettle telah banyak digunakan sebagai tool standar untuk pengolahan data. Khususnya ketika pengembangan ERP atau sistem transaksional "kalah" cepat dengan perkembangan proses bisnis yang super dinamis.


Kettle merupakan bagian dari aplikasi Pentaho. Proyek ini berdiri sendiri dan merupakan inisiatif dari Matt Casters sebelum diakuisisi oleh Pentaho pada tahun 2006. Matt sampai saat ini tetap aktif sebagai project leader dari Kettle.

Sejak diakuisisi, Kettle berubah nama menjadi Pentaho Data Integration (PDI).

Komponen Kettle

Kettle terdiri dari 4 aplikasi, yaitu :

  • Spoon, yaitu aplikasi grafis berbasis swing yang digunakan untuk merancang file skema job dan transformation
  • Pan, yaitu script yang digunakan untuk menjalankan file skema transformation melalui terminal / command line
  • Kitchen, yaitu script yang digunakan untuk menjalankan file skema job melalui terminal / command line
  • Carte, yaitu temporary web server yang digunakan untuk mengeksekusi job/transformation secara cluster atau parallel

Kesemua aplikasi tersebut di atas dijalankan melalui shell atau batch script yang berkaitan.

Fitur-fitur Kettle


  • Memiliki utilitas grafik yang dapat digunakan merancang  control flow umum maupun data flow (aliran data).
  • Multi platform - karena dikembangkan di atas Java yang notabene berjalan di banyak platform sistem operasi.
  • Bersifat concurrent, dalam arti row-row data diambil oleh suatu step dan diserahkan ke step lain secara parallel.
  • Scalable - dapat beradaptasi dengan penambahan kapasitas memori RAM atau pun storage (scale up) dan dapat node komputer / cluster (scale out).
  • Koleksi step transformation dan job yang cukup banyak
  • Extensible, kita dapat membuat step transformation dan job baru dengan sistem plugin.
  • Dukungan luas berbagai produk database yang terkenal di pasaran baik itu proprietary maupun free open source seperti Oracle, SQL Server, MySQL, PostgreSQL dan lain sebagainya.



Sumber : http://pentaho.phi-integration.com/kettle

No comments:

Post a Comment