Feeds:
Posts
Comments

Posts Tagged ‘ETL’

Oleh : Diana (1112400710)

PENDAHULUAN
Saat ini persaingan bisnis semakin ketat, analisis data merupakan salah satu faktor yang menentukannya. Perusahaan harus dapat menganalisis data perusahaannya dengan tepat dan cermat agar dapat bertahan dalam persaingan bisnis. Analisis data yang dilakukan perusahaan akan digunakan dalam pengambilan keputusan. Dimana saat ini pengambilan keputusan yang mengandalkan intuisi sudah tidak dapat digunakan lagi, mengingat lingkungan bisnis dewasa ini semakin rumit. Penjualan suatu produk tidak hanya ditentukan oleh harga dan kualitas produk saja, banyak faktor lain yang ikut ambil bagian seperti karakteristik pelanggan, faktor geografi, musim, dan lain sebagainya. Karena faktor-faktor di atas perusahaan membutuhkan sebuah alat bantu yang dapat digunakan untuk mengolah data untuk menjadi informasi yang kelak akan menjadi pengetahuan yang dapat digunakan oleh perusahaan dalam mengambil keputusan. Salah satu alternatif yang dapat digunakan adalah dengan menggunakan business inteligence (BI).
Untuk bisa membangun sistem business intelligence yang baik, banyak hal yang harus diperhatikan mulai dari tahap pengembangan business intelligence,lingkungan dari business intelligence, dan tools yang digunakan.
Banyak perusahaan di indonesia yang masih belum menggunakan business intelligence dalam membantu perusahaan dalam pengambilan keputusan. Contohnya pada perusahaan penyedia pinjaman untuk kredit mobil yang masih menggunakan cara tradisional dalam penentuan kelayakan pinjaman customernya. Dengan menggunakan business intelligence, perusahaan penyedia pinjaman kredit untuk pembelian mobil (leasing) bisa menentukan dengan mudah pelanggan mana yang layak untuk diberikan pinjaman dengan lebih hasil yang lebih cepat dan tepat. Dengan kata lain business intelligence membuat sebuah pekerjaan menjadi lebih efisien dan efektif.

BUSINESS INTELLIGENCE

Definisi Business Intelligence menurut Powers adalah sebagai berikut:
Business Intelligence adalah suatu konsep dan metode bagiamana caranya untuk meningkatkan kualitas pengambilan keputusan bisnis berdasarkan sistem yang berbasiskan data. BI seringkali dipersamakan sebagaimana briefing books, report and query tools, dan sistem informasi eksekutif [12].”
Dengan kata lain, Business inteligence (BI) adalah sebuah bentuk implementasi yang dapat digunakan oleh perusahaan untuk mengolah data menjadi informasi, kemudian diolah lagi menjadi pengetahuan yang akan membantu proses analisis data perusahaan secara lebih efektif. Contohnya adalah dengan Business Intelligence perusahaan dapat mengetahui ramalan penjualan perusahaan dalam beberapa waktu mendatang sehingga perusahaan dapat melakukan perencanaan untuk meningkatkan profit perusahaan.
Business Intelligence merupakan sebuah istilah umum yang dapat terdiri dari proses pengumpulan data, penyediaan akses, serta analisa data. Business Intelligence dapat membantu suatu organisasi dalam mendapatkan informasi yang kemudian akan menjadi pengetahuan perusahaan tentang hal-hal yang berhubungan dengan perusahaan yang dapat mempengaruhi kinerja perusahaan sehingga dapat digunakan oleh organisasi dalam membantu pengambilan keputusan. Selain itu Business Intelligence juga dapat digunakan untuk membantu organisasi dalam mengetahui tren yang sedang terjadi sehingga dapat digunakan oleh organisasi dalam penentuan strategi perusahaan agar organisasi siap menghadapi tren pasar yang dinamis.

Konsep dari business intelligence menekankan pada 5 pendayagunaan informasi yang digunakan untuk kerperluan bisnis[1]. 5 Pendayagunaan tersebut antara lain adalah sebagai berikut:

  1. Data sourcing
    Dalam hal ini Business intelligence memiliki kemampuan untuk dapat mengakses berbagai sumber data dan informasi yang berada pada sejumlah sumber yang berbeda dimana pada setiap sumber memliki format penyimpanan data yang berbeda pula.
  2. Data analysis
    Dalam hal ini intelligence memiliki kemampuan untuk dapat menganalisis data yang didapatkan dari aktivitas perusahaan dan informasi dari perusahaan sehingga dapat dijadikan sebuah pengetahuan yang kelak dapat digunakan perusahaan untuk meningkatkan kinerja perusahaan.
  3.  Situation awareness
    Dalam hal ini Business Intelligence memiliki kemampuan untuk dapat menyediakan sebuah sistem yang dapat digunakan untuk mencari dan memberikan data serta informasi yang dibutuhkan oleh perusahaan ketika perusahaan menghadapi kejadian darurat atau terdesak.
  4. Risk analysis
    Dalam hal ini Business Intelligence memiliki kemampuan untuk dapat memberikan perhitungan resiko yang akan dihadapi perusahaan terhadap berbagai kemungkinan yang terjadi akibat dari pilihan-pilihan tertentu yang diambil oleh perusahaan.
  5. Decision support
    Dalam hal ini Business Intelligence memiliki kemampuan untuk dapat memberikan pertimbangan- pertimbangan yang dapat digunakan untuk membantu perusahaan dalam pengambilan keputusan yang dapat menghasilkan keputusan-keputusan yang berkualitas yang diambil berdasarkan berbagai perhitungan dan pengolahan terhadap data atau informasi baik internal maupun eksternal yang dimiliki oleh perusahaan.

TAHAP PENGEMBANGAN BI
Pengembangan Business intelligence terdiri dari 16 tahap yang terbagi menjadi 6 bagian yaitu justification, planning, business analysis, design, construction, dan deployment. Tahap tersebut dapat dilihat dari gambar  1 berikut ini:

“]

Banyak tools yang dapat digunakan dalam pengembangan Business Intelligence, salah satunya adalah dengan SQL server 2005. SQL server 2005 terdiri dari integration services, analysis services, dan reporting services.

  • SQL Server Integartion Services (SSIS)
    Adalah tools yang digunakan untuk menjalankan proses ETL ( Extract, Transform, Loading). Dalam proses ETL akan dilakukan proses extract yang akan digunakan mengumpulkan data dari berbagai sumber, kemudian juga terjadi transaksi transform yang akan digunakan untuk proses pembersihan data, dan proses loading yaitu proses penyimpanan data ke database datawarehouse.
  • SQL Server Analysis Services (SSAS)
    Dari proses ETL maka proses akan dilanjutkan dengan proses penyajian data dan analisis data. SSAS adalah teknologi yang dapat digunakan untuk menangani data mining dan OLAP. Proses OLAP dilakukan berupa viewing data dengan membuat multidimensional expression(MDX) , data mining extensin (DMX), dan XML untuk analisis[5][8]. Pembangunan OLAP dilakukan dengan Business Intelligence development studio(BDIS) yang akan digunakan untuk membantu komponen utama dari proses analysis service[8].
  • SQL Server Repporting Services (SSRS)
    SSRS adalah sebuah platform  laporan berbasis server yang digunakan untuk menyediakan fungsionalitas pembuatan laporan dari berbagai sumber data. SSRS memberikan fasilitas untuk membuat laporan, mengatur dan mengirim laporan, memudahkan pengguna untuk mengintegrasikan laporan dengan berbagai pengaturan[8]. Pada intinya, SSRS merupakan sebuah fitur yang dapat digunakan untuk menampilkan data dari database.

KEUNTUNGAN PENGGUNAAN SQL SERVER 2005
Business Intelligence digunakan untuk mengatasi berbagai permasalahan yang dihadapi oleh perusahaan. Sangat tidak dipungkiri lagi bahwa Business Intelligence diperlukan dalam setiap bagian dari perusahaan yang harusnya sudah tertanam dalam setiap langkah bisnis perusahaan agar perusahaan dapat mencapai tujuan perusahaan secara lebih efisien dan efektif sehingga keuntungan perusahaan pun akan meningkat.
Berikut ini adalah tantangan yang dimiliki pleh perusahaan yang dapat diatasi oleh Business Intelligence dengan menggunakan SQL 2005:

  1. Business Intelligence dapat mengatasi berbagai sumber data yang digunakan oleh perusahaan. Contohnya ERP, CRM, SCM yang berasal dari vendor berbeda dan mungkin saja memiliki skema, terminologi, bahkan database yang berbeda pula. Bagaimana caranya agar para pengambil keputusan dapat melihat dan menganalisa data yang berasal dari berbagai sumber tersebut, solusinya dapat diberikan oleh business intelligence. Dimana dalam Business Intelligence terdapat Unified dimensional model (UDM) yang dapat membuat organisasi dapat melihat pandangan holistik dari data yang berbeda. UDM membuat perusahaan dapat menghadapi model data kompleks dari berbagai sumber dan membuat laporan serta melakukan analisis multidimensional[8]. Dengan ini perusahaan akan mendapatkan keuntungan dari relational report yang memudahkan agregasi OLAP serta analisis yang lebih baik terhadap data.
  2. Setiap perusahaan tentu saja memiliki lebih dari satu datamart, hal ini kebanyakan membuat perusahaan kesulitan dalam melakukan maintenance datamart tersebut dimana akan menimbulkan biaya yang tentu saja akan memberatkan perusahaan. Dalam Business Intelligence terdapat UDM yang dapat dilihat berdasarkan user yang melihatnya (perspektif)[8]. Perspektif ini memungkin UDM tersegmentasi beradasarkan kebutuhan departemen-departemen yang ada sehingga dapat menjaga kebutuhan dari masing-masing departemen memiliki data mart sendiri-sendiri.
  3. Datawarehouse saat ini memiliki struktur yang kaku yang memungkinkan dilakukan drill down dan rollup data[8]. Dengan kemapuan ini user dapat melakukan analisis terhadap data dan menjawab pertanyaan-pertanyaan yang dimilikinya. Hal ini tentu saja membuat kebutuhan akan TI menjadi hilang. Dengan itu maka dibangun konsep multidimensional dimensi yang memungkinkan 1 data fakta terhubung dengan record dari banyak dimensi yang memungkinkan analisis kompleks dan powerful dengan permodelan yang mudah.
  4. Bila data yang berbeda misalnya mata uang di negara lain digabungkan datanya akan menjadi data yang aneh karena tidak akan mungkin satu mata uang digabungkan dengan mata uang lain, sehingga Business Intelligence membuat sebuah sistem yang dapat membuat pengguna dapat melihat konversi dari suatu nilai ke nilai lain yang tentu saja menjadi keuntungan perusahaan katena perusahaan dapat mengurangi space dan membuat perusahaan bersifat enterprise[8].
  5. Data perusahaan dibutuhkan secara real time, namun dengan kebutuhan tersebut biasanya terjadi masalah pada performa perusahaan dan memberatkan kerja OLTP. Dengan Business Intelligence dibuatlah proaktif caching yang digunakan sehingga ketika terjadi transaksi akan dilakukan pengiriman notofikasi ke UDM dan terdapat triger yang akan membuat dilakukan sinkronisasi data[8].

LINGKUNGAN BUSINESS INTELLIGENCE
Lingkuangan dari BI juga mereupakan salah satu faktor penting dalam pengembangan suatu proyek BI. Lingkungan dari sebuah Business Intelligence dapat dilihat dari gambar berikut ini:

“]

Business modelling [13]menggambarkan tentang keseluruhan proses bisnis dan masalah uang dihadapi serta bagaimana aliran dari kebutuhan informasi. Untuk membantu business modelling ini akan digunakan bisnis model yang digunakan untuk memberikan informasi secara grafis  bagi anggota perusahaan agar dapat mengerti tentang rule dan proses bisnis perusahaan.

Data modelling [14]digunakan untuk menggambarkan entity dan relasi yang disajikan dalam data model yang biasanya dalam bentuk data visual.

ETL [3] adalah proses untuk menarik data dari sumber melakukan pembersihan data dan penyimpanan data ke datawarehouse.

Datawarehouse [3] adalah tempat penyimpana dari ringkasan data historis perusahaan. Datawarehouse memiliki sifat sebagai berikut: subject oriented, non volatile, time variant, dan integrated.

Datamart [3] merupakan bagian dari datawarehouse yang diambil dari analisa proses bisnis tertentu di perusahaan. Contoh datamart penjualan dalam sebuah perusahaan.

OLAP
Online Analytical Processing (OLAP) merupkan kunci dari sebuah Business Intelligence. OLAP digunakan untuk menganalisis data dan informasi yang kemudian akan digunakan sebagai dasar dari decision suport sistem di sebuah perusahaan. Dengan kata lain OLAP adalah alat pembantu decision support sistem dalam sebuah perusahaan. Selain itu OLAP juga digunakan untuk membantu Eksekutif information system (EIS) dalam sebuah perusahaan. OLAP digunakan mulai dari pembuatan laporan sampai pada decision support. OLAP juga dapat digunakan untuk data mining dimana OLAP dapat digunakan untuk membantu menemukan hubungan antar item yang ada.
Dengan menggunakan OLAP, pengguna dapat melihat sebuah data dengan berbagai sudut pandang karena data yang ada pada OLAP disimpan dalam bentuk  multidimensi [3] tidak seperti pada basis data relational. Apa saja yang dilakukan oleh OLAP? OLAP dapat men-generate query, membuat laporan yg ad hoc, mendukung analisis statistik dan interaktif serta membuat aplikasi multimedia.

OLAP tidak membutuhkan space yang besar seperti pada datawarehouse, karena  tidak perlu dilakukan analisis tren untuk semua transaksi. Untuk membuat sebuah OLAP data akan diambil dari databiase relational. OLAP memiliki beberapa kemampuan seperti roll up, drill down, filtering, aggregation, pivoting serta slicing dan dicing [7].

Data Mining
Data mining ditujukan untuk mencari pola penting dari data yang tidak bisa kita temukan secara langsung mengingat jumlah data yang sangat beragam dan faktor-faktor yang dapat mempengaruhi pola-pola tersebut. Tujuan menggunakan data mining adalah agar pola-pola tersebut dapat dimanfaatkan untuk menghasilkan sesuatu yang berguna bagi perusahaan [15]. Coba dibayangkan berapa banyak data yang ada dalam sebuah perusahaan, jika data tersebut tidak digunakan maka data tersebut hanya akan menjadi sebuah tumpukan data yang tidak ada nilainya. Padahal dengan data mining tumpukan data tersebut dapat dianalisis sehingga dihasilkan pola yang dapat digunakan untuk melakukan prediksi terhdapat perusahaan di masa yang akan datang.
Data mining melakukan proses analisis terhadap tumpukan data yang ada, namun proses analisisnya tidak sama dengan proses analisis statistik biasa karena dalam data mining tidak dilakukan penarikan hipotesis seperti pada analisis statistik, persamaan-persamaan yang ada di dalam algoritma data mining tidak perlu dikembangkan secara manual seperti pada analisis statistik, tools yang ada pada data mining tidak hanya bisa digunakan untuk data- data numerik saja, sumber data pada data mining juga harus sudah merupakan data yang bersih.

Ada 6 operasi yang biasanya digunakan dalam data mining yaitu[2]:

  1. Asosiasi yang digunakan untuk mengenali perilaku yang ada pada kejadian khusus yang terjadi.
  2. Klasifikasi yang digunakan untuk mengenali perilaku atribut dari kelompok yang telah dibuat.
  3. Regresi atau sering disebtu forecasting digunakan untuk memperkirakan nilai di masa mendatang berdasarkan data yang ada sebelumnya.
  4. Time series atau disebut juga dengan forecasting digunakan sama dengan regresi namun perkiraan data hanya bergantung pada waktu.
  5. Cluster digunakan untuk melakukan pengelompokan seperti klasifikasi dengan menggunakan neural network atau statistik.
  6. Sequence digunakan mirip dengan asosiasi namun kejadian-kejadian yang terjadi akan dihubungkan.

Gambaran hubungan antara business intelligence, data mining dan OLAP dapat dilihat dari gambar berikut ini:

Gambar 3. Hubungan Antara Business Intelligence, Data Mining, dan OLAP [11]

Penggunaan Decision Tree
Paper ini juga akan membahas tentang penggunaan Business Intelligence dengan menggunakan salah satu algoritma data mining, yaitu dengan menggunakan decision tree. Decision tree termasuk dalam kategori klasifikasi[9]. Dalam proses klasifikasi, suatu objek akan dikategorikan ke dalam suatu kategori yang telah ditentukan sebelumnya.

Gambar 4. Pengklasifikasian dalam Decision Tree

Decision tree terdiri dari kumpulan decision node. Dimana setiap node akan dihubungkan oleh cabang. Node yang teratas disebut root node sedangkan yang paling bawah disebut sebagai leaf node. Saat proses decision tree berjalan semua node pada tree akan dievaluasi. Dalam decision tree, akan dilakukan pembagian sekumpulan variabel independen ke kelompok-kelompok yang lebih kecil lagi. Proses tersebut akan dilakukan berulang  di setiap cabang dari tree untuk memilih variable independen yang memiliki keterkaitan yang kuat dengan variable dependen berdasarkan suatu kriteria yang diinginkan. Model dari decision tree yang dibuat akan bergantung pada komposisi data dalam data yang akan di training dan di testing (training dan testing set)[6][9].

Lebih dari 20 tahun, China telah membangun teknologi informasi. Saat ini informasi telah menjadi sangat populer di perusahaan China. Pada awal tahun 2010, UFIDA dan Departemen Perindustrian dan Teknologi Informasi dipelajari dan diterbitkan laporan penelitian  China Enterprises indeks ICT 2009. Laporan ini menunjukan bahwa alasan utama rendahnya level data dari perusahaan china karena perusahaan tidak dapat mengetahui dengan jelas tahap pengembangan dan tahap penerapan informasi di perusahaan[6].

“]

Konstruksi dan aplikasi dari informasi dan pengembangan bisnis masih rendah dan tidak digunakan untuk jangka panjang. Ruang lingkup dari informasi perusahaan masih kecil, kebanyakan informasi fokus pada bagian dari bisnis yang tidak mampu menunjukan efektifnya seluruh informasi. Secara keseluruhan kematangan teknologi informasi China tidak tinggi sehingga sangat penting untuk meningkatkan tingkat ICT.
Kita perlu menetapkan model yang dapat memilih indikator yang paling penting dari sejumlah indikator ICT perusahaan. kemudian kita menggunakan indikator penting sebagai tujuan utama untuk target yang lebih tinggi[6].
21 indikator tersebut digunakan oleh perusahaan untuk melakukan analisis tree (lihat gambar 5). Sehingga akan diketahui atribut-atribut yang dapat memberikan perolehan informasi. Dengan kata lain, atribut yang lebih penting bagi perusahaan yang dapat meningkatkan perusahaan dapat kita temukan.

Bagaimana cara menentukan indikator tersebut? Perhitungan untuk total nilai dari indikator dasar dari ICT perusahaan[6], adalah sebagai berikut;
Keterangan
= nilai dari indikator I (max 100)

= bobot dari indikator (max 100%)

Indikator dibagi menjadi 5 kategori yaitu:
–          Strategic position : 10%
–          Infrastruktur : 20%
–          Aplication Status dan Benefit index = 50%
–          Human resources= 15%
–          Security = 5%
Zaman sekarang mobil dirasakan menjadi kebutuhan utama, terutama di kota besar seperti jakarta. Banyak masyarakat yang belum memiliki cukup uang, namun membutuhkan mobil sebagai alat transportasi. Sehingga jalan yang dapat digunakan untuk mereka dapat memiliki mobil adalah dengan mengajukan pinjaman kredit pembayaran mobil. Pihak bank sebagai penyedia dana, harus selektif dalam memilih pelanggan mana yang layak ataupun tidak untuk diberikan pinjaman.
Metode decision tree seperti ini dapat digunakan ke dalam perusahaan-perusahaan di indonesia untuk dapat memberikan pelayanan yang lebih baik ke pada pelanggan perusahaan. Misalnya saja dalam menentukan apakah seorang pelanggan layak atau tidak diberikan pinjaman untuk pembelian mobil.
Dengan decision tree kita dapat melakukan klasifikasi, mana pelanggan yang layak dan tidak layak untuk diberikan pinjaman berdasarkan berbagai atribut misalkan, gaji pegawai, alamat rumah, status pernikahan, jumlah anak, dan atribut lainnya yang dapat menentukan apakah seseorang layak diberikan kredit mobil atau tidak.

SIMPULAN
Analisis data saat ini merupakan faktor dalam penentuan keberhasilan suatu perusahaan dimana analisis ini akan digunakan oleh perusahaan dalam pengambilan keputusan. Pengambilan keputusan dengan cara tradisional yang mengandalkan intuisi sudah tidak dapat digunakan lagi mengingat semakin rumitnya lingkungan bisnis. Business intelligence adalah suatu alat yang dapat dijadikan solusi untuk permasalahan tersebut. Business intelligence dapaat digunakan untuk membantu pengambilan informasi dengan mengubah data menjadi informasi dan mengolahnya menjadi sebuah pengetahuan yang dapat digunakan untuk membantu perusahaan dalam pengambilan keputusan. Data mining adalah bagian Business intelligence yang dapat digunakan untuk membantu pengklasifikasian dari sebuah data baru berdasarkan pola yang ditemukan dari data lama yang dimiliki perusahaan. Decision tree dapat digunakan di Indonesia dalam penentuan pemberian kredit mobil. Dengan decision tree maka ada sistem yang dapat melakukan analisis terhadap customer agar berdasarkan banyak faktor seperti status, jumlah gaji, jumlah anak, dan atribut lainnya agar dapat ditentukan keputusan yang tepat apakah customer diberikan kredit mobil atau tidak.

SARAN
Untuk penelitian selanjutnya, yang perlu diperhatikan adalah bahwa decision tree memiliki kelemahan jika data yang digunakan sangat banyak karena akan terjadi overlap yang menyebabkan menurunnya kinerja sehingga waktu yang dibutuhkan dalam pengambilan keputusan akan menjadi lebih lama dan memerlukan memory yang semakin besar pula. Kelemahan lainnya yang terdapat dalam decision tree adalah pada perancangan decision tree yang optimal karena kualitas dari decision tree akan ditentukan oleh desain dari decision tree tersebut. Sehinga penelitian yang akan dilakukan selanjutnya sangat diharapkan untuk dapat mengatasi hal tersebut agar didapatkan suatu decision tree yang lebih efektif dan efisien.

Daftar Pustaka
[1]    Ebizz Asia: http://www.ebizzasia.com/0105-2003/q&a,0105-p2.htm.
[2]    Data Mining: http://en.wikipedia.org/wiki/Data_mining
[3]    OLAP: http://www.learnbi.com/bi_olap.htm
[4]    Moss, Larissa, and  Atre, Shaku.(2003).Business Intelligence Roadmap: The Complete Project Lifecycle for Decision-Support Applications.Addison Wesley.
[5]    Zhenyuan, Wu , and Haiyan, Hu.(2010). OLAP Technology and Its Business Application. Wuhan-China.
[6]   Yu,Gu, and Wenjuan,Guo.(2010).Apply the decision tree model to enterprise  informatization indicators analysis.Beijing-China.
[7]   Chaudhuri, Surajit, and Dayal, Umeshwar.(2011).An Overview of Business Intelligence  Technology. p89-98.
[8]   Ren, Zhijun. (2010). Solving Business Problems with SQL Server 2005 Analysis Services. Shanghai-China.
[9]   Abdul,Kadir. Perbandingan Performansi Algoritma Decision Tree CART dan CHAID. Bandung-Indonesia.
[10] http://www.learnbi.com/bi_env.htm
[11] http://zara-science.blogspot.com/2011/06/keterkaitan-olap-dengan-business.html
[12] http://xmannink.wordpress.com/tag/business-intelligence/
[13] http://www.learnbi.com/bi_business.htm
[14] http://www.learnbi.com/bi_data.htm
[15] http://www.learnbi.com/bi_mining.htm

Read Full Post »

Follow

Get every new post delivered to your Inbox.