Close
data indonesia

Perekonomian Indonesia Terbesar di Asia Tenggara

“PDB Indonesia pada 2017 untuk pertama kalinya berhasil menembus US$ 1 triliun atau sekitar Rp 15 ribu triliun.”

~ katadata.co.id

Berdasarkan data Tradingeconomics, Produk Domestik Bruto (PDB) Indonesia pada 2017 untuk pertama kalinya berhasil menembus US$ 1 triliun atau sekitar Rp 15 ribu triliun, dengan kurs Rp 15 ribu/dolar Amerika Serikat. Perekonomian Indonesia ini merupakan yang terbesar dibanding dengan negara-negara kawasan Asia Tenggara lainnya. Continue reading “Perekonomian Indonesia Terbesar di Asia Tenggara”

scikit-learn imputing missing values

Berkenalan dengan scikit-learn (Part 9) – Beragam Strategi untuk Mengisi Missing Values

“Data imputation is critical in practice, and thankfully there are many ways to deal with it.”

~ Hauck T. (2014)

hakim-azizul.com Pada postingan kali ini, kita akan membahas dan mempraktikkan beberapa strategi untung imputing (mengisi) missing values pada dataset. Beberapa strategi tersebut, yaitu strategi imputation yang umum digunakan, sudah menjadi bawaan dari scikit-learn; dan merupakan penerapan dari transformasi-transformasi sederhana pada dataset, untuk mengisi NAs (missing values). Continue reading “Berkenalan dengan scikit-learn (Part 9) – Beragam Strategi untuk Mengisi Missing Values”

machine learning approach

Proyek Machine Learning dari Hulu ke Hilir (End-to-End) – Part 1: Pendahuluan

“Machine learning is the field of study that gives computers the ability to learn without being explicitly programmed.”

~ Arthur Samuel

 

“A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance T, as measured by P, improves with experience E.”

~ Tom Mitchell

1. Pendahuluan

Di postingan kali ini, kita posisikan diri kita sebagai data scientist yang baru di-hire oleh perusahaan real estate, di USA pula, wow! Continue reading “Proyek Machine Learning dari Hulu ke Hilir (End-to-End) – Part 1: Pendahuluan”

hakim-azizul sound cloud music art other projects

5 Lagu yang Mengubah Hidup Saya – Baca Sampai Habis, Nomor 5 Bikin Kaget!

“The purpose of art: to make the unconscious conscious.”

~ Richard Wagner

“The purpose of art is washing the dust of daily life off our souls.”

~ Pablo Picasso

“Where words fail, music speaks.”

~ Hans Christian Andersen

Halo, selamat datang kembali di hakim-azizul.com, wahai Warganet yang berbahagia. Kembali lagi di sesi Intermezzo, selingan atau oase diantara luasnya padang gurun dunia teknologi data. 🙂 Continue reading “5 Lagu yang Mengubah Hidup Saya – Baca Sampai Habis, Nomor 5 Bikin Kaget!”

scikit-learn LabelBinarizer

Berkenalan dengan scikit-learn (Part 8) – Binarizing Label Features

“There’s another way to work with categorical variables. Instead of dealing with the categorical variables using OneHotEncoder, we can use LabelBinarizer. This is a combination of thresholding and working with categorical variables.”

~ Hauck T. (2014)

Kali ini kita akan bekerja dengan variabel kategori (categorical variables) menggunakan metode yang berbeda dari yang pernah kita bahas sebelum-sebelumnya. Sebelumnya kita sudah pernah membahas metode thresholding di Berkenalan dengan scikit-learn (Part 6) – Membuat Binary Features dengan Metode Thresholding dan metode encoding di Berkenalan dengan scikit-learn (Part 7) – Bekerja dengan Variabel Kategori (Categorical Variables). Dalam kasus ketika kita dihadapkan pada data yang hanya memiliki satu atau dua kategori dari feature yang penting atau berpengaruh, akan lebih bijak apabila kita menghindari extra dimensionality yang akan terjadi apabila kita memiliki banyak kategori.

Continue reading “Berkenalan dengan scikit-learn (Part 8) – Binarizing Label Features”

indonesia melek data

10 Ranah Ketimpangan Sosial Menurut INFID 2018

“Indeks ketimpangan pada 2018 berada di level 6 dari skala 0-10′ lebih tinggi dari sebelumnya di 5,6.”

~ katadata.co.id

Berdasarkan hasil survei International NGO Forum on Indonesian Development (INFID) penghasilan merupakan ranah yang paling berperan sebagai sumber ketimpangan sosial di masyarakat. Ini tercermin dari, sekitar 76% responden yang disurvei menganggap penghasilan merupakan sumber ketimpangan. Di urutan kedua adalah kesempatan dalam mendapat pekerjaan dan ketiga harta benda yang dimiliki merupakan ranah yang paling berperan pada terjadinya ketimpangan.

Continue reading “10 Ranah Ketimpangan Sosial Menurut INFID 2018”

Error Installing Packages in R

Bermasalah dalam Menginstall Packages R? Ini Solusinya! (Part 2)

“The best thing about R is that it was developed by statisticians. The worst thing about R is that…it was developed by statisticians.”

~ Bo Cowgill, Google, Inc.

Halo semuanya! Akhirnya di post kali ini, saya akan share solusi yang insyaAlloh ampuh untuk segala kegagalan dalam menginstall packages R. Sebenarnya solusinya sudah saya temukan agak lama, yaitu tepat setelah saya posting Bermasalah dalam Menginstall Packages R? Ini Solusinya!, atau 2 minggu lalu tepatnya, tapi saya baru sempat tuliskan sekarang. Dan juga, karena terlalu senang karena problem solved, saya malah lupa segera screenshot beberapa langkah-langkahnya, hehehe. Continue reading “Bermasalah dalam Menginstall Packages R? Ini Solusinya! (Part 2)”

variabel kategori categorical variable

Berkenalan dengan scikit-learn (Part 7) – Bekerja dengan Variabel Kategori (Categorical Variables)

“Categorical variables are a problem. On one hand they provide valuable information; on the other hand, it’s probably text-either the actual text or integers corresponding to the text-like an index in a lookup table.”

~ Hauck T. (2014)

Pada kali ini, kita perlu untuk merepresentasikan data teks yang kita miliki sebagai integer atau bilangan bulat, untuk machine learning model kita, tapi kita tidak bisa sembarang menggunakan field/kolom “id”, atau sembarang merepresentasikannya. Hal ini dikarenakan, kita perlu menghindari problem yang sama dengan yang kita hadapi pada Berkenalan dengan scikit-learn (Part 6) – Membuat Binary Features dengan Metode Thresholding. Jika kita memperlakukan data yang kontinu, data tersebut juga harus direpresentasikan sebagai data yang kontinu.

Continue reading “Berkenalan dengan scikit-learn (Part 7) – Bekerja dengan Variabel Kategori (Categorical Variables)”

array

Array

“Array is a data-structure that can be used to store many items in one place.”

~ Codility

Array adalah struktur data (data structure) yang dapat digunakan untuk menyimpan banyak item dalam satu tempat penyimpanan. Sebagai contoh, adalah daftar belanjaan yang ingin kita beli. Kita tidak menyimpan daftar produk-produk yang ingin kita beli dalam halaman kertas terpisah; kita menuliskan/menyimpannya dalam satu lembar kertas saja.

Continue reading “Array”

iterasi

Iterasi

“In programming, iterating means repeating some part of your program.”

~ Codility

Catatan: Materi tentang iterasi di postingan kali ini sebagian besar diambil dan diterjemahkan dari Codility – Chapter 1, untuk tujuan edukasi dan non-profit. Terdapat beberapa bagian yang diperbarui menjadi kode menggunakan Python 3, karena potongan kode yang terdapat pada modul Codility menggunakan pseudocode, atau Python 2. Continue reading “Iterasi”

Social media & sharing icons powered by UltimatelySocial