fbpx

Data Preprocessing

scikit-learn Part 7 Blog Banner

Berkenalan dengan scikit-learn (Part 7) – Bekerja dengan Variabel Kategori (Categorical Variables)

“Categorical variables are a problem. On one hand they provide valuable information; on the other hand, it’s probably text-either the actual text or integers corresponding to the text-like an index in a lookup table.” ~ Hauck T. (2014) Pada kali ini, kita perlu untuk merepresentasikan data teks yang kita miliki sebagai integer atau bilangan bulat, …

Berkenalan dengan scikit-learn (Part 7) – Bekerja dengan Variabel Kategori (Categorical Variables) Selengkapnya »

scikit-learn Part 6 Blog Banner

Berkenalan dengan scikit-learn (Part 6) – Membuat Binary Features dengan Metode Thresholding

“At its most fundamental, information is a binary choice. In other words, a single bit of information is one yes-or-no choice.” ~ James Gleick Di postingan yang telah lalu, kita telah membahas mengenai scaling data. Di postingan kali ini kita akan membahas mengenai cara mentransformasikan data numerik menjadi data biner (binary features/binarizer transformation), dengan menggunakan …

Berkenalan dengan scikit-learn (Part 6) – Membuat Binary Features dengan Metode Thresholding Selengkapnya »

scikit-learn Part 5 Blog Banner

Berkenalan dengan scikit-learn (Part 5) – Tambahan untuk Scaling dan Imputation Data

“Statistics are the triumph of the quantitative method, and the quantitative method is the victory of sterility and death.” ~ Hilaire Belloc Setelah kita membahas mengenai scaling data pada postingan Berkenalan dengan scikit-learn (Part 3) – Scaling Data Menjadi Standard Normal dan Berkenalan dengan scikit-learn (Part 4) – Scaling Data dengan MinMaxScaler. Kali ini kita …

Berkenalan dengan scikit-learn (Part 5) – Tambahan untuk Scaling dan Imputation Data Selengkapnya »

scikit-learn Part 4 Blog Banner

Berkenalan dengan scikit-learn (Part 4) – Scaling Data dengan MinMaxScaler

“As data scientists, our job is to extract signal from noise.” ~ Daniel Tunkelang Dari postingan sebelumnya, kita telah mengenal metode scaling data menggunakan standard normal (z-score), dengan menetapkan mean 0 dan standard deviation 1. Metode tersebut bukan metode satu-satunya untuk scaling data. Pada postingan kali ini, kita akan membahas metode lain untuk scaling data …

Berkenalan dengan scikit-learn (Part 4) – Scaling Data dengan MinMaxScaler Selengkapnya »

scikit-learn Part 3 Blog Banner

Berkenalan dengan scikit-learn (Part 3) – Scaling Data Menjadi Standard Normal

“Statistics and numbers are no good unless you have good people to analyse and then interpret their meaning and importance.” ~ Brendan Rodgers Halo! Di postingan kali ini, kita akan membahas mengenai scaling data, yaitu salah satu metode dalam preprocessing data numerik/data angka nonkategori. Preprocessing data adalah teknik/step dalam data mining atau machine learning, untuk mentransformasikan …

Berkenalan dengan scikit-learn (Part 3) – Scaling Data Menjadi Standard Normal Selengkapnya »

Social media & sharing icons powered by UltimatelySocial