fbpx

#scikit-learn

scikit-learn Part 10 Blog Banner

Berkenalan dengan scikit-learn (Part 10) – Multiple Preprocessing Steps Memanfaatkan Pipelines

“Pipelines are (at least to me) something I don’t think about using often, but are useful. They can be used to tie together many steps into one object. This allows for easier tuning and better access to the configuration of the entire model, not just one of the steps.” ~ Hauck T. (2014) hkaLabs: hakim-azizul.com – …

Berkenalan dengan scikit-learn (Part 10) – Multiple Preprocessing Steps Memanfaatkan Pipelines Selengkapnya »

scikit-learn Part 9 Blog Banner

Berkenalan dengan scikit-learn (Part 9) – Beragam Strategi untuk Mengisi Missing Values

“Data imputation is critical in practice, and thankfully there are many ways to deal with it.” ~ Hauck T. (2014) hakim-azizul.com – Pada postingan kali ini, kita akan membahas dan mempraktikkan beberapa strategi untung imputing (mengisi) missing values pada dataset. Beberapa strategi tersebut, yaitu strategi imputation yang umum digunakan, sudah menjadi bawaan dari scikit-learn; dan merupakan …

Berkenalan dengan scikit-learn (Part 9) – Beragam Strategi untuk Mengisi Missing Values Selengkapnya »

scikit-learn Part 8 Blog Banner

Berkenalan dengan scikit-learn (Part 8) – Binarizing Label Features

“There’s another way to work with categorical variables. Instead of dealing with the categorical variables using OneHotEncoder, we can use LabelBinarizer. This is a combination of thresholding and working with categorical variables.” ~ Hauck T. (2014) Kali ini kita akan bekerja dengan variabel kategori (categorical variables) menggunakan metode yang berbeda dari yang pernah kita bahas …

Berkenalan dengan scikit-learn (Part 8) – Binarizing Label Features Selengkapnya »

scikit-learn Part 7 Blog Banner

Berkenalan dengan scikit-learn (Part 7) – Bekerja dengan Variabel Kategori (Categorical Variables)

“Categorical variables are a problem. On one hand they provide valuable information; on the other hand, it’s probably text-either the actual text or integers corresponding to the text-like an index in a lookup table.” ~ Hauck T. (2014) Pada kali ini, kita perlu untuk merepresentasikan data teks yang kita miliki sebagai integer atau bilangan bulat, …

Berkenalan dengan scikit-learn (Part 7) – Bekerja dengan Variabel Kategori (Categorical Variables) Selengkapnya »

scikit-learn Part 6 Blog Banner

Berkenalan dengan scikit-learn (Part 6) – Membuat Binary Features dengan Metode Thresholding

“At its most fundamental, information is a binary choice. In other words, a single bit of information is one yes-or-no choice.” ~ James Gleick Di postingan yang telah lalu, kita telah membahas mengenai scaling data. Di postingan kali ini kita akan membahas mengenai cara mentransformasikan data numerik menjadi data biner (binary features/binarizer transformation), dengan menggunakan …

Berkenalan dengan scikit-learn (Part 6) – Membuat Binary Features dengan Metode Thresholding Selengkapnya »

scikit-learn Part 5 Blog Banner

Berkenalan dengan scikit-learn (Part 5) – Tambahan untuk Scaling dan Imputation Data

“Statistics are the triumph of the quantitative method, and the quantitative method is the victory of sterility and death.” ~ Hilaire Belloc Setelah kita membahas mengenai scaling data pada postingan Berkenalan dengan scikit-learn (Part 3) – Scaling Data Menjadi Standard Normal dan Berkenalan dengan scikit-learn (Part 4) – Scaling Data dengan MinMaxScaler. Kali ini kita …

Berkenalan dengan scikit-learn (Part 5) – Tambahan untuk Scaling dan Imputation Data Selengkapnya »

scikit-learn Part 4 Blog Banner

Berkenalan dengan scikit-learn (Part 4) – Scaling Data dengan MinMaxScaler

“As data scientists, our job is to extract signal from noise.” ~ Daniel Tunkelang Dari postingan sebelumnya, kita telah mengenal metode scaling data menggunakan standard normal (z-score), dengan menetapkan mean 0 dan standard deviation 1. Metode tersebut bukan metode satu-satunya untuk scaling data. Pada postingan kali ini, kita akan membahas metode lain untuk scaling data …

Berkenalan dengan scikit-learn (Part 4) – Scaling Data dengan MinMaxScaler Selengkapnya »

Social media & sharing icons powered by UltimatelySocial