fbpx

#scikit-learn

scikit-learn Part 9 Blog Banner

Berkenalan dengan scikit-learn (Part 9) – Beragam Strategi untuk Mengisi Missing Values

“Data imputation is critical in practice, and thankfully there are many ways to deal with it.” ~ Hauck T. (2014) hakim-azizul.com – Pada postingan kali ini, kita akan membahas dan mempraktikkan beberapa strategi untung imputing (mengisi) missing values pada dataset. Beberapa strategi tersebut, yaitu strategi imputation yang umum digunakan, sudah menjadi bawaan dari scikit-learn; dan merupakan …

Berkenalan dengan scikit-learn (Part 9) – Beragam Strategi untuk Mengisi Missing Values Selengkapnya »

scikit-learn Part 8 Blog Banner

Berkenalan dengan scikit-learn (Part 8) – Binarizing Label Features

“There’s another way to work with categorical variables. Instead of dealing with the categorical variables using OneHotEncoder, we can use LabelBinarizer. This is a combination of thresholding and working with categorical variables.” ~ Hauck T. (2014) Kali ini kita akan bekerja dengan variabel kategori (categorical variables) menggunakan metode yang berbeda dari yang pernah kita bahas …

Berkenalan dengan scikit-learn (Part 8) – Binarizing Label Features Selengkapnya »

scikit-learn Part 7 Blog Banner

Berkenalan dengan scikit-learn (Part 7) – Bekerja dengan Variabel Kategori (Categorical Variables)

“Categorical variables are a problem. On one hand they provide valuable information; on the other hand, it’s probably text-either the actual text or integers corresponding to the text-like an index in a lookup table.” ~ Hauck T. (2014) Pada kali ini, kita perlu untuk merepresentasikan data teks yang kita miliki sebagai integer atau bilangan bulat, …

Berkenalan dengan scikit-learn (Part 7) – Bekerja dengan Variabel Kategori (Categorical Variables) Selengkapnya »

scikit-learn Part 6 Blog Banner

Berkenalan dengan scikit-learn (Part 6) – Membuat Binary Features dengan Metode Thresholding

“At its most fundamental, information is a binary choice. In other words, a single bit of information is one yes-or-no choice.” ~ James Gleick Di postingan yang telah lalu, kita telah membahas mengenai scaling data. Di postingan kali ini kita akan membahas mengenai cara mentransformasikan data numerik menjadi data biner (binary features/binarizer transformation), dengan menggunakan …

Berkenalan dengan scikit-learn (Part 6) – Membuat Binary Features dengan Metode Thresholding Selengkapnya »

scikit-learn Part 4 Blog Banner

Berkenalan dengan scikit-learn (Part 4) – Scaling Data dengan MinMaxScaler

“As data scientists, our job is to extract signal from noise.” ~ Daniel Tunkelang Dari postingan sebelumnya, kita telah mengenal metode scaling data menggunakan standard normal (z-score), dengan menetapkan mean 0 dan standard deviation 1. Metode tersebut bukan metode satu-satunya untuk scaling data. Pada postingan kali ini, kita akan membahas metode lain untuk scaling data …

Berkenalan dengan scikit-learn (Part 4) – Scaling Data dengan MinMaxScaler Selengkapnya »

scikit-learn Part 3 Blog Banner

Berkenalan dengan scikit-learn (Part 3) – Scaling Data Menjadi Standard Normal

“Statistics and numbers are no good unless you have good people to analyse and then interpret their meaning and importance.” ~ Brendan Rodgers Halo! Di postingan kali ini, kita akan membahas mengenai scaling data, yaitu salah satu metode dalam preprocessing data numerik/data angka nonkategori. Preprocessing data adalah teknik/step dalam data mining atau machine learning, untuk mentransformasikan …

Berkenalan dengan scikit-learn (Part 3) – Scaling Data Menjadi Standard Normal Selengkapnya »

scikit-learn Part 2 Blog Banner

Berkenalan dengan scikit-learn (Part 2) – datasets.make_: Membuat Sampel Data untuk Latihan Analisis Data

“You can have data without information, but you cannot have information without data.” ~ Daniel Keys Moran Pada postingan sebelumnya (part 1), kita telah mengenal langkah-langkah persiapan dalam menggunakan library scikit-learn, dan kita juga telah tahu cara meng-import datasets bawaan dari scikit-learn. Untuk lebih menajamkan sense kita untuk mengetahui kecocokan suatu tipe datasets dengan metode …

Berkenalan dengan scikit-learn (Part 2) – datasets.make_: Membuat Sampel Data untuk Latihan Analisis Data Selengkapnya »

Social media & sharing icons powered by UltimatelySocial