Bermain Twitter dengan R (Part 1) – Preparations

Data Scientist, Data Science, Machine Learning, Statistics, Data Science Indonesia, Data Analytics, Data Analysis, Data Analyst, Data, Astronomy, Astronomer, Science, Python, iPython, Jupyter Notebook, R, RStudio, Excel, Coding, Koding, Cara Mengolah Data, Mengolah Data, Olah Data, Programming, Pemrograman, Sains, Teknologi, Ilmu Data, Teknologi Informasi, Tech in Asia, Teknologi, Technology, Sains, Bisnis, Business, Business Analyst, Business Analysis, Social Media Mining, Movie Review, Muhammad Azizul Hakim, Aziz

“That is the central tenet of twenty- first-century Western philosophy: “I tweet, therefore I am.””

~ John O’Farrell

Siapa bilang Data Scientist dan Data Analyst tidak pernah bermain social media? πŸ˜›

Sosial media adalah channel untuk komunikasi massa, seperti media promosi brand, maupun media untuk berbagi konten oleh masyarakat kekinian. Kepopuleran sosial media meningkat secara eksponensial setiap waktunya, dengan pembengkakkan pengguna online dan produksi data yang sangat masif pula. Hal-hal inilah yang menjadikan social media data menjadi ladang emas untuk menggali insights, oleh para Data Scientist maupun periset pada umumnya.

Jadi, jawabannya, iya. Kami pun bermain social media, mungkin caranya saja yang agak berbeda. πŸ˜€

Pada postingan kali ini, kita akan melakukan langkah-langkah persiapan untuk berinteraksi dengan Twitter API, menggunakan R.

Silakan teman-teman kunjungi https://apps.twitter.com/app/new terlebih dahulu untuk membuat aplikasi Twitter anda (jika sudah pernah buat, silakan diskip saja, kita hanya membutuhkan API key, dll yang akan dibahas kemudian), yang akan kita pergunakan untuk langkah-langkah berikutnya (silakan dicoba sendiri ya pembuatannya, mudah kok, dan silakan googling apabila menemui kesulitan, googling also important part of learning in these days :P).

Data Scientist, Data Science, Machine Learning, Statistics, Data Science Indonesia, Data Analytics, Data Analysis, Data Analyst, Data, Astronomy, Astronomer, Science, Python, iPython, Jupyter Notebook, R, RStudio, Excel, Coding, Koding, Cara Mengolah Data, Mengolah Data, Olah Data, Programming, Pemrograman, Sains, Teknologi, Ilmu Data, Teknologi Informasi, Tech in Asia, Teknologi, Technology, Sains, Bisnis, Business, Business Analyst, Business Analysis, Social Media Mining, Movie Review, Muhammad Azizul Hakim, Aziz

Sumber Gambar: Pengalaman Pribadi.

Yang paling kita butuhkan dari penggunaan API ini adalah:

  • API Key
  • API Secret
  • Access token
  • Access token secret

Selanjutnya, buka RGui atau R Console anda, atau RStudio juga boleh.

*catatan penting: Library yang dipergunakan pada pembahasan kali ini paling cocok dengan R versi 3.1.0 “Spring Dance”, anda perlu mengupgrade atau downgrade versi R anda, jika menemui kesulitan dalam menginstall library (author juga mengalami, huhu). πŸ™‚

Data Scientist, Data Science, Machine Learning, Statistics, Data Science Indonesia, Data Analytics, Data Analysis, Data Analyst, Data, Astronomy, Astronomer, Science, Python, iPython, Jupyter Notebook, R, RStudio, Excel, Coding, Koding, Cara Mengolah Data, Mengolah Data, Olah Data, Programming, Pemrograman, Sains, Teknologi, Ilmu Data, Teknologi Informasi, Tech in Asia, Teknologi, Technology, Sains, Bisnis, Business, Business Analyst, Business Analysis, Social Media Mining, Movie Review, Muhammad Azizul Hakim, Aziz

Sumber Gambar: Pengalaman Pribadi.

Library terpenting yang akan kita pakai adalah twitteR. Sebelumnya, mari kita install dulu satu-persatu libraries yang menjadi requirementnya:

#requirements untuk install library twitteR
install.packages('devtools', repos='http://cran.us.r-project.org')
install.packages('rjson', repos='http://cran.us.r-project.org')
install.packages('bit64', repos='http://cran.us.r-project.org')
install.packages('DBI', repos='http://cran.us.r-project.org')

Selanjutnya, import library devtools, sehingga kita bisa menginstall library twitteR melalui github.

#import library devtools, agar bisa menjalankan fungsi install_github (install library dari github)
library(devtools)

install_github("geoffjentry/twitteR")

Selanjutnya, import library twitterR, dan masukkanlah API credentials anda, pastikan sama persis dengan yang tercantum pada aplikasi Twitter yang telah anda buat:

library(twitteR)

#key & access tokens
api_key<- "masukkan api_key anda"
api_secret<- "masukkan api_secret anda"
access_token<- "masukkan access_token anda"
access_token_secret<- "masukkan access_token_secret anda"

setup_twitter_oauth(api_key,api_secret,access_token,access_token_secret)

Tampilan pada konsol, kurang lebih sebagai berikut:

Data Scientist, Data Science, Machine Learning, Statistics, Data Science Indonesia, Data Analytics, Data Analysis, Data Analyst, Data, Astronomy, Astronomer, Science, Python, iPython, Jupyter Notebook, R, RStudio, Excel, Coding, Koding, Cara Mengolah Data, Mengolah Data, Olah Data, Programming, Pemrograman, Sains, Teknologi, Ilmu Data, Teknologi Informasi, Tech in Asia, Teknologi, Technology, Sains, Bisnis, Business, Business Analyst, Business Analysis, Social Media Mining, Movie Review, Muhammad Azizul Hakim, Aziz

Sumber Gambar: Pengalaman Pribadi.

Berikutnya, mari kita pastikan semuanya sudah tersetup dengan baik, dengan menjalankan scripts menyenangkan berikut:

#search tweets "piala dunia"
pialaDunia = searchTwitter("piala dunia", since="2018-06-14")

#print it on screen
head(pialaDunia,10)

#find metadata for the top post
str(pialaDunia[1])

Script di atas, berguna untuk mencari tweet tentang “piala dunia” sejak 14 Juni 2018, dan menampilkan sepuluh tweet teratas pada console anda, lalu menampilkan metadata (data/detail tentang data, halah bahasane :D) dari tweet pertama/teratas. Let’s see them in actions!

Penampakkan sepuluh tweet teratas, pada R Console:

Data Scientist, Data Science, Machine Learning, Statistics, Data Science Indonesia, Data Analytics, Data Analysis, Data Analyst, Data, Astronomy, Astronomer, Science, Python, iPython, Jupyter Notebook, R, RStudio, Excel, Coding, Koding, Cara Mengolah Data, Mengolah Data, Olah Data, Programming, Pemrograman, Sains, Teknologi, Ilmu Data, Teknologi Informasi, Tech in Asia, Teknologi, Technology, Sains, Bisnis, Business, Business Analyst, Business Analysis, Social Media Mining, Movie Review, Muhammad Azizul Hakim, Aziz

Sumber Gambar: Pengalaman Pribadi.

Penampakkan metadata dari tweet pertama/teratas, pada R Console:

Data Scientist, Data Science, Machine Learning, Statistics, Data Science Indonesia, Data Analytics, Data Analysis, Data Analyst, Data, Astronomy, Astronomer, Science, Python, iPython, Jupyter Notebook, R, RStudio, Excel, Coding, Koding, Cara Mengolah Data, Mengolah Data, Olah Data, Programming, Pemrograman, Sains, Teknologi, Ilmu Data, Teknologi Informasi, Tech in Asia, Teknologi, Technology, Sains, Bisnis, Business, Business Analyst, Business Analysis, Social Media Mining, Movie Review, Muhammad Azizul Hakim, Aziz

Sumber Gambar: Pengalaman Pribadi.

Menyenangkan bukan? Selamat mencoba, dan sampai jumpa di postingan-postingan berikutnya! πŸ™‚

Enjoy & stay type and run your code!

 

References & Further Reading

Ravindran et. al (2015): Mastering Social Media Mining with R, Packt Publishing.

The R Project for Statistical Computing.

What is an API? In English, Please.

Follow and like us: