GETTING STARTED WITH MATPLOTLIB & SEABORN (BIG DATA & BUSSINESS INTELLIGENCE)
GETTING STARTED WITH MATPLOTLIB & SEABORN
Selayang Pandang Matplotib
import matplotlib.pyplot as plt: Ini mengimpor pustaka matplotlib.pyplot, yang digunakan untuk membuat berbagai jenis grafik, termasuk grafik garis, batang, dan scatter.import numpy as np: Mengimpor pustaka numpy untuk operasi numerik, meskipun tidak digunakan langsung dalam skrip ini.import seaborn as sns: Mengimpor pustaka seaborn, yang mempermudah pembuatan grafik dengan tampilan yang lebih menarik.%matplotlib inline: Perintah ini digunakan dalam Jupyter Notebook untuk menampilkan grafik langsung dalam notebook.x1_values dan y1_values menyimpan data untuk grafik pertama.x2_values dan y2_values menyimpan data untuk grafik kedua.x3_values dan y3_values menyimpan data untuk grafik ketiga.Line Plot
-
plt.plot(x1_values, y1_values, label='Python'): Membuat grafik garis pertama dengan data x1_values dan y1_values, serta memberi label 'Python' pada garis tersebut.-
plt.plot(x2_values, y2_values, label='JavaScript'): Membuat grafik garis kedua untuk data x2_values dan y2_values dengan label 'JavaScript'.-
plt.plot(x3_values, y3_values, label='R'): Membuat grafik garis ketiga untuk data x3_values dan y3_values dengan label 'R'.-
plt.xlim(2012, 2015): Mengatur batas sumbu x (tahun) dari 2012 hingga 2015.-
plt.ylim(0, 6): Mengatur batas sumbu y (nilai pencarian) dari 0 hingga 6. Ini memastikan grafik tetap berada dalam rentang yang relevan.-
plt.xticks([2012, 2013, 2014, 2015], ['2012', '2013', '2014', '2015']): Mengatur posisi dan label pada sumbu x untuk tahun 2012 hingga 2015.-
plt.yticks([1, 2, 3, 4, 5]): Mengatur posisi label pada sumbu y untuk nilai pencarian antara 1 hingga 5.-
plt.xlabel(''): Menghapus label sumbu x. Di sini, label sumbu x sengaja dikosongkan.- plt.ylabel('Web Searches'): Memberikan label pada sumbu y dengan teks 'Web Searches', yang menggambarkan data yang sedang dianalisis.-
plt.legend(loc='upper center', ncol=3): Menambahkan legenda pada grafik dengan menempatkannya di bagian atas tengah (loc='upper center'). ncol=3 berarti legenda akan menggunakan tiga kolom, satu untuk setiap bahasa pemrograman.- plt.grid(True) perintah ini menampilkan grid pada grafik, yang memudahkan pembaca untuk melihat nilai-nilai pada sumbu x dan y.
- plt.savefig('web-searches.png', dpi=150) perintah ini menyimpan grafik yang telah digambar dalam file dengan nama 'web-searches.png'. Argumen
dpi=150 menetapkan kualitas gambar yang disimpan dengan 150 titik per inci (dpi), yang menentukan resolusi gambar.Hasil :
1.
- np.random.normal(42, 3, 1000): Fungsi ini digunakan untuk menghasilkan data acak yang mengikuti distribusi normal (Gaussian distribution).- plt.figure() Perintah ini digunakan untuk membuat sebuah gambar baru di mana grafik akan digambar.
-
plt.hist(column_data): Fungsi ini digunakan untuk membuat histogram dari data yang ada di column_data.Hasil :
-
sns.histplot(column_data, kde=True): Fungsi histplot() digunakan untuk membuat histogram yang lebih sederhana.Hasil :
-
plt.title('Boxplot of Two Columns'): Menambahkan judul pada grafik.-
plt.xlabel('Columns'): Menambahkan label pada sumbu x untuk menunjukkan bahwa ini adalah kolom.-
plt.ylabel('Values'): Menambahkan label pada sumbu y untuk menunjukkan bahwa ini adalah nilai dari data.-
plt.show(): Menampilkan grafik yang telah dibuat.Hasil :
-
years: Sebuah daftar yang berisi tahun (2020, 2021, 2022, 2023) yang akan digunakan pada sumbu x (horizontal).-
values: Sebuah daftar yang berisi nilai yang akan dipetakan pada sumbu y (vertikal) yang berkorespondensi dengan masing-masing tahun.-
sns.barplot(): Fungsi ini digunakan untuk membuat barplot, yaitu grafik batang yang mengilustrasikan data dalam bentuk batang vertikal.-
plt.show(): Fungsi ini digunakan untuk menampilkan grafik yang telah dibuat.Hasil :
-
counts: Sebuah list yang berisi dua nilai [17, 14], yang masing-masing mewakili jumlah atau frekuensi untuk dua kategori yang berbeda.-
plt.figure(figsize=(4, 4)): Membuat sebuah gambar baru dengan ukuran (lebar, tinggi) 4x4 inci.-
plt.pie(): Fungsi ini digunakan untuk membuat diagram pie, yang digunakan untuk menggambarkan proporsi dari data dalam bentuk lingkaran, dengan setiap bagian yang mewakili persentase dari total.counts: Data yang digunakan untuk diagram pie, yaitu daftar[17, 14]yang menunjukkan jumlah untuk setiap kategori.colors=['blue', 'orange']: Menentukan warna untuk masing-masing bagian pie. Di sini, kategori pertama akan berwarna biru, dan kategori kedua akan berwarna oranye.labels=['Category A', 'Other categories']: Memberikan label atau nama untuk setiap kategori pada pie chart. Kategori pertama akan diberi label "Category A", dan kategori kedua diberi label "Other categories".startangle=90: Menentukan sudut awal untuk diagram pie, di mana 90 derajat berarti bagian pertama dari pie akan dimulai di posisi 12 jam (posisi atas). Ini membantu mengatur orientasi pie chart.autopct='%1.1f%%': Menambahkan label persentase pada setiap bagian pie chart. Format'%1.1f%%'menunjukkan bahwa persentase akan ditampilkan dengan satu angka desimal.
Hasil :
-
plt.scatter(x, y, ...): Fungsi scatter() digunakan untuk membuat scatter plot, yang menggambarkan titik-titik data berdasarkan dua variabel, x dan y.x: Array nilai yang akan digunakan pada sumbu x (darinp.arange(20)).y: Array nilai yang akan digunakan pada sumbu y (dari penjumlahan arraynp.arange(50, 70)dan nilai acak).
- c='red': Menentukan warna titik-titik pada scatter plot menjadi merah.-
s=40: Menentukan ukuran titik-titik pada scatter plot. Nilai 40 berarti titik tersebut akan relatif besar.-
marker='s': Menentukan bentuk marker (titik) yang digunakan. 's' menunjukkan bentuk kotak (square), bukan titik bulat default.-
edgecolor='none': Menghilangkan garis tepi (border) di sekitar marker, sehingga hanya warna merah yang terlihat tanpa garis luar.
Komentar
Posting Komentar