GETTING STARTED WITH MATPLOTLIB & SEABORN (BIG DATA & BUSSINESS INTELLIGENCE)

GETTING STARTED WITH MATPLOTLIB & SEABORN


Selayang Pandang Matplotib


  • import matplotlib.pyplot as plt: Ini mengimpor pustaka matplotlib.pyplot, yang digunakan untuk membuat berbagai jenis grafik, termasuk grafik garis, batang, dan scatter.
  • import numpy as np: Mengimpor pustaka numpy untuk operasi numerik, meskipun tidak digunakan langsung dalam skrip ini.
  • import seaborn as sns: Mengimpor pustaka seaborn, yang mempermudah pembuatan grafik dengan tampilan yang lebih menarik.
  • %matplotlib inline: Perintah ini digunakan dalam Jupyter Notebook untuk menampilkan grafik langsung dalam notebook.
  • x1_values dan y1_values menyimpan data untuk grafik pertama.
  • x2_values dan y2_values menyimpan data untuk grafik kedua.
  • x3_values dan y3_values menyimpan data untuk grafik ketiga.

  • Line Plot


    - plt.figure() perintah ini digunakan untuk membuat gambar kosong baru, di mana grafik akan digambar. Ini memberi Anda kontrol penuh untuk mengatur grafik.
    plt.plot(x1_values, y1_values, label='Python'): Membuat grafik garis pertama dengan data x1_values dan y1_values, serta memberi label 'Python' pada garis tersebut.
    plt.plot(x2_values, y2_values, label='JavaScript'): Membuat grafik garis kedua untuk data x2_values dan y2_values dengan label 'JavaScript'.
    plt.plot(x3_values, y3_values, label='R'): Membuat grafik garis ketiga untuk data x3_values dan y3_values dengan label 'R'.
    plt.xlim(2012, 2015): Mengatur batas sumbu x (tahun) dari 2012 hingga 2015.
    plt.ylim(0, 6): Mengatur batas sumbu y (nilai pencarian) dari 0 hingga 6. Ini memastikan grafik tetap berada dalam rentang yang relevan.
    plt.xticks([2012, 2013, 2014, 2015], ['2012', '2013', '2014', '2015']): Mengatur posisi dan label pada sumbu x untuk tahun 2012 hingga 2015.
    plt.yticks([1, 2, 3, 4, 5]): Mengatur posisi label pada sumbu y untuk nilai pencarian antara 1 hingga 5.
    plt.xlabel(''): Menghapus label sumbu x. Di sini, label sumbu x sengaja dikosongkan.
    plt.ylabel('Web Searches'): Memberikan label pada sumbu y dengan teks 'Web Searches', yang menggambarkan data yang sedang dianalisis.
    plt.legend(loc='upper center', ncol=3): Menambahkan legenda pada grafik dengan menempatkannya di bagian atas tengah (loc='upper center'). ncol=3 berarti legenda akan menggunakan tiga kolom, satu untuk setiap bahasa pemrograman.
    - plt.grid(True) perintah ini menampilkan grid pada grafik, yang memudahkan pembaca untuk melihat nilai-nilai pada sumbu x dan y.
    - plt.savefig('web-searches.png', dpi=150) perintah ini menyimpan grafik yang telah digambar dalam file dengan nama 'web-searches.png'. Argumen dpi=150 menetapkan kualitas gambar yang disimpan dengan 150 titik per inci (dpi), yang menentukan resolusi gambar.

    Hasil :


    Histogram

    1. 


    - np.random.normal(42, 3, 1000): Fungsi ini digunakan untuk menghasilkan data acak yang mengikuti distribusi normal (Gaussian distribution).
    - plt.figure() Perintah ini digunakan untuk membuat sebuah gambar baru di mana grafik akan digambar.
    plt.hist(column_data): Fungsi ini digunakan untuk membuat histogram dari data yang ada di column_data.

    Hasil :

    2. 

    sns.displot(column_data, kde=True): Fungsi displot() digunakan untuk membuat histogram.
    sns.histplot(column_data, kde=True): Fungsi histplot() digunakan untuk membuat histogram yang lebih sederhana.

    Hasil :


    Boxplot

    sns.boxplot(data=two_columns_data): Membuat boxplot dari data yang ada di two_columns_data.
    plt.title('Boxplot of Two Columns'): Menambahkan judul pada grafik.
    plt.xlabel('Columns'): Menambahkan label pada sumbu x untuk menunjukkan bahwa ini adalah kolom.
    plt.ylabel('Values'): Menambahkan label pada sumbu y untuk menunjukkan bahwa ini adalah nilai dari data.
    plt.show(): Menampilkan grafik yang telah dibuat.

    Hasil :


    Vertical Bar Chart


    years: Sebuah daftar yang berisi tahun (2020, 2021, 2022, 2023) yang akan digunakan pada sumbu x (horizontal).
    values: Sebuah daftar yang berisi nilai yang akan dipetakan pada sumbu y (vertikal) yang berkorespondensi dengan masing-masing tahun.
    sns.barplot(): Fungsi ini digunakan untuk membuat barplot, yaitu grafik batang yang mengilustrasikan data dalam bentuk batang vertikal.
    plt.show(): Fungsi ini digunakan untuk menampilkan grafik yang telah dibuat.

    Hasil :


    Pie Chart


    counts: Sebuah list yang berisi dua nilai [17, 14], yang masing-masing mewakili jumlah atau frekuensi untuk dua kategori yang berbeda.
    plt.figure(figsize=(4, 4)): Membuat sebuah gambar baru dengan ukuran (lebar, tinggi) 4x4 inci.
    plt.pie(): Fungsi ini digunakan untuk membuat diagram pie, yang digunakan untuk menggambarkan proporsi dari data dalam bentuk lingkaran, dengan setiap bagian yang mewakili persentase dari total.
    • counts: Data yang digunakan untuk diagram pie, yaitu daftar [17, 14] yang menunjukkan jumlah untuk setiap kategori.
    • colors=['blue', 'orange']: Menentukan warna untuk masing-masing bagian pie. Di sini, kategori pertama akan berwarna biru, dan kategori kedua akan berwarna oranye.
    • labels=['Category A', 'Other categories']: Memberikan label atau nama untuk setiap kategori pada pie chart. Kategori pertama akan diberi label "Category A", dan kategori kedua diberi label "Other categories".
    • startangle=90: Menentukan sudut awal untuk diagram pie, di mana 90 derajat berarti bagian pertama dari pie akan dimulai di posisi 12 jam (posisi atas). Ini membantu mengatur orientasi pie chart.
    • autopct='%1.1f%%': Menambahkan label persentase pada setiap bagian pie chart. Format '%1.1f%%' menunjukkan bahwa persentase akan ditampilkan dengan satu angka desimal.

    Hasil :


    Scatter Plot


    plt.scatter(x, y, ...): Fungsi scatter() digunakan untuk membuat scatter plot, yang menggambarkan titik-titik data berdasarkan dua variabel, x dan y.
    • x: Array nilai yang akan digunakan pada sumbu x (dari np.arange(20)).
    • y: Array nilai yang akan digunakan pada sumbu y (dari penjumlahan array np.arange(50, 70) dan nilai acak).
    - c='red': Menentukan warna titik-titik pada scatter plot menjadi merah.
    s=40: Menentukan ukuran titik-titik pada scatter plot. Nilai 40 berarti titik tersebut akan relatif besar.
    marker='s': Menentukan bentuk marker (titik) yang digunakan. 's' menunjukkan bentuk kotak (square), bukan titik bulat default.
    edgecolor='none': Menghilangkan garis tepi (border) di sekitar marker, sehingga hanya warna merah yang terlihat tanpa garis luar.

    Hasil :




    TERIMAKASIH

    Komentar

    Postingan populer dari blog ini

    TUTORIAL ERP ODOO (ENTERPRISE RESOURCE PLANNING)

    LOCAL/REMOTE FILE INCLUSION (DASAR KEMANAN SIBER)

    OSINT (DASAR KEAMANAN SIBER)