Timbunan Biner (Maks)

1. Introduction

Sebuah Timbunan Biner (Maks(imum)) (Binary (Max) Heap) adalah pohon biner komplet yang menjaga properti Timbunan Maks.


Timbunan Biner adalah salah satu struktur data yang dapat digunakan sebagai implementasi Tipe Data Abstrak (Abstract Data Type, ADT) Antrean Berprioritas (Priority Queue, PQ). Dalam sebuah PQ, setiap elemen mempunyai "prioritas" dan sebuah elemen dengan prioritas yang lebih tinggi akan diproses terlebih dahulu sebelum elemen dengan prioritas yang lebih rendah (elemen-elemen dengan prioritas yang sama akan diurutkan berdasarkan aturan Pertama-Datang Pertama-Keluar (First-In First-Out, FIFO) seperti Antrean (Queue) normal). Cobalah kilk ExtractMax() untuk animasi contoh tentang meng-ekstrak nilai maks dari sebuah Timbunan Biner acak diatas.


Untuk memperkecil fokus diskusi kita, visualisasi ini didesain untuk menampilkan Timbunan Biner Maks yang berisi bilangan bulat dimana duplikat-duplikat diperbolehkan. Lihat ini untuk konversi mudah ke Timbunan Biner Min

1-1. Definisi

Pohon Biner Komplet: Setiap level di pohon biner, kecuali mungkin level terakhir/terbawah, sepenuhnya terisi, dan semua simpul-simpul di level terakhir berada di sisi paling kiri sebisa mungkin.


Properti Timbunan Biner Maks: Orang tua (parent) dari setiap simpul - kecuali mungkin akarnya - berisi nilai lebih besar dari nilai dari simpul tersebut. Ini adalah definisi yang lebih-mudah-diverifikasi daripada definisi alternatif ini: Nilai dari setiap simpul - kecuali mungkin daun/dedaunan - harus lebih besar dari nilai dari satu (atau kedua) anak(-anak)nya.

1-2. ADT Antrean Berprioritas

Tipe Data Abstrak (Abstract Data Type, ADT) Antrean Berprioritas (Priority Queue, PQ) mirip dengan ADT Antrean (Queue) normal, tetapi dengan dua operasi-operasi penting berikut:

  1. Enqueue(x): Taruh elemen (kunci) baru x kedalam PQ (dalam urutan tertentu),
  2. y = Dequeue(): Kembalikan elemen yang sudah eksis y yang memiliki prioritas (kunci) tertinggi didalam PQ dan jika sama, kembalikan kunci yang dimasukkan terlebih dahulu, yaitu kembali ke sifat Pertama-Datang Pertama Keluar (First-In First-Out, FIFO) dari Antrean (Queue) normal.

1-3. Contoh

Bayangkan: Anda adalah Pengatur Lalu Lintas Udara (Air Traffic Controller, ATC) yang bekerja di sebuah menara kontrol dari sebuah bandara.


Anda telah menjadwalkan pesawat X/Y untuk mendarat di 3/6 menit berikutnya. Keduanya memiliki bahan bakar yang cukup untuk setidaknya 15 menit kedepan dan keduanya hanya 2 menit jauhnya dari bandara anda. Anda mengamati bahwa jalur pacu bandara anda saat ini kosong.


Jika anda tidak tahu, sebuah pesawat dapat diinstruksikan untuk terbang dalam pola statis (holding pattern) dekat sebuah bandara sampai waktu pendaratan yang sudah dijadwalkan.

1-4. Untuk Kuliah Langsung @ NUS Saja

Anda harus menghadiri kuliah nyata untuk mengetahui apa yang terjadi selanjutnya...


Akan ada dua pilihan yang akan ditampilkan kepada anda dan anda harus memutuskan:

  1. Angkat DAN lambaikan tangan anda jika anda memilih opsi A,
  2. Angkat tangan anda tapi JANGAN lambaikan jika anda memilih opsi B,

Jika kedua opsi tersebut tidak masuk akal buat anda, anda tidak perlu melakukan apa-apa.

1-5. Contoh - Lanjutan

[This is a hidden slide]

1-6. Contoh-Contoh PQ

Ada beberapa penggunaan-penggunaan potensial dari ADT PQ dalam kehidupan nyata selain apa yang anda baru saja lihat (hanya di kuliah nyata).


Diskusi: Bisakah anda menyebutkan beberapa situasi-situasi kehidupan nyata lainnya dimana sebuah PQ dibutuhkan?

1-7. Jawaban-Jawaban Potensial

[This is a hidden slide]

1-8. Struktur Data Linear untuk PQ?

Kita bisa mengimplementasikan ADT PQ ini menggunakan larik (sirkular) atau Senarai Berantai (Linked List) tetapi kita akan mendapatkan operasi Enqueue atau Dequeue yang pelan (yaitu dalam O(N)).


Diskusi: Kenapa?

1-9. Jawaban - Bagian 1

[This is a hidden slide]

1-10. Jawaban - Bagian 2

[This is a hidden slide]

2. Visualisasi + Properti Timbunan Maks

Sekarang, mari lihat visualisasi dari sebuah Timbunan Biner Maks(imum) (acak) diatas. Anda akan melihat sebuah pohon biner komplit dan seluruh simpulnya kecuali akarnya memenuhi properti timbunan maks (A[parent(i)] > A[i] — yang tetap baik-baik saja meskipun ada bilangan-bilangan bulat yang terduplikasi).


Anda bisa Toggle the Visualization Mode diantara format pohon biner komplit yang lebih intuitif atau larik padat yang mendasari implementasi Timbunan Biner (Maks).


Quiz: Based on this Binary (Max) Heap property, where will the largest integer be located?

At the root
Can be anywhere
At one of the leaf

2-1. Timbunan Biner dengan Tinggi O(log N)

Fakta penting untuk dihafal saat ini: Jika kita memiliki Timbunan Biner dengan N elemen, tingginya tidak akan lebih tinggi dari O(log N) karena kita akan menaruhnya sebagai pohon biner komplet.


Analisa sederhana: Besarnya N dari sebuah pohon biner penuh (lebih dari sekedar komplet) dengan tinggi h adalah selalu N = 2(h+1)-1, sehingga h = log2(N+1)-1 ~= log2 N.


Lihat contoh diatas dengan N = 7 = 2(2+1)-1 or h = log2(7+1)-1 = 2.


Fakta ini penting untuk analisa dari semua operasi-operasi yang berhubungan dengan Timbunan Biner.

2-2. Larik Padat berbasis-1

Sebuah pohon biner komplet dapat disimpan dengan efisien sebagai larik padat A karena tidak ada bolong diantara simpul-simpul dari sebuah pohon biner komplet maupun elemen-elemen dari larik padat. Untuk memudahkan operasi-operasi navigasi dibawah, kami menggunakan larik berbasis-1. VisuAlgo menunjukkan indeks dari setiap simpul sebagai label merah dibawah setiap simpul. Baca indeks-indeks tersebut secara terurut dari 1 sampai N, maka anda akan melihat simpul-simpul dari pohon biner komplet dari atas ke bawah, kiri ke kanan. Untuk membantu anda mengerti ini, Toggle the Visualization Mode beberapa kali.


Dengan cara ini, kita bisa mengimplementasikan operasi-operasi penjelajahan pohon biner standar dengan manipulasi-manipulasi indeks sederhana (dengan bantuan manipulasi penggeseran bit):

  1. orangtua(i) = i>>1, indeks i dibagi dengan 2 (pembagian bilangan bulat),
  2. kiri(i) = i<<1, indeks i dikalikan dengan 2,
  3. kanan(i) = (i<<1)+1, indeks i dikalikan dengan 2 dan ditambahkan dengan 1.

Tips Pro: Cobalah buka dua kopi dari VisuAlgo pada dua jendela browser. Cobalah visualisasikan Timbunan Biner Maks yang sama dalam dua mode yang berbeda dan bandingkan.

3. Operasi-Operasi Timbunan Biner (Maks)

Dalam visualisasi ini, anda dapat melakukan beberapa operasi umum Timbunan Biner (Maksimum):

  1. Buat(A) -- Buat(A) versi O(N log N) (N panggilan dari Masukkan(v) dibawah)
  2. Buat(A) -- Buat(A) versi O(N)
  3. Masukkan(v) dalam O(log N) - anda dapat memasukkan duplikat-duplikat
  4. 3 versi-versi dari EkstrakMaks():
    1. Sekali, dalamO(log N)
    2. K kali, yaitu UrutkanParsial(), dalam O(K log N), atau
    3. N kali, yaitu HeapSort(), dalam O(N log N)
  5. PerbaruiKunci(i, vbaru) dalam O(log N jika i diketahui)
  6. Hapus(i) dalam O(log N jika i diketahui)

Terdapat operasi-operasi Timbunan Biner (Maksimum) lain, namun saat ini kami tidak menunjukkannya untuk alasan pedagogis beberapa modul NUS.

3-1. Apa Operasi-Operasi Ekstra Tersebut?

[This is a hidden slide]

4. Masukkan(v)

Masukkan(v): Memasukkan nilai baru v ke dalam Timbunan Biner Maks hanya dapat dilakukan pada indeks terakhir N plus 1 untuk mempertahankan properti larik padat = pohon biner komplet. Namun, properti Timbunan Maks masih dapat dilanggar. Operasi ini kemudian membetulkan properti tersebut dari titik masukkan ke atas (jika perlu) dan berhenti ketika properti tersebut tidak dilanggar lagi. Sekarang cobalah klik Insert(v) beberapa kali untuk memasukkan beberapa nilai v acak ke Timbunan Biner (Maks) yang ditunjukkan saat ini.

Operasi membetulkan properti Timbunan Maks keatas tidak memiliki nama standar. Kami menyebutnya ShiftUp tetapi orang-orang lain mungkin menyebutnya sebagai operasi BubbleUp atau IncreaseKey.

4-1. Kenapa Benar?

Apakah anda mengerti kenapa memulai dari tempat pemasukan (indeks N+1) keatas (sampai maksimum simpul akar) dan menukar sebuah simpul dangan orang tuanya ketika terjadi pelanggaran properti Timbunan Maks selama pemasukkan adalah sebuah strategi yang benar?

4-2. Jawabannya

[This is a hidden slide]

4-3. Analisa Kompleksitas Waktu

Kompleksitas waktu dari operasi Masukkan(v) ini adalah O(log N).


Diskusi: Apakah anda mengerti penurunannya?

4-4. Jawabannya

[This is a hidden slide]

5. EkstrakMaks() - Sekali

EkstrakMaks(): Pelaporan dan penghapusan nilai maksimum (akar) dari Timbunan Biner Maks memerlukan sebuah elemen lain untuk menggantikannya, karena jika tidak, maka Timbunan Biner Maks (sebuah pohon biner komplit, atau 林/Lín dalam bahasa Mandarin/pohon) menjadi dua sub-pohon yang terpisah (dua kopi dari 木/mù dalam bahasa Mandarin/kayu). Elemen tersebut harus merupakan indeks terakhir N dengan alasan yang sama: Untuk menjaga properti larik padat (compact) = pohon biner komplet.


Karena kita mempromosikan sebuah simpul daun menjadi simpul akar dari sbeuah Timbunan Biner, properti Timbunan Maks dapat dilanggar dengan mudah. Operasi EkstraksMaks() ini lalu membetulkan kembali properti tersebut mulai dari akar ke bawah dengan membandingkan nilai saat ini dengan anak-anaknya/yang lebih besar (bila perlu). Sekarang cobalah ExtractMax() pada Timbunan Biner (Maks) yang ditunjukkan saat ini.


Operasi membetulkan properti Timbunan Maks kebawah tidak memiliki nama standar. Kami menyebutnya ShiftDown tetapi orang-orang lain mungkin menyebutnya sebagai operasi BubbleDown atau Heapify.

5-1. Kenapa dengan Anak yang lebih Besar?

Kenapa jika sebuah simpul memiliki dua anak, kita harus mengecek (dan mungkin menukar) simpul tersebut dengan anak yang lebih besar saat membereskan properti Timbunan Maks kebawah?


Kenapa kita tidak bisa membandingkan dengan simpul kiri (atau kanan, jika ada) saja?

5-2. Jawabannya

[This is a hidden slide]

5-3. Analisa Kompleksitas Waktu

Kompleksitas waktu dari operasi EkstrakMaks() ini adalah O(log N).


Diskusi: Apakah anda mengerti penurunannya?

5-4. Jawabannya

[This is a hidden slide]

6. Timbunan Biner untuk PQ yang Efisien

Sampai pada saat ini, kita telah memiliki struktur data yang bisa mengimplementasikan kedua operasi-operasi penting dari ADT Antrean Berprioritas (Priority Queue, PQ) secara efisien:

  1. Untuk Enqueue(x), kita dapat menggunakan Masukkan(x) dalam waktu O(log N), dan
  2. Untuk y = Dequeue(), kita dapat menggunakan y = ExtractMax() dalam waktu O(log N).

Tetapi, kita sebenarnya bisa melakukan beberapa operasi-operasi lainnya dengan Timbunan Biner.

7. Buat(A) - Dua Varian

Buat(A): Membuat sebuah Timbunan Biner (Maks) valid dari array masukan A dengan N integer (dipisahkan dengan koma) ke dalam Timbunan Biner Maks kosong.


Ada dua varian untuk operasi ini, versi sederhana dalam O(N log N) dan versi advanced yang berjalan dalam O(N).


Pro Tip: Cobalah buka dua jendela VisuAlgo di browser anda. Jalankan kedua varian operasi Buat(A) pada kasus terburuk 'Contoh terurut' untuk melihat perbedaan mencolok dari keduanya.

7-1. Buat(A) - O(N log N)

Buat(A) - O(N log N): Memasukkan (dengan memanggil operasi Masukkan(v)) untuk setiap N bilangan bulat dari larik masukan ke dalam Timbunan Biner maks (yang awalnya kosong) satu per satu.

Analisa: Operasi ini jelas berjalan dalam O(N log N) karena kita memanggil operasi Masukkan(v) yang berjalan dalam O(log N) sebanyak N kali. Mari kita lihat 'Contoh terurut' yang merupakan kasus paling sulit untuk operasi ini (Sekarang cobalah Hard Case - O(N log N) di mana kita menggunakan A={1,2,3,4,5,6,7} - sabarlah karena contoh ini akan memakan waktu sampai selesai). Jika kita memasukkan nilai-nilai secara menaik ke dalam Timbunan Biner Maks yang kosong pada awalnya, maka tiap masukan akan menelusuri jalur dari titik masukan (daun yang baru) keatas hingga ke akar.

7-2. Buat(A) - O(N)

Buat(A) - O(N): Versi Buat yang lebih cepat ini ditemukan oleh Robert W. Floyd pada tahun 1964. Metode ini memanfaatkan fakta bahwa sebuah larik padat = pohon biner komplet dan semua daunnya (yaitu setengah dari simpul yang ada) adalah Timbunan Biner Maks dengan sendirinya, tahukah anda mengapa?. Operasi ini membetulkan properti Timbunan Biner Maks (jika perlu) hanya dari simpul internal terakhir ke akar.

Analisa: Sebuah analisa longgar menghasilkan O(N/2 log N) tetapi ini hanyalah O(2*N) = O(N). Sekarang Hard Case - O(N) dari array masukan A=[1,2,3,4,5,6,7] dan lihat pada kasus terburuknya, operasi ini jauh lebih baik dibandingkan versi O(N log N).

7-3. Banyak Simpul Daun

Pembuktian sederhana tentang mengapa separuh dari Timbunan Biner (Maks) dengan N (tanpa kehilangan makna umum, mari asumsikan bahwa N adalah genap) elemen adalah dedaunan adalah sebagai berikut:


Misalkan daun terakhir berada pada indeks N, maka orang tua dari daun terakhir tersebut ada di indeks i = N/2 (ingat slide ini). Anak kiri dari simpul i+1, jika ada (sesungguhnya tidak ada), adalah 2*(i+1) = 2*(N/2+1) = N+2, yang sudah lebih besar dari indeks N (daun terakhir) jadi indeks i+1 pasti juga adalah sebuah simpul daun yang tidak mempunyai anak. Karena indeks-indeks dari Timbunan Biner beruruta, pada dasarnya indeks-indeks [i+1 = N/2+1, i+2 = N/2+2, ..., N], yaitu separuh dari seluruh simpul-simpul, adalah dedaunan.

7-4. Kenapa O(N)? - Bagian 1

Pertama-tama, kita perlu mengingat bahwa tinggi dari pohon biner penuh dengan ukuran N adalah log2 N.


Kedua, kita perlu menyadari bahwa biaya untuk menjalakan operasi shiftDown(i) tidak sejelek batas atas kasar O(log N), tetapi O(h) dimana h adalah tinggi dari sub-pohon yang berakar di indeks i.


Ketiga, ada ceil(N/2h+1) simpul-simpul pada ketinggian h di sebuah pohon biner penuh.


Di pohon biner penuh contoh diatas dengan N = 7 dan h = 2, ada:
ceil(7/20+1) = 4 simpul-simpul: {44,35,26,17} pada ketinggian h = 0,
ceil(7/21+1) = 2 simpul-simpul: {62,53} pada ketinggian h = 1, dan
ceil(7/22+1) = 1 simpul: {71} pada ketinggian h = 2.

7-5. Kenapa O(N)? - Bagian 2

Biaya dari Buat(A), versi O(N) adalah:


analysis

Catatan: Jika rumus ini terlalu kompleks, murid yang modern bisa menggunakan WolframAlpha.

8. HeapSort()

HeapSort(): John William Joseph Williams meneukan algoritma HeapSort() pada tahun 1964, bersamaan dengan struktur data Timbunan Biner. Operasi HeapSort() (dengan asumsi bahwa Timbunan Biner Maks telah dibuat dalam O(N)) sangatlah mudah. Anda cukup memanggil operasi EkstrakMaks() yang berjalan dalam O(log N) sebanyak N kali. Sekarang cobalah HeapSort() pada Timbunan Biner (Maks) yang ditunjukkan saat ini.

Analisa Sederhana: HeapSort() dengan jelas berjalan dalam O(N log N) — sebuah algoritma pengurutan berbasis perbandingan yang optimal.

8-1. Diskusi

Meskipun HeapSort() berjalan dalam waktu θ(N log N) untuk semua kasus (terbaik/rata-rata/terjelek), apakah Heap Sort benar-benar algoritma berbasis-pembandingan terbaik?


Diskusi: Bagaimana dengan performa caching dari HeapSort()?

8-2. Jawabannya

[This is a hidden slide]

8-3. UrutkanSebagian()

Kita sebetulnya bisa memanggil operasi O(log N) EkstraksMax() sebanyak K kali jika kita hanya tertarik kepada K elemen-elemen terbesar di dalam Timbunan Biner (maks). Sekarang coba [tobeadded] pada Timbunan Biner (Maks) yang sekarang ditampilkan. Operasi ini disebut UrutkanParsial().


Analisa Simple: UrutkanParsial() dengan jelas berjalan dalam O(K log N) — sebuah algoritma sensitif-keluaran dimana kompleksitas waktunya tergantung kepada ukuran keluaran K.

9. Tambahan-Tambahan

Anda telah mencapai akhir dari bahan-bahan dasar dari struktur data Timbunan Biner (Maks) dan kami menyemangati anda untuk mengeksplorasi lebih lanjut dalam Mode Eksplorasi.


Tetapi, kami masih memiliki beberapa tantangan-tantangan menarik untuk anda tentang Timbunan Biner (Maks) yang akan kami sebutkan di bagian ini.


Ketika anda telah menyelesaikan semuanya, kami mengundang anda untuk mempelajari algoritma-algoritma yang lebih lanjut yang menggunakan Antrean Berprioritas sebagai (salah satu dari) struktur datanya, seperti algoritma MST Prim, algoritma SSSP Dijkstra, algoritma pencarian A* (belum ada di VisuAlgo), dan beberapa algoritma-algoritma berbasis-greedy lainnya, dsb.

9-1. Konversi dari Timbunan Maks ke Min

Jika kita hanya berurusan dengan angka-angka (termasuk dalam visualisasi ini yang dibatasi nya untuk bilangan-bilangan bulat saja), maka mudah untuk mengkonversi Timbunan Biner Maks ke Timbunan Biner Min tanpa mengubah apapun, dan sebaliknya.


Kita dapat membuat ulang Timbunan Biner dengan menegasi (mengalikan dengan -1) setiap bilangan bulat di Timbunan Biner asli. Jika kita mulai dengan Timbunan Biner Maks, maka Timbunan Biner yang dihasilkan adalah Timbunan Biner Min (jika kita tidak memperdulikan simbol-simbol negatif — lihat gambar diatas), dan sebaliknya.

9-2. PerbaruiKunci(i, vbaru)

Untuk beberapa aplikasi-aplikasi Antrean Berprioritas (misalkan HeapDecreaseKey dalam algoritma Dijkstra), kita mungkin harus memodifikasi (menaikkan atau menurunkan) prioritas dari sebuah nilai yang sudah dimasukkan kedalam Timbunan Biner (Maks). Jika indeks i dari nilai tersebut diketahui, kita dapat menggunakan strategi mudah sebagai berikut: Mutakhirkan saja A[i] = newv dan lalu kita memanggil kedua shiftUp(i) dan shiftDown(i). Hanya maksimum satu dari operasi restorasi properti Timbunan Maks yang akan berhasil, yaitu shiftUp(i)/shiftDown(i) akan dijalankan jika newv >/< nilai lama dari A[parent(i)]/A[larger of the two children of i], masing-masing.


Sehingga, PerbaruiKunci(i, vbaru) bisa dilakukan dalam O(log N), asal saja kita mengetahui indeks i.

9-3. Hapus(i)

Untuk beberapa aplikasi-aplikasi Antrean Berprioritas, kita mungkin harus menghapus nilai yang sudah ada yang telah dimasukkan kedalam Timbunan Biner (Maks) (dan nilai ini kebetulan bukan akar). Sekali lagi, jika indeks i dari nilai tersebut diketahui, kita bisa melakukan strategi muda berikut ini: Mutakhirkan saja A[i] = A[1]+1 (sebuah angka besar yang lebih besar dari akar saat ini), panggil shiftUp(i) (secara teknis, PerbaruKunci(i, A[1]+1)). Ini akan membawa indeks i menjadi akar yang baru, dan dari situ, kita dapat dengan mudah memanggil EktraksMax() sekali untuk menghapusnya.


Maka, Hapus(i) bisa dilakukan dalam O(log N), jika kita mengetahui indeks i.


Diskusi: Sekarang untuk PerbaruiKunci(i, vbaru) dan Hapus(i), apa yang terjadi jika kita diberikan vlama dan oleh karena itu kita harus mencari lokasinya di Timbunan Biner (Maks)? Bisakah kita melakukan ini lebih cepat dari O(N)?

9-4. Jawabannya

[This is a hidden slide]

9-5. Kode Sumber

Jika anda mencari implementasi dari sebuah Timbunan Biner (Maks) untuk mendapatkan Antrean Berprioritas (Priority Queue), maka ada berita baik.


C++ dan Java sudah memiliki implementasi-implementasi Antrean Berprioritas built-in yang sangat mungkin menggunakan struktur data ini. Mereka adalah C++ STL priority_queue (secara default adalah Antrean Berprioritas Maks) dan Java PriorityQueue (secara default adalah Antrean Berprioritas Min). Tetapi, implementasi built-in mungkin tidak cocok untuk melakukan beberapa operasi-operasi PQ tambahan (detilnya tidak disebut untuk alasan pedagogis di sebuah modul NUS).


Python heapq juga ada tetapi performanya cukup pelan. OCaml tidak mempunyai Antrean Berprioritas built-in tetapi kita bisa menggunakan sesuatu yang lain yang akan disebut di modul-modul lain di VisuAlgo (alasan kenapa detail-detailnya dirahasiakan sama seperti diatas).


Catatan: Heap Sort sangat mungkin dipakai dalam algoritma C++ STL partial_sort.


Tetapi, inilah implementasi kami tentang BinaryHeapDemo.cpp.

9-6. Kuis Online

Untuk beberapa pertanyaan-pertanyaan menarik tentang struktur data ini, silahkan coba latihan pada modul latihan Timbunan Biner (login tidak dibutuhkan).


Tetapi untuk murid-murid NUS, anda sebaiknya login menggunakan akun kelas resmi anda, secara ofisial menyelesaikan modul ini, dan penghargaan tersebut akan dicatat di akun pengguna anda.