7    VisuAlgo.net / /suffixtree Login Pohon Akhiran
Mode Eksplorasi ▿

>

>
pelan
cepat
go to beginning previous frame pause play next frame go to end

A Suffix Tree is a compressed tree containing all the suffixes of the given text as their keys and positions in the text as their values. Suffix Tree provides a particularly fast implementation for many important string operations. This data structure is very related to Suffix Array data structure.


Remarks: By default, we show e-Lecture Mode for first time (or non logged-in) visitor.
Please login if you are a repeated visitor or register for an (optional) free account first.

X Esc
Berikut PgDn

The suffix i (or the i-th suffix) of a (usually long) text string T is a 'special case' of substring that goes from the i-th character of the string up to the last character of the string.


For example, if T = "STEVEN$", then suffix 0 of T is "STEVEN$" (0-based indexing), suffix 2 of T is "EVEN$", suffix 4 of T is "EN$", etc.


Pro-tip: Since you are not logged-in, you may be a first time visitor who are not aware of the following keyboard shortcuts to navigate this e-Lecture mode: [PageDown] to advance to the next slide, [PageUp] to go back to the previous slide, [Esc] to toggle between this e-Lecture mode and exploration mode.

X Esc
Sebelum PgUp
Berikut PgDn

The visualization of Suffix Tree of a string T is basically a rooted tree where path label (concatenation of edge label(s)) from root to each leaf describes a suffix of T. Each leaf vertex is a suffix and the integer value written inside the leaf vertex is the suffix number.


An internal vertex will branch to more than one child vertex, therefore there are more than one suffix from the root to the leaves via this internal vertex. The path label of an internal vertex is a common prefix among those suffix(es).


Another pro-tip: We designed this visualization and this e-Lecture mode to look good on 1366x768 resolution or larger (typical modern laptop resolution in 2017). We recommend using Google Chrome to access VisuAlgo. Go to full screen mode (F11) to enjoy this setup. However, you can use zoom-in (Ctrl +) or zoom-out (Ctrl -) to calibrate this.

X Esc
Sebelum PgUp
Berikut PgDn

The Suffix Tree above is built from string T = "GATAGACA$" that have these 9 suffixes:

iSuffix
0GATAGACA$
1ATAGACA$
2TAGACA$
3AGACA$
4GACA$
5ACA$
6CA$
7A$
8$

Now verify that the path labels of suffix 7/6/2 are "A$"/"CA$"/"TAGACA$", respectively (there are 6 other suffixes). The internal vertices with path label "A"/"GA" branch out to 4 suffixes {7, 5, 3, 1}/2 suffixes {4, 0}, respectively (we ignore the trivial internal vertex = root vertex that branches out to all 9 suffixes).

X Esc
Sebelum PgUp
Berikut PgDn

In order to ensure that every suffix of the input string T ends in a leaf vertex, we enforce that string T ends with a special terminating symbol '$' that is not used in the original string T and has ASCII value lower than the lowest allowable character in T (which is character 'A'). This way, edge label '$' always appear at the leftmost edge of an internal vertex of this Suffix Tree visualization.


For the Suffix Tree example above (for T = "GATAGACA$"), if we do not have terminating symbol '$', notice that suffix 7 "A" does NOT end in a leaf vertex and can complicate some operations later.

X Esc
Sebelum PgUp
Berikut PgDn

As we have ensured that all suffixes end at a leaf vertex, there are at most n leaves/suffixes in a Suffix Tree. All internal vertices (including the root vertex if it is an internal vertex) are always branching thus there can be at most n-1 such vertices, as shown with one of the extreme test case on the right.


The maximum number of vertices in a Suffix Tree is thus = n (leaves) + (n-1) internal vertices = 2n-1 = O(n) vertices. As Suffix Tree is a tree, the maximum number of edges in a Suffix Tree is also (2n-1)-1 = O(n) edges.

X Esc
Sebelum PgUp
Berikut PgDn

When all the characters in string T is all distinct (e.g. T = "ABCDE$"), we can have the following very short Suffix Tree with exactly n+1 vertices (+1 due to root vertex).

X Esc
Sebelum PgUp
Berikut PgDn

All available operations on the Suffix Tree in this visualization are listed below:

  1. Build Suffix Tree (instant) — instant-build the Suffix Tree from string T.
  2. Search — Find the vertex in Suffix Tree of a (usually longer) string T that has path label containing the (usually shorter) pattern/search string P.
  3. Longest Repeated Substring (LRS) — Find the deepest internal vertex (as that vertex shares common prefix between two (or more) suffixes of T).
  4. Longest Common Substring (LCS) — Find the deepest internal vertex that contains suffixes from two different original strings.
X Esc
Sebelum PgUp
Berikut PgDn

In this visualization, we only show the fully constructed Suffix Tree without describing the details of the O(n) Suffix Tree construction algorithm — it is a bit too complicated.


We limit the input to only accept 12 UPPERCASE alphabet and the special terminating symbol '$' characters (ie.g [A-Z$]). If you do not write a terminating symbol '$' at the back of your input string, we will automatically do so. If you place a '$' in the middle of the input string, they will be ignored. And if you enter an empty input string, we will resort to the default "GATAGACA$".


For convenience, we provide a few classic test case input strings usually found in Suffix Tree/Array lectures.

X Esc
Sebelum PgUp
Berikut PgDn

Assuming that the Suffix Tree of a (usually longer) string T (of length n) has been built, we want to find all occurrences of pattern/search string P (of length m).


To do this, we search for the vertex x in the suffix Tree of T which has path label that represents P. Once we find this vertex x, all the leaves in the subtree rooted at x are the occurrences.


Time complexity: O(m+occ) where occ is the total number of occurrences.


For example, on the Suffix Tree of T = "GATAGACA$" above, let's try finding:

  1. Search("A"), occurrences = {7, 5, 3, 1}
  2. Search("GA"), occurrences = {4, 0}
  3. P = "T", should return occurrences = {2}, but there is a silly bug that we have not killed yet
  4. P = "Z", should return occurrences = {NIL}, but there is a silly bug that we have not killed yet
X Esc
Sebelum PgUp
Berikut PgDn

Assuming that the Suffix Tree of a (usually longer) string T (of length n) has been built, we can find the Longest Repeated Substring (LRS) in T by simply finding the deepest internal vertex of the Suffix Tree of T.


This is because each internal vertex of the Suffix Tree of T branches out to at least two (or more) suffixes, i.e. the path label (common prefix of these suffixes) are repeated.


The internal vertex with the deepest/longest path label is the required answer, which can be found in O(n) with a simple tree traversal.


Without further ado, try LRS(T) on the Suffix Tree of string T = "GATAGACA$" above.

X Esc
Sebelum PgUp
Berikut PgDn

This time, we need two input strings T1 and T2 that terminate with symbol '$'/'#', respectively. We then create the generalized Suffix Tree of these two strings T1+T2. Then, we can find the Longest Common Substring (LCS) of those two strings T1 and T2 by simply finding the deepest and valid internal vertex of the generalized Suffix Tree of T1+T2.


This is because each internal vertex of the Suffix Tree of T branches out to at least two (or more) suffixes, i.e. the path label (common prefix of these suffixes) are repeated. Then, we add an additional constraint where an internal vertex is considered valid (to be considered as LCS candidate) only if it represents suffixes from both strings, i.e. not just repeated, but a common substring found in both T1 and T2.


The valid internal vertex with the deepest/longest path label is the required answer, which can be found in O(n) with a simple tree traversal.


Without further ado, try LCS(T1,T2) on the generalized Suffix Tree of string T1 = "GATAGACA$" and T2 = "CATABB#" (notice that the UI will change to generalized Suffix Tree version).

X Esc
Sebelum PgUp
Berikut PgDn

There are a few other things that we can do with Suffix Tree like "Finding Longest Repeated Substring without overlap", "Finding Longest Common Substring of ≥ 2 strings", etc, but we will keep that for later.


We will continue the discussion of this String-specific data structure with the more versatile to Suffix Array data structure.

X Esc
Sebelum PgUp
Berikut PgDn
Selagi aksi dijalankan, tiap langkahnya akan dijelaskan pada panel status.
X Esc
Sebelum PgUp
Berikut PgDn

e-Lecture: The content of this slide is hidden and only available for legitimate CS lecturer worldwide. Drop an email to visualgo.info at gmail dot com if you want to activate this CS lecturer-only feature and you are really a CS lecturer (show your University staff profile).

X Esc
Sebelum PgUp
Berikut PgDn
Kendalikan animasi dengan tombol kendali! Terdapat pula shortcut melalui keyboard:
Spasi: play/pause/replay
Panah kanan/kiri: maju ke depan/belakang
-/+: turunkan/tingkatkan kecepatan

X Esc
Sebelum PgUp
Berikut PgDn
Kembali ke 'Mode Eksplorasi' untuk memulai eksplorasi!

Harap diingat bahwa jika anda menemukan bug pada visualisasi ini atau bila anda ingin meminta fitur / visualisasi baru, jangan segan-segan untuk menghubungi pemimpin proyek ini: Dr Steven Halim melalui alamat emailnya: stevenhalim at gmail dot com.
X Esc
Sebelum PgUp

Bangun Pohon Akhiran (instant)

Substring Berulang Terpanjang

========================

Substring Sama Terpanjang

>

GATAGACA$

BANANA$

MISSISSIPPI$

AAAAAAA$

Lakukan

Build Generalized ST and Compute LCS

Tentang Tim Syarat Guna

Tentang

VisuAlgo digagas pada tahun 2011 oleh Dr Steven Halim sebagai alat untuk membantu murid-muridnya mengerti struktur data dan algoritma dengan memampukan mereka untuk mempelajari dasar-dasar struktur data dan algoritma secara otodidak dan dengan kecepatan mereka sendiri.


VisuAlgo mempunya banyak algoritma-algoritma tingkat lanjut yang dibahas didalam buku Dr Steven Halim ('Competitive Programming', yang ditulis bersama adiknya Dr Felix Halim) dan lebih lagi. Hari ini, beberapa dari visualisasi/animasi algoritma-algoritma tingkat lanjut ini hanya ditemukan di VisuAlgo.


Meskipun pada khususnya didesain untuk murid-murid National University of Singapore (NUS) yang mengambil berbagai kelas-kelas struktur data dan algoritma (contoh: CS1010, CS1020, CS2010, CS2020, CS3230, dan CS3233), sebagai pendukung pembelajaran online, kami berharap bahwa orang-orang di berbagai belahan dunia menemukan visualisasi-visualisasi di website ini berguna bagi mereka juga.


VisuAlgo tidak didesain untuk layar sentuh kecil (seperti smartphones) dari awalnya karena kami harus membuat banyak visualisasi-visualisasi algoritma kompleks yang membutuhkan banyak pixels dan gestur klik-dan-tarik untuk interaksinya. Resolusi layar minimum untuk pengalaman pengguna yang lumayan adalah 1024x768 dan hanya halaman utama VisuAlgo yang secara relatif lebih ramah dengan layar kecil.


VisuAlgo adalah proyek yang sedang terus berlangsung dan visualisasi-visualisasi yang lebih kompleks sedang dibuat.


Perkembangan yang paling menarik adalah pembuatan pertanyaan otomatis (sistem kuis online) yang bisa dipakai oleh murid-murid untuk menguji pengetahuan mereka tentang dasar-dasar struktur data dan algoritma. Pertanyaan-pertanyaan dibuat secara acak dengan semacam rumus dan jawaban-jawaban murid-murid dinilai secara instan setelah dikirim ke server penilai kami. Sistem kuis online ini, saat sudah diadopsi oleh banyak dosen Ilmu Komputer diseluruh dunia, seharusnya bisa menghapuskan pertanyaan-pertanyaan dasar tentang struktur data dan algoritma dari ujian-ujian di banyak Universitas. Dengan memberikan bobot kecil (tapi tidak kosong) supaya murid-murid mengerjakan kuis online ini, seorang dosen Ilmu Komputer dapat dengan signifikan meningkatkan penguasaan materi dari murid-muridnya tentang pertanyaan-pertanyaan dasar ini karena murid-murid mempunyai kesempatan untuk menjawab pertanyaan-pertanyaan ini yang bisa dinilai secara instan sebelum mereka mengambil kuis online yang resmi. Mode latihan saat ini mempunyai pertanyaan-pertanyaan untuk 12 modul visualisasi. Kami akan segera menambahkan pertanyaan-pertanyaan untuk 8 modul visualisasi lainnya sehingga setiap every modul visualisasi di VisuAlgo mempunyai komponen kuis online.


Cabang pengembangan aktif lainnya adalah sub-proyek penerjemahan dari VisuAlgo. Kami mau menyiapkan basis data kosa kata Ilmu Komputer dalam bahasa Inggris yang digunakan di sistem VisuAlgo. Ini adalah pekerjaan besar yang membutuhkan crowdsourcing. Saat sistem tersebut siap, kami akan mengundang beberapa dari anda untuk berkontribusi, terutama bila bahasa Inggris bukan bahasa ibu anda. Saat ini, kami juga telah menulis catatan-catatan publik tentang VisuAlgo dalam berbagai bahasa:
zh, id, kr, vn, th.

Tim

Pemimpin & Penasihat Proyek (Jul 2011-sekarang)
Dr Steven Halim, Senior Lecturer, School of Computing (SoC), National University of Singapore (NUS)
Dr Felix Halim, Software Engineer, Google (Mountain View)

Murid-Murid S1 Peniliti 1 (Jul 2011-Apr 2012)
Koh Zi Chun, Victor Loh Bo Huai

Murid-Murid Proyek Tahun Terakhir/UROP 1 (Jul 2012-Dec 2013)
Phan Thi Quynh Trang, Peter Phandi, Albert Millardo Tjindradinata, Nguyen Hoang Duy

Murid-Murid Proyek Tahun Terakhir/UROP 2 (Jun 2013-Apr 2014)
Rose Marie Tan Zhao Yun, Ivan Reinaldo

Murid-Murid S1 Peniliti 2 (May 2014-Jul 2014)
Jonathan Irvin Gunawan, Nathan Azaria, Ian Leow Tze Wei, Nguyen Viet Dung, Nguyen Khac Tung, Steven Kester Yuwono, Cao Shengze, Mohan Jishnu

Murid-Murid Proyek Tahun Terakhir/UROP 3 (Jun 2014-Apr 2015)
Erin Teo Yi Ling, Wang Zi

Murid-Murid Proyek Tahun Terakhir/UROP 4 (Jun 2016-Dec 2017)
Truong Ngoc Khanh, John Kevin Tjahjadi, Gabriella Michelle, Muhammad Rais Fathin Mudzakir

List of translators who have contributed ≥100 translations can be found at statistics page.

Ucapan Terima Kasih
Proyek ini dimungkinkan karena Hibah Pengembangan Pengajaran dari NUS Centre for Development of Teaching and Learning (CDTL).

Syarat Guna

VisuAlgo bebas biaya untuk komunitas Ilmu Komputer di dunia. Jika anda menyukai VisuAlgo, satu-satunya pembayaran yang kami minta dari anda adalah agar anda menceritakan keberadaan VisuAlgo kepada murid-murid/dosen-dosen Ilmu Komputer yang anda tahu =) lewat Facebook, Twitter, situs mata kuliah, ulasan di blog, email, dsb.


Jika anda adalah murid/dosen struktur data dan algoritma, anda diijinkan untuk menggunakan situs ini secara langsung di kelas-kelas anda. Jika anda mengambil screen shots (video-video) dari situs ini, anda dapat menggunakan screen shots (video-video) tersebut ditempat lain asalkan anda menyebut URL dari situs ini (http://visualgo.net) dan/atau daftar publikasi dibawah ini sebagai referensi. Tetapi, anda TIDAK diijinkan untuk mengunduh berkas-berkas VisuAlgo (sisi-klien) dan memasangnya di situs anda sendiri karena itu dikategorikan sebagai plagiat. Saat ini, kami TIDAK mengijinkan orang lain untuk membuat cabang/varian dari proyek VisuAlgo ini. Menggunakan kopi offline (sisi-klien) dari VisuAlgo untuk kepentingan pribadi diijinkan.


Ingat bahwa komponen kuis online dari VisuAlgo secara natur membutuhkan sisi-server dan tidak bisa dengan mudah disimpan di komputer lokal. Saat ini, publik hanya bisa menggunkaan 'mode latihan' untuk mengakses sistem kuis online. Saat ini, 'mode ujian' adalah sistem untuk mengakses pertanyaan-pertanyaan acak ini yang digunakan untuk ujian resmi di NUS. Dosen-dosen Ilmu Komputer yang lain harus menghubungi Steven jika anda mau mencoba 'mode ujian' tersebut.


Dafatar Publikasi


Karya ini telah dipresentasikan singkat pada CLI Workshop sewaktu ACM ICPC World Finals 2012 (Poland, Warsaw) dan pada IOI Conference di IOI 2012 (Sirmione-Montichiari, Italy). Anda bisa mengklik link ini untuk membaca makalah kami tahun 2012 tentang sistem ini (yang belum disebut sebagai VisuAlgo pada tahun 2012 tersebut).


Karya ini dibuat denbgan bantuan bekas murid-murid saya. Laporan-laporan proyek yang cukup mutakhir bisa dibaca disini: Erin, Wang Zi, Rose, Ivan.


Laporan Bug atau Meminta Fitur Baru


VisuAlgo bukanlah proyek yang sudah selesai. Dr Steven Halim masih aktif dalam mengembangkan VisuAlgo. Jika anda adalah pengguna VisuAlgo dan menemukan bug di halaman visualisasi/sistem kuis online atau jika anda mau meminta fitur baru, silahkan hubungi Dr Steven Halim. Alamat emailnya adalah gabungan dari namanya dan tambahkan gmail titik com.