Indeks Jaccard
Tampilan
(Dialihkan dari Koefisien tanimoto)
Indeks Jaccard (disebut juga koefisien kemiripan Jaccard) adalah ukuran kemiripan dan keragaman himpunan sampel. Indeks ini dikembangkan oleh Paul Jaccard (awalnya bernama coefficient de communauté)[1] dan dirumuskan secara mandiri oleh T. Tanimoto.[2] Karenanya, istilah indeks Tanimoto atau koefisien Tanimoto juga dipakai dalam bidang-bidang tertentu. Namun, keduanya juga secara umum mengambil rasio Irisan per Gabungan (bahasa Inggris: Intersection over Union/IoU). Indeks ini bisa diukur sebagai berikut:
Kemiripan atribut biner tak simetri
[sunting | sunting sumber]Bagian ini kosong. Anda bisa membantu dengan melengkapinya. |
Klasifikasi biner
[sunting | sunting sumber]Bagian ini kosong. Anda bisa membantu dengan melengkapinya. |
Lihat pula
[sunting | sunting sumber]- Koefisien tumpang-tindih (koefisien Szymkiewicz–Simpson)
- Koefisien pencocokan sederhana (koefisien kemiripan Rand/SMC)
- Jarak Hamming
- Koefisien Sørensen–Dice (indeks Sørensen/koefisien Dice)
- Indeks Tversky
- Korelasi
- Informasi bersama (MI)
Referensi
[sunting | sunting sumber]- ^ Jaccard, Paul (Februari 1912). "The Distribution of the Flora in the Alpine Zone". New Phytologist (dalam bahasa Inggris). 11 (2): 37–50. doi:10.1111/j.1469-8137.1912.tb05611.x. ISSN 0028-646X.
- ^ Tanimoto, T.T. (17 November 1958). "An Elementary Mathematical theory of Classification and Prediction". Internal IBM Technical Report. 1957 (8?).
Bacaan lebih lanjut
[sunting | sunting sumber]- Tan, P.N., Steinbach, M., dan Kumar, V. (2005). Introduction to Data Mining. ISBN 0-321-32136-7.
- Jaccard, P. (1901). "Étude comparative de la distribution florale dans une portion des Alpes et des Jura". Bulletin de la Société vaudoise des sciences naturelles. 37: 547–579.
- Jaccard, P. (1912). "The Distribution of the flora in the alpine zone". New Phytologist. 11 (2): 37–50. doi:10.1111/j.1469-8137.1912.tb05611.x.