Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

A Comparison of Text String Similarity Algorithms for POI Name Harmonisation
Autoři: Kysela Jiří
Rok: 2018
Druh publikace: článek ve sborníku
Název zdroje: Articulated Motion and Deformable Objects, AMDO 2018 : conference proceedings
Název nakladatele: Springer
Místo vydání: Heidelberg
Strana od-do: 121-130
Jazyk Název Abstrakt Klíčová slova
cze Srovnání algoritmů porovnávající textové řetězce pro harmonizaci názvů POI Článek se zabývá analýzou možností harmonizace klíčových dat z bodů zájmu v různých geosociálních sítích. Harmonizace dat je v příspěvku realizována pomocí pěti nejúčinnějších algoritmů, které porovnávají podobnost textových řetězců. Hlavním cílem tohoto článku je identifikovat nejvhodnější algoritmus pro harmonizaci různých názvů de facto identických bodů zájmu v různých geosociálních sítích. Srovnání zahrnuje výsledky následujících algoritmů: Jaro-Winkler, Levenshtein, Damerau-Levenshtein, Jaccard a Cosine. POI;Geosocial networks;Jaro;Jaro-Winkler;Levenshtein;Damerau-Levenshtein;Jaccard;Cosine
eng A Comparison of Text String Similarity Algorithms for POI Name Harmonisation The article deals with the analysis of harmonisation options of key data from points of interest across different geosocial networks. Data harmonization is realised in the paper by using the five most effective algorithms which compare similarity of text strings. The main aim of this article is to identify the most appropriate algorithm for harmonizing different names of de facto identical points of interest within different geosocial networks. The comparison includes results of the following algorithms: Jaro-Winkler similarity, Levenshtein similarity, Damerau-Levenshtein similarity, Jaccard similarity coefficient and Cosine similarity. POI;Geosocial networks;Jaro;Jaro-Winkler;Levenshtein;Damerau-Levenshtein;Jaccard;Cosine