Skip to main content

Login for students

Login for employees

Publication detail

A Comparison of Text String Similarity Algorithms for POI Name Harmonisation
Authors: Kysela Jiří
Year: 2018
Type of publication: článek ve sborníku
Name of source: Articulated Motion and Deformable Objects, AMDO 2018 : conference proceedings
Publisher name: Springer
Place: Heidelberg
Page from-to: 121-130
Titles:
Language Name Abstract Keywords
cze Srovnání algoritmů porovnávající textové řetězce pro harmonizaci názvů POI Článek se zabývá analýzou možností harmonizace klíčových dat z bodů zájmu v různých geosociálních sítích. Harmonizace dat je v příspěvku realizována pomocí pěti nejúčinnějších algoritmů, které porovnávají podobnost textových řetězců. Hlavním cílem tohoto článku je identifikovat nejvhodnější algoritmus pro harmonizaci různých názvů de facto identických bodů zájmu v různých geosociálních sítích. Srovnání zahrnuje výsledky následujících algoritmů: Jaro-Winkler, Levenshtein, Damerau-Levenshtein, Jaccard a Cosine. POI;Geosocial networks;Jaro;Jaro-Winkler;Levenshtein;Damerau-Levenshtein;Jaccard;Cosine
eng A Comparison of Text String Similarity Algorithms for POI Name Harmonisation The article deals with the analysis of harmonisation options of key data from points of interest across different geosocial networks. Data harmonization is realised in the paper by using the five most effective algorithms which compare similarity of text strings. The main aim of this article is to identify the most appropriate algorithm for harmonizing different names of de facto identical points of interest within different geosocial networks. The comparison includes results of the following algorithms: Jaro-Winkler similarity, Levenshtein similarity, Damerau-Levenshtein similarity, Jaccard similarity coefficient and Cosine similarity. POI;Geosocial networks;Jaro;Jaro-Winkler;Levenshtein;Damerau-Levenshtein;Jaccard;Cosine