Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Monitoring Of Apartment Prices In The Czech Republic Through Parsing A Web Advertising Server
Rok: 2020
Druh publikace: článek v odborném periodiku
Název zdroje: Acta Electrotechnica et Informatica
Strana od-do: 9-14
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Monitorování cen bytů v České republice pomocí analýzy webového inzertního serveru Časové řady cen bytů v České republice bývají k dispozici pouze v dílčích statistikách Statistického úřadu. Ceny bytů jsou prezentovány hlavně v článcích a komentářích realitních agentů. Nedostupnost dat vede k malému počtu statisticky orientovaných publikací o realitním trhu. Hlavním cílem našeho příspěvku je tedy představit softwarové řešení pro analýzu realitních webů. Z nich jsme schopni načíst pouze údaje o požadovaných cenách z inzerátů, skutečné prodejní ceny nejsou takto získány. Díky automatickému dotazování jsme schopni získat údaje o podlahové ploše inzerovaných bytů a požadované kupní ceně. K načtení dat ze sreality.cz byl napsán skript v Pythonu. Databáze MongoDB se použila k ukládání inzerátů. Nové inzeráty se ukládají přímo do databáze. Poté jsme vypočetli denní průměrnou cena bytu 1 metr čtvereční pro každou obec. Filtrovaná data bylo možno poté zobrazit nebo exportovat do souboru prostřednictvím webového rozhraní. Ve statistických analýzách budeme prezentovat grafy vývoje cen bytů a počtu inzerátů v různých obcích České republiky v období 09/2018 - 12/2019. Dále jsme se věnovali otázce shlukování obcí podle podobnosti vývoje cen. analýza webových stránek, trh s nemovitostmi, časová řada cen bytů, podlahová plocha, kupní cena, shluková analýza
eng Monitoring Of Apartment Prices In The Czech Republic Through Parsing A Web Advertising Server Time series of apartment prices in the Czech Republic are available only in the partial statistics of the Statistical Office. Apartment prices are presented mainly in the articles and comments from the real estate agents. Data unavailability leads to a small number of statistically oriented publications on the real estate market. The main aim of our paper is thus to introduce a software solution for parsing real estate websites. Of course, we are only able to retrieve data on demanded prices from advertisements, actual prices are not achieved. By automatic polling, we are able to get data on the floor area of advertised apartments and the asked purchase price. A Python script was written to retrieve data from sreality.cz. The MongoDB database is used to store ads. New ads are saved directly to the database. Then, daily average apartment price of 1 square meter for each municipality are calculated. The filtered data can then be displayed or exported to a file via the web interface. In the statistical analyses, we present graphs showing the development of apartment prices and the number of advertisements in various municipalities of the Czech Republic in the period of 09/2018 – 12/2019. Next, we address the issue of clustering of municipalities with regard to the similarity of relative price changes. web page parsing, real estate market, time series, apartment prices, floor area, purchased price, cluster analysis