Spatial Data Science v sociální geografii
Martin Fleischmann
Martin Fleischmann
Anna Brázdová
Martin Fleischmann
Anna Brázdová
zimní semestr
4
-
Spatial Data Science v sociální geografii zavádí do výuky studentů geografie data science (datovou vědu) a výpočetní analýzu s využitím open source nástrojů napsaných v programovacím jazyce Python.
Předmět poskytuje studentům s malou nebo žádnou předchozí zkušeností s programováním základní kompetence v oblasti spatial data science (SDS). Zahrnuje:
- Rozšíření jejich statistické a numerické gramotnosti.
- Seznámení se základními principy programování a nejmodernějšími výpočetními nástroji pro SDS.
- Představení uceleného přehledu hlavních metodik, které má geograf v oblasti prostorových dat k dispozici, a vybudování intuice, jak a kdy je lze použít.
- Zaměření na reálné aplikace těchto technik v kontextu sociální geografie.
Kurz se zaměřuje na data, která se obvykle používají v sociální geografii, ale jeho použitelnost se neomezuje pouze na sociální geografii. V praxi pracuje spíše s vektorovými daty než s rastry (i když i těmi se trochu zabývá) a často s daty zachycujícími různé aspekty lidského života. Koncepty spatial data science jsou však univerzální.
Po absolvování kurzu budou studenti schopni:
- Prokázat porozumění pokročilým konceptům spatial data science a používat otevřené nástroje pro analýzu prostorových dat.
- Porozumět motivaci a vnitřní logice hlavních metodických přístupů SDS.
- Kriticky zhodnotit vhodnost konkrétních technik, co mohou nabídnout a jak mohou pomoci odpovědět na geografické otázky.
- Použít několik technik prostorové analýzy a interpretovat výsledky v procesu přeměny dat na informace.
- Samostatně pracovat s nástroji SDS s cílem získat cenné poznatky, když se setkají s novým souborem dat.
-
Rey, Sergio, Dani Arribas-Bel, and Levi John Wolf. 2023. Geographic Data Science with Python. Chapman & Hall/CRC Texts in Statistical Science. London, England: Taylor & Francis.
-
Předmět je zakončen seminární prací ve formě výpočetní eseje. Výpočetní esej je esej, jejíž narativ je podpořen kódem a jeho výsledky, které jsou součástí eseje. Esej rozsahem odpovídá 2 500-5 000 slovům. Jedná se však o celkový rozsah. Vzhledem k tomu, že studenti budou muset zpracovat nejen text (v češtině či angličtině), ale také kód a jeho výstupy, jsou zde uvedeny požadavky:
- Maximální počet slov je 1 500 (bibliografie, pokud je uvedena, se na počtu slov nepodílí).
- Maximálně 5 map nebo dalších grafických výstupů (jeden výstup může obsahovat více než jednu mapu a bude se počítat pouze jako jeden, ale musí být začleněn do stejného matplotlib objektu)
- Maximálně 2 tabulky
- Úkol se opírá o dvě datové sady a má dvě části. Každá z těchto částí bude podrobněji vysvětlena v průběhu kurzu
Hodnotící kritéria:
Esej je primárně hodnocena na percentuální škále 0-100. Pro úspěšné zakončení předmětu je potřeba získat minimálně 40%:
- 0-15: kód nefunguje a není k němu žádná dokumentace.
- 16-39: kód nefunguje nebo funguje, ale nevede k očekávanému výsledku. Existuje dokumentace vysvětlující jeho logiku.
- 40-49: kód běží a produkuje očekávaný výstup. Existuje určitá dokumentace vysvětlující jeho logiku.
- 50-59: kód běží a vytváří očekávaný výstup. Existuje rozsáhlá dokumentace vysvětlující jeho logiku.
- 60-69: kód běží a produkuje očekávaný výstup. Existuje rozsáhlá dokumentace ve správném formátu, která vysvětluje jeho logiku.
- 70-79: vše jako výše, navíc návrh kódu obsahuje jasné důkazy dovedností prezentovaných v pokročilých částech kurzu (např. vlastní metody, porozumění seznamu atd.).
- 80-100: vše jako výše, navíc kód obsahuje nové poznatky, které rozšiřují/zlepšují funkčnost, která byla studentovi poskytnuta (např. optimalizace algoritmů, nové metody pro provedení úlohy atd.).