Optimalizace distribuční sítě je zajímavý marketingový problém, přišlo mi přínosné se na něj podívat optikou erka a erkových packagí (zejména sf, RCzechia a leaflet).

Pro demonstraci techniky jsem si vybral problém jen napůl vážný: optimalizaci “sítě” hospod a barů ve městě Praze.

Červené křížky představují hospody a bary v Praze. Svým rozložením trošku připomínají chobotnici - na husto v centru, a do periferie vysílá chapadla podél linek metra.

Pro účely cvičení jsem rozdělil plochu Prahy do 322 čtverců o ploše 2 km² a pro každý z nich napočetl tři promměnné:

  • počet obyvatel Prahy podle posledního sčítání lidu z ČSÚ
  • počet cizinců, respektive počet hotelových lůžek, rovněž ze staťáku k roku 2017
  • počet stanic metra, pomocí GeoJSONu z open data portálu města Prahy

Závislost jsem uchopil jednoduchou lineární regresí:

## 
## Call:
## lm(formula = barcount ~ pop + beds + stations, data = grid)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -18.028  -1.430   0.150   0.733  40.323 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -0.7495977  0.4141490  -1.810 0.071244 .  
## pop          0.0006343  0.0000874   7.258 3.04e-12 ***
## beds         0.0030737  0.0002195  14.005  < 2e-16 ***
## stations     3.0116793  0.7878523   3.823 0.000159 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5.243 on 318 degrees of freedom
## Multiple R-squared:  0.6893, Adjusted R-squared:  0.6864 
## F-statistic: 235.2 on 3 and 318 DF,  p-value: < 2.2e-16

Model mi vyšel vcelku dobře, R² 0.69 je pro model této složitosti vcelku cajk.

Z modelu čtu, že na uživení jedné hospody je třeba 1577 Pražanů, zatímco cizinců stačí jen 325. Jedna stanice metra uživí 3.01 hospod. Zajímavé.

Ještě zajímavější než model ale je srovnání předpovídaných hodnot ze skutečností: z něj poznáme, kde je hospod nečekaně mnoho či nečekaně málo.

Tyto krajní hodnoty pak můžeme optimalizovat - přemisťovat hospody z míst relativního přebytku do oblastí nedostatku.



Závěry z toho vyvozuju tři:

  • Letná, Smíchov a Karlín mají hospod více, než bych čekal; asi to tam žije…
  • na Petříně a Olšanských hřbitovech se základní infrastruktury spíše nedostává
  • GIS v erku je zábavný :)

PS: techničtější verze tohoto článku, včetně zdrojového kódu, je na anglické verzi stránek.