Compare commits

...

3 Commits
Task_3 ... main

10 changed files with 237 additions and 78 deletions

14
TASK.md
View File

@ -1,7 +1,9 @@
# TASK 3:
# TASK 6:
* verlagert als Nächstes die Logik von 'fetch_bergbahnen' in ein eigenes Modul `overpass.py` aus.
* nennt die Funktion allgemeiner `fetch_overpass` (anstelle `fetch_bergbahnen`) -> somit würde es Sinn
machen, wenn wir den Query der Funktion als Argument mitgeben könnten (ist genereller).
* Erstellt in diesem `main.py` eine eigene 'main-Funktion', welche nur die Hauptlogik beinhalten und somit `fetch_overpass`
importiert und aufruft.
* bbox für Schweiz scheint zu gross und wirft einen error ... Lösungsmöglichkeiten?
-> Wir können die Schweiz (Koordinaten) in Unterregionen aufsplitten. Macht das bitte.
-> entfernt dazu die bbox für 'davos', nehmt die 'schweiz' und splittet sie in 4, 9 oder 16 Koordinaten-Tuples auf.
* Speichert und loggt in welchen Koordinaten-Tuples ein Fehler auftritt (gebt am Schluss eine Zusammenfassung
dieser fehlerhaften Queries aus)
* Bildet ein neues Modul `storage.py` und baut den Code, welcher zum Speichern der POIS als .json auf der Festplatte nötig ist.

Binary file not shown.

Binary file not shown.

113
main.py
View File

@ -1,87 +1,56 @@
import requests
from pprint import pprint
from overpass import load_pois, OverpassApiError
from models import POI
import logging
from queries.bergbahn import BERGBAHN_QUERY
from queries.restaurant import RESTAURANT_QUERY
# ---------------------------------------------------------------------------
# Logging konfigurieren
# ---------------------------------------------------------------------------
OVERPASS_URL = "https://overpass-api.de/api/interpreter"
# Erinnerung: Log-Levels -> DEBUG, INFO, WARNING, ERROR, CRITICAL
BERGBAHN_QUERY = """
[out:json][timeout:3][maxsize:500000];
(
node["aerialway"="station"]({bbox});
way["aerialway"="station"]({bbox});
node["railway"="funicular"]({bbox});
way["railway"="funicular"]({bbox});
node["railway"="station"]["funicular"="yes"]({bbox});
);
out center body;
"""
class OverpassApiError(Exception):
pass
logging.basicConfig(
level=logging.INFO,
format="%(asctime)s [%(levelname)s] %(message)s",
datefmt="%H:%M:%S",
)
logger = logging.getLogger(__name__)
def fetch_bergbahnen(bbox: tuple) -> dict:
"""
Fragt die Overpass API nach Bergbahnen in der angegebenen Bounding Box ab.
Sendet einen HTTP-POST-Request an die Overpass API und gibt die geparste
JSON-Antwort zurück.
# ---------------------------------------------------------------------------
# Konfiguration
# ---------------------------------------------------------------------------
Args:
bbox (tuple): Bounding Box als 4-Tuple in Dezimalgrad:
(south, west, north, east)
Beispiel Davos: (46.72, 9.70, 46.92, 10.00)
Beispiel Schweiz: (45.8, 5.9, 47.8, 10.5)
BBOXEN = {
"davos": (46.72, 9.70, 46.92, 10.00),
"schweiz": (45.8, 5.9, 47.8, 10.5),
}
Returns:
dict: Geparste JSON-Antwort der Overpass API. Die Antwort enthält
unter dem Schlüssel "elements" eine Liste von OSM-Objekten
(nodes und ways) mit ihren Tags und Koordinaten.
Beispiel:
{
"elements": [
{
"type": "node",
"id": 123456,
"lat": 46.8, "lon": 9.8,
"tags": {"aerialway": "station", "name": "Jakobshorn"}
},
...
]
}
QUERY = {"bergbahn": BERGBAHN_QUERY}
Raises:
OverpassApiError: Wenn die API nicht innerhalb des gesetzten Timeouts
antwortet (clientseitig, unabhängig vom serverseitigen
Timeout im Query).
OverpassApiError: Wenn der Request aus einem anderen Grund fehlschlägt
(z.B. 429 Too Many Requests, 504 Gateway Timeout,
Netzwerkfehler).
"""
bbox_str = ",".join(map(str, bbox))
query = BERGBAHN_QUERY.format(bbox=bbox_str)
try:
response = requests.post(
OVERPASS_URL,
data={"data": query},
timeout=5,
headers={"User-Agent": "CDS Exercise"},
)
response.raise_for_status() # prüft den HTTP-Statuscode der Antwort und wirft eine Exception, wenn es ein Fehler war (requests.HTTPError)
except requests.Timeout as exc:
raise OverpassApiError("Overpass-API Timeout") from exc
except requests.RequestException as exc:
raise OverpassApiError("Overpass-API Request fehlgeschlagen") from exc
return response.json()
# ---------------------------------------------------------------------------
# Hauptlogik
# ---------------------------------------------------------------------------
def main() -> None:
query_name = list(QUERY.keys())[0]
for name, bbox in BBOXEN.items():
logger.info(f"Starte Abfrage für Query: {query_name}, '{name}' mit bbox={bbox}")
try:
pois: list[POI] = load_pois(overpass_query=QUERY.get(query_name,""), bbox=bbox)
except OverpassApiError as exc:
logger.error(f"Fehler bei '{name}': {exc}")
continue
logger.info(f"\n{name}: {len(pois)} POIs gefunden")
for poi in pois:
logger.info(f" {poi.id}: ({poi.lat}, {poi.lon})")
if __name__ == "__main__":
# bbox = (46.72, 9.70, 46.92, 10.00)
bbox = (45.8, 5.9, 47.8, 10.5)
result = fetch_bergbahnen(bbox)
pprint(result)
main()

15
models.py Normal file
View File

@ -0,0 +1,15 @@
from dataclasses import dataclass, field
@dataclass
class POI:
id: str
type: str
lat: float
lon: float
tags: dict = field(default_factory=dict) # weil mutable defaults in Dataclasses eine bekannte Python-Falle sind
# (alle Instanzen würden dasselbe Dict teilen...)
# REMARK:
# Wann eine eigene Dataclass für tags?
# Nur wenn die tags strukturiert und vorhersehbar sind, was bei OSM-Daten nicht der Fall ist...

148
overpass.py Normal file
View File

@ -0,0 +1,148 @@
import requests
from pprint import pprint
from models import POI
import logging
logger = logging.getLogger(__name__)
OVERPASS_URL = "https://overpass-api.de/api/interpreter"
# REMARK:
# zwei Strategien:
# Fail-fast: Ein Fehler bricht alles ab → sinnvoll, wenn jedes Element kritisch ist
# Best-effort: Fehlerhafte Elemente überspringen, Rest verarbeiten → sinnvoll bei OSM-Daten, wo einzelne Einträge unvollständig sein können
class OverpassApiError(Exception):
pass
def load_pois(overpass_query: str, bbox: tuple) -> list[POI]:
"""Führt Fetch und Parse zusammen aus."""
raw = _fetch_overpass(overpass_query=overpass_query, bbox=bbox)
return _parse_pois(raw)
def _fetch_overpass(overpass_query: str, bbox: tuple) -> dict:
"""
Fragt die Overpass API nach Bergbahnen in der angegebenen Bounding Box ab.
Sendet einen HTTP-POST-Request an die Overpass API und gibt die geparste
JSON-Antwort zurück.
Args:
overpass_query (str): Overpass-QL-Query mit dem Platzhalter {bbox}.
Beispiel:
'[out:json][timeout:5];
(node["aerialway"="station"]({bbox}););
out center body;'
bbox (tuple): Bounding Box als 4-Tuple in Dezimalgrad:
(south, west, north, east)
Beispiel Davos: (46.72, 9.70, 46.92, 10.00)
Beispiel Schweiz: (45.8, 5.9, 47.8, 10.5)
Returns:
dict: Geparste JSON-Antwort der Overpass API. Die Antwort enthält
unter dem Schlüssel "elements" eine Liste von OSM-Objekten
(nodes und ways) mit ihren Tags und Koordinaten.
Beispiel:
{
"elements": [
{
"type": "node",
"id": 123456,
"lat": 46.8, "lon": 9.8,
"tags": {"aerialway": "station", "name": "Jakobshorn"}
},
...
]
}
Raises:
OverpassApiError: Wenn die API nicht innerhalb des gesetzten Timeouts
antwortet (clientseitig, unabhängig vom serverseitigen
Timeout im Query).
OverpassApiError: Wenn der Request aus einem anderen Grund fehlschlägt
(z.B. 429 Too Many Requests, 504 Gateway Timeout,
Netzwerkfehler).
"""
bbox_str = ",".join(map(str, bbox))
query = overpass_query.format(bbox=bbox_str)
try:
response = requests.post(
OVERPASS_URL,
data={"data": query},
timeout=15,
headers={"User-Agent": "CDS Exercise"},
)
response.raise_for_status() # prüft den HTTP-Statuscode der Antwort und wirft eine Exception, wenn es ein Fehler war (requests.HTTPError)
except requests.Timeout as exc:
raise OverpassApiError("Overpass-API Timeout") from exc
except requests.RequestException as exc:
raise OverpassApiError("Overpass-API Request fehlgeschlagen") from exc
data = response.json()
# zusätzliche Fehlermöglichkeit -> Status ist zwar 200, aber Liste mit Ergebnissen ist leer...
if "remark" in data:
raise OverpassApiError(f"Overpass Query-Fehler: {data['remark']}")
return data
def _parse_poi(data: dict) -> POI:
""" Wandelt ein einzelnes Overpass-Element in ein POI-Objekt um.
:param data: dictionary mit Daten für ein POI-Objekt
:return: POI-Objekt
"""
try:
return POI(
id=data['id'],
type=data.get('type', ''),
lat=float(data.get("lat") or data["center"]["lat"]),
lon=float(data.get("lon") or data["center"]["lon"]),
tags=data.get('tags', {}),
)
except KeyError as exc:
raise OverpassApiError("Feld in API - Antwort fehlt") from exc
except (TypeError, ValueError) as exc:
raise OverpassApiError("API - Antwort hat falsches Format ") from exc
def _parse_pois(raw: dict) -> list[POI]:
"""Extrahiert alle Elemente aus der API-Antwort und parst sie.
Fehlerhafte Elemente werden übersprungen und geloggt.
"""
pois = []
for element in raw.get("elements", []):
try:
pois.append(_parse_poi(element))
except OverpassApiError as exc:
logger.warning(f"POI übersprungen (id={element.get('id', '?')}): {exc}")
return pois
if __name__ == "__main__":
BERGBAHN_QUERY = """
[out:json][timeout:2][maxsize:500000];
(
node["aerialway"="station"]({bbox});
way["aerialway"="station"]({bbox});
node["railway"="funicular"]({bbox});
way["railway"="funicular"]({bbox});
node["railway"="station"]["funicular"="yes"]({bbox});
);
out center body;
"""
bbox = (46.72, 9.70, 46.92, 10.00)
# bbox = (45.8, 5.9, 47.8, 10.5)
result = load_pois(overpass_query=BERGBAHN_QUERY, bbox=bbox)
pprint(result)

Binary file not shown.

Binary file not shown.

13
queries/bergbahn.py Normal file
View File

@ -0,0 +1,13 @@
# -> Prinzip der Trennung von Daten und Logik!
BERGBAHN_QUERY = """
[out:json][timeout:2][maxsize:500000];
(
node["aerialway"="station"]({bbox});
way["aerialway"="station"]({bbox});
node["railway"="funicular"]({bbox});
way["railway"="funicular"]({bbox});
node["railway"="station"]["funicular"="yes"]({bbox});
);
out center body;
"""

12
queries/restaurant.py Normal file
View File

@ -0,0 +1,12 @@
# -> Prinzip der Trennung von Daten und Logik!
RESTAURANT_QUERY = """
[out:json][timeout:10][maxsize:500000];
(
node["amenity"="restaurant"]({bbox});
way["amenity"="restaurant"]({bbox});
node["amenity"="cafe"]({bbox});
way["amenity"="cafe"]({bbox});
);
out center body;
"""