horairestrains / tools /getdetailsfromstopname_v2.py
alihmaou's picture
Upload tools/getdetailsfromstopname_v2.py with huggingface_hub
29bd65d verified
import gradio as gr
import json
from PIL import Image
import numpy as np
# --- User Defined Logic ---
import duckdb
import requests
import pandas as pd
import os
import time
from datetime import datetime, timedelta
def getdetailsfromstopname(stop_name_pattern):
"""
Recherche des arrêts de transport en commun en Île-de-France par nom partiel.
Args:
stop_name_pattern: Le nom ou partie du nom de l'arrêt à rechercher (ex: "Grigny", "Charles de Gaulle", etc.)
Returns:
Une liste de dictionnaires contenant les informations des arrêts trouvés:
- route_long_name: Nom de la ligne
- stop_id: Identifiant de l'arrêt
- stop_name: Nom complet de l'arrêt
- stop_lon: Longitude
- stop_lat: Latitude
- OperatorName: Nom de l'opérateur
- Nom_commune: Nom de la commune
- Code_insee: Code INSEE de la commune
- Pointgeo: Coordonnées géographiques
"""
# URL du fichier parquet
parquet_url = "https://data.iledefrance-mobilites.fr/api/explore/v2.1/catalog/datasets/arrets-lignes/exports/parquet"
# Chemin local pour le cache
cache_dir = "/tmp/mcp_cache"
cache_file = os.path.join(cache_dir, "arrets-lignes.parquet")
try:
# Créer le dossier de cache s'il n'existe pas
os.makedirs(cache_dir, exist_ok=True)
# Vérifier si le fichier existe et n'est pas trop vieux (24h)
if os.path.exists(cache_file):
file_age = datetime.now() - datetime.fromtimestamp(os.path.getmtime(cache_file))
if file_age > timedelta(hours=24):
os.remove(cache_file) # Supprimer le cache expiré
# Télécharger le fichier s'il n'existe pas
if not os.path.exists(cache_file):
print(f"Téléchargement du fichier parquet depuis {parquet_url}...")
response = requests.get(parquet_url, timeout=300) # 5 minutes de timeout
response.raise_for_status()
with open(cache_file, 'wb') as f:
f.write(response.content)
print("Téléchargement terminé.")
# Créer une connexion DuckDB en mémoire
conn = duckdb.connect(':memory:')
# Charger le fichier parquet depuis le cache local
query = f"""
SELECT *
FROM read_parquet('{cache_file}')
WHERE LOWER(stop_name) LIKE LOWER('%{stop_name_pattern}%')
ORDER BY stop_name, route_long_name
LIMIT 50 -- Limiter pour éviter les résultats trop volumineux
"""
# Exécuter la requête
result_df = conn.execute(query).fetch_df()
# Fermer la connexion
conn.close()
if result_df.empty:
return f"Aucun arrêt trouvé contenant '{stop_name_pattern}'"
# Convertir le DataFrame en liste de dictionnaires
stops_info = []
for _, row in result_df.iterrows():
stop_info = {
'route_long_name': str(row.get('route_long_name', 'N/A')),
'stop_id': str(row.get('stop_id', 'N/A')),
'stop_name': str(row.get('stop_name', 'N/A')),
'stop_lon': float(row.get('stop_lon', 0.0)) if pd.notna(row.get('stop_lon')) else 0.0,
'stop_lat': float(row.get('stop_lat', 0.0)) if pd.notna(row.get('stop_lat')) else 0.0,
'OperatorName': str(row.get('OperatorName', 'N/A')),
'Nom_commune': str(row.get('Nom_commune', 'N/A')),
'Code_insee': str(row.get('Code_insee', 'N/A')),
'Pointgeo': str(row.get('Pointgeo', 'N/A'))
}
stops_info.append(stop_info)
return stops_info
except requests.exceptions.Timeout:
return "Erreur: Le téléchargement a pris trop de temps. Veuillez réessayer plus tard."
except requests.exceptions.RequestException as e:
return f"Erreur lors du téléchargement des données: {str(e)}"
except Exception as e:
return f"Erreur lors de la recherche: {str(e)}"
# --- Interface Factory ---
def create_interface():
return gr.Interface(
fn=getdetailsfromstopname,
inputs=[gr.Textbox(label=k) for k in ['stop_name_pattern']],
outputs=gr.Textbox(label="Liste de dictionnaires contenant les informations des arrêts trouvés avec leurs identifiants, lignes et coordonnées géographiques"),
title="getdetailsfromstopname-v2",
description="Auto-generated tool: getdetailsfromstopname-v2"
)