File size: 4,620 Bytes
29bd65d
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
import gradio as gr
import json
from PIL import Image
import numpy as np

# --- User Defined Logic ---
import duckdb
import requests
import pandas as pd
import os
import time
from datetime import datetime, timedelta

def getdetailsfromstopname(stop_name_pattern):
    """
    Recherche des arrêts de transport en commun en Île-de-France par nom partiel.
    
    Args:
        stop_name_pattern: Le nom ou partie du nom de l'arrêt à rechercher (ex: "Grigny", "Charles de Gaulle", etc.)
    
    Returns:
        Une liste de dictionnaires contenant les informations des arrêts trouvés:
        - route_long_name: Nom de la ligne
        - stop_id: Identifiant de l'arrêt
        - stop_name: Nom complet de l'arrêt
        - stop_lon: Longitude
        - stop_lat: Latitude
        - OperatorName: Nom de l'opérateur
        - Nom_commune: Nom de la commune
        - Code_insee: Code INSEE de la commune
        - Pointgeo: Coordonnées géographiques
    """
    
    # URL du fichier parquet
    parquet_url = "https://data.iledefrance-mobilites.fr/api/explore/v2.1/catalog/datasets/arrets-lignes/exports/parquet"
    
    # Chemin local pour le cache
    cache_dir = "/tmp/mcp_cache"
    cache_file = os.path.join(cache_dir, "arrets-lignes.parquet")
    
    try:
        # Créer le dossier de cache s'il n'existe pas
        os.makedirs(cache_dir, exist_ok=True)
        
        # Vérifier si le fichier existe et n'est pas trop vieux (24h)
        if os.path.exists(cache_file):
            file_age = datetime.now() - datetime.fromtimestamp(os.path.getmtime(cache_file))
            if file_age > timedelta(hours=24):
                os.remove(cache_file)  # Supprimer le cache expiré
        
        # Télécharger le fichier s'il n'existe pas
        if not os.path.exists(cache_file):
            print(f"Téléchargement du fichier parquet depuis {parquet_url}...")
            response = requests.get(parquet_url, timeout=300)  # 5 minutes de timeout
            response.raise_for_status()
            
            with open(cache_file, 'wb') as f:
                f.write(response.content)
            print("Téléchargement terminé.")
        
        # Créer une connexion DuckDB en mémoire
        conn = duckdb.connect(':memory:')
        
        # Charger le fichier parquet depuis le cache local
        query = f"""
        SELECT * 
        FROM read_parquet('{cache_file}')
        WHERE LOWER(stop_name) LIKE LOWER('%{stop_name_pattern}%')
        ORDER BY stop_name, route_long_name
        LIMIT 50  -- Limiter pour éviter les résultats trop volumineux
        """
        
        # Exécuter la requête
        result_df = conn.execute(query).fetch_df()
        
        # Fermer la connexion
        conn.close()
        
        if result_df.empty:
            return f"Aucun arrêt trouvé contenant '{stop_name_pattern}'"
        
        # Convertir le DataFrame en liste de dictionnaires
        stops_info = []
        for _, row in result_df.iterrows():
            stop_info = {
                'route_long_name': str(row.get('route_long_name', 'N/A')),
                'stop_id': str(row.get('stop_id', 'N/A')),
                'stop_name': str(row.get('stop_name', 'N/A')),
                'stop_lon': float(row.get('stop_lon', 0.0)) if pd.notna(row.get('stop_lon')) else 0.0,
                'stop_lat': float(row.get('stop_lat', 0.0)) if pd.notna(row.get('stop_lat')) else 0.0,
                'OperatorName': str(row.get('OperatorName', 'N/A')),
                'Nom_commune': str(row.get('Nom_commune', 'N/A')),
                'Code_insee': str(row.get('Code_insee', 'N/A')),
                'Pointgeo': str(row.get('Pointgeo', 'N/A'))
            }
            stops_info.append(stop_info)
        
        return stops_info
        
    except requests.exceptions.Timeout:
        return "Erreur: Le téléchargement a pris trop de temps. Veuillez réessayer plus tard."
    except requests.exceptions.RequestException as e:
        return f"Erreur lors du téléchargement des données: {str(e)}"
    except Exception as e:
        return f"Erreur lors de la recherche: {str(e)}"

# --- Interface Factory ---
def create_interface():
    return gr.Interface(
        fn=getdetailsfromstopname,
        inputs=[gr.Textbox(label=k) for k in ['stop_name_pattern']],
        outputs=gr.Textbox(label="Liste de dictionnaires contenant les informations des arrêts trouvés avec leurs identifiants, lignes et coordonnées géographiques"),
        title="getdetailsfromstopname-v2",
        description="Auto-generated tool: getdetailsfromstopname-v2"
    )