🍒 Modèle IA – Aide au déclenchement de la récolte de cerise
(Burlat & Summit – Référentiel CTIFL)
👉 English version available below
📌 Contexte du projet
Ce projet a été réalisé dans un cadre expérimental et pédagogique, avec des contraintes fortes liées à :
- Infrastructure : entraînement LoRA limité à Mistral‑7B‑Instruct v0.3 sur Google Colab, avec compatibilités restreintes et ressources GPU modestes.
- Dataset : construit à partir des références CTIFL pour la maturité des cerises, volontairement limité à deux variétés (Burlat et Summit).
- L’espace combinatoire était fini (≈314 configurations), ce qui a permis un apprentissage exhaustif mais restreint.
- La génération de données plus vaste n’était pas possible à cause de l’instabilité des LLM frontier ce jour là (charges serveurs, mises à jours ?) et du coût de validation.
- Objectif : démontrer qu’un modèle IA peut apprendre un raisonnement expert discret et explicable à partir d’un dataset propre et limité.
- Il ne s’agit pas d’un modèle prédictif continu, mais d’un outil d’aide à la décision basé sur des règles agronomiques qualitatives.
- Le projet illustre la faisabilité d’un système expert appris par IA, dans un contexte contraint.
⚠️ Limites connues :
- Le modèle ne couvre pas toutes les variétés CTIFL.
- Il ne prend pas en compte les facteurs climatiques, culturaux ou contextuels.
- Les résultats doivent être interprétés comme un support pédagogique et démonstratif, et non comme un outil opérationnel universel.
🎯 Finalité réelle : proposer une preuve de concept d’IA explicable en agronomie, montrant comment un raisonnement expert peut être capturé par un petit modèle via SFT LoRA, dans un cadre limité mais reproductible.
🎯 Objectif
Ce dépôt présente un modèle IA spécialisé destiné à l’aide au déclenchement du stade de récolte de la cerise, pour les variétés Burlat et Summit, à partir d’un raisonnement agronomique expert inspiré des références CTIFL.
Le modèle classe chaque situation dans l’un des trois stades suivants :
- Récolte trop précoce
- Récolte à maturité optimale
- Récolte trop tardive
Il s’agit d’un outil d’aide à la décision, et non d’un modèle de prédiction physico-chimique continue.
📥 Entrées du modèle
- Variété :
BurlatouSummit - Couleur : entier de
2à6(code couleur CTIFL) - Fermeté :
Très ferme·Ferme·Moyen·Insuffisant - IR (sucres) :
Très sucré·Sucré·Moyen·Insuffisant - Acidité :
Acide·Acidulé·Moyen·Peu acide
🧠 Logique
- La couleur est l’indicateur principal du stade de récolte.
- Les critères fermeté, sucres et acidité sont secondaires.
- Le raisonnement est qualitatif, discret et explicite, proche de la pratique terrain.
Le modèle est entraîné pour reproduire ce raisonnement expert, pas pour extrapoler hors référentiel.
📊 Dataset
- 300 lignes d’entraînement
- Dataset expert-driven, volontairement peu bruité
- L’espace combinatoire agronomiquement cohérent est fini (≈314 configurations)
La convergence rapide du modèle est une propriété structurelle attendue, pas un artefact.
⚙️ Entraînement
- Modèle de base : Mistral-7B-Instruct
- Méthode : LoRA (Supervised Fine-Tuning)
- Durée : 3 epochs
- Objectif : apprentissage d’une frontière de décision experte
✅ Résultats et limites connues
- Prédictions stables et cohérentes sur la majorité des cas
- Zone frontière identifiée pour certains cas Summit – Couleur 5, selon les indicateurs secondaires
Cette ambiguïté est :
- réaliste agronomiquement,
- documentée,
- assumée.
🧩 Cas d’usage
- Aide à la décision de récolte
- Démonstration d’un système expert appris par IA
- Support pédagogique (agronomie, IA explicable)
- Intégration possible dans des agents ou workflows automatisés
⚠️ Avertissement
Ce modèle :
- ne remplace pas l’expertise humaine,
- ne prend pas en compte le contexte climatique ou cultural,
- doit être utilisé comme outil d’aide, pas comme oracle.
👤 Auteur
Projet développé par Jérôme
Approche : systèmes experts, IA explicable, agronomie appliquée.
🍒 AI Model – Cherry Harvest Timing Decision Support
(Burlat & Summit – CTIFL-based reasoning)
📌 Project Context
This project was carried out in an experimental and educational framework, under strong constraints related to:
- Infrastructure: LoRA fine‑tuning limited to Mistral‑7B‑Instruct v0.3 on Google Colab, with restricted compatibility and modest GPU resources.
- Dataset: built from CTIFL references for cherry maturity, deliberately limited to two varieties (Burlat and Summit).
- The combinatorial space was finite (≈314 configurations), allowing exhaustive but restricted training.
- A larger dataset generation was not possible due to the instability of frontier LLMs at that time (server load, ongoing updates?), which made outputs inconsistent and unsuitable for scaling.
- Objective: to demonstrate that an AI model can learn a discrete, expert‑driven, and explainable reasoning process from a clean and limited dataset.
- This is not a continuous physico‑chemical prediction model, but a decision‑support tool based on qualitative agronomic rules.
- The project illustrates the feasibility of an expert system learned by AI, within a constrained but reproducible context.
⚠️ Known limitations:
- The model does not cover all CTIFL cherry varieties.
- It does not take into account climatic, cultural, or contextual factors.
- Results should be interpreted as a pedagogical and demonstrative support, not as a universal operational tool.
🎯 Real purpose: to provide a proof of concept of explainable AI in agronomy, showing how expert reasoning can be captured by a small model via LoRA fine‑tuning, within a limited but meaningful framework.
🎯 Goal
This repository presents a specialized AI model designed to support cherry harvest timing decisions for Burlat and Summit, based on expert agronomic reasoning inspired by CTIFL references.
The model outputs one of three stages:
- Harvest too early
- Harvest at optimal maturity
- Harvest too late
This is a decision-support tool, not a continuous physico-chemical predictor.
📥 Inputs
- Variety:
BurlatorSummit - Color: integer from
2to6(CTIFL color code) - Firmness:
Very firm·Firm·Medium·Insufficient - Sugars (IR):
Very sweet·Sweet·Medium·Insufficient - Acidity:
Acidic·Tangy·Medium·Low acidity
🧠 Logic
- Color is the primary signal.
- Firmness, sugars, and acidity are secondary indicators.
- The model reproduces a discrete expert decision process, similar to field practice.
📊 Dataset
- 300 training samples
- Expert-driven, low-noise dataset
- Finite valid configuration space (≈314 combinations)
⚙️ Training
- Base model: Mistral-7B-Instruct
- Method: LoRA (SFT)
- Training: 3 epochs, fast convergence
✅ Results & limitations
- Overall stable and coherent predictions
- A known borderline zone for some Summit – Color 5 cases
This ambiguity is realistic, documented, and intentionally preserved.
🧩 Use cases
- Harvest decision support
- AI-learned expert system demonstration
- Teaching material (agronomy, explainable AI)
- Agentic and automation workflows