Prédire la part d’herbe dans les rations bovines par spectres MIR et machine learning
Photo : Amy Birkinshaw,
HAFL
Comment prouver une alimentation basée sur les herbages ? Une approche fondée sur l’apprentissage automatique et l’analyse routinière par spectrométrie moyen infrarouge (MIR) du contrôle du lait semble prometteuse.
Contexte
Dans les pays comme la Suisse, présentant une part élevée d’herbages, le lait issu de systèmes de production basés sur les herbages est considéré comme durable. Les consommateurs et consommatrices sont prêts à payer une prime pour les produits de ce type, souvent associés à une détention respectueuse des animaux et à des bienfaits pour la santé. Or, il n’existe pas encore de définition uniforme d’une production « basée sur des herbages », et ce paramètre ne peut être démontré qu’indirectement : les programmes utilisent la part d’herbe dans la ration, les jours de pâture ou la surface de pâturage disponible. Autant de méthodes chronophages, difficiles à contrôler et sujettes aux erreurs, qui plaident pour des moyens de preuve directe. Les données issues de la spectrométrie moyen infrarouge (MIR), déjà utilisées dans le contrôle du lait pour déterminer les teneurs en matières grasses, en protéines, en lactose et en urée, combinée à l’apprentissage automatique, semblent prometteuses.
De nouvelles méthodes basées sur l’apprentissage automatique
Jusqu’à présent, l’analyse discriminante des moindres carrés partiels (PLS-DA) était le seul algorithme d’apprentissage automatique avec lequel on déterminait, avec les spectres MIR et un succès mitigé, la proportion d’aliments à base d’herbages dans la ration. Dans l’étude récemment publiée, trois nouveaux algorithmes (Least absolute Shrinkage and Selection Operator [LASSO], Random Forest [RF], Support Vector Machines [SVM]) basés sur l’apprentissage automatique ont été utilisés pour prédire l’alimentation à base d’herbages, à l’aide de trois sources de données: le nombre d’ondes du spectre MIR, les caractéristiques qualitatives du lait (matières grasses et protéines) et un nouvel indicateur tenant compte de la «saisonnalité» des échantillons de lait.
Perspectives
Sur les 1132 échantillons analysés, le modèle le plus performant (LASSO) a permis de classer ≥ 50 % de l’ensemble des fourrages herbagers avec une exactitude de 79 %, une précision de 85 %, une sensibilité de 91 %, une spécificité de 14 % et un score F1 de 88 %. La part d’herbe fraiche ≥ 70 % a été classée avec une exactitude de 86 %, une précision de 62 %, une sensibilité de 39 %, une spécificité de 95 % et un score F1 de 48 %. Sur la base des résultats présentés dans la publication, une méthodologie pourrait être développée pour automatiser et simplifier la preuve d’une alimentation basée sur des herbages, comme souhaité par des organisations privées et publiques.
Conclusions
- L’approche consistant à alimenter les modèles d’apprentissage automatique avec une combinaison de données sur l’alimentation, les spectres MIR, les caractéristiques de qualité du lait et la saisonnalité semble prometteuse.
- Les approches LASSO et PLS-DA semblent supérieures aux approches RF et SVM pour la classification des fourrages herbagers.
- Les modèles testés ont fait leurs preuves dans le contrôle du lait issu de systèmes de production basés sur les herbages dans un nombre limité d’exploitations agricoles: les modèles développés doivent à présent être validés à l’aide de jeux de données plus importants et, le cas échéant, complétés par d’autres caractéristiques.
Référence bibliographique
Suitability of different machine learning algorithms for the classification of the proportion of grassland-based forages at the herd level using mid-infrared spectral information from routine milk control.