Doctorat
Le couplage de panneaux photovoltaïques avec une batterie électrochimique permet d’atténuer le déphasage journalier entre production et demande d’électricité dans un micro-réseau. Pour le stockage d’électricité à long-terme, l'utilisation conjointe d'un électrolyseur, d'un stockage hydrogène et d'une pile à combustible offre en principe la possibilité de conserver l'électricité produite en été pour les besoins accrus de l'hiver. Le contrôle optimal en temps réel des unités de stockage des micro-réseaux est entravé par les données aléatoires et le comportement dynamique non-linéaire des unités sur des horizons temporels longs.
Ce travail présente une méthodologie de dimensionnement et pilotage d’un micro-réseau comprenant une production d’électricité photovoltaïque, une batterie lithium-ion et un stockage hydrogène selon des objectifs économiques, environnementaux et techniques. Le dimensionnement des unités d’un micro-réseau établit leurs contraintes d’utilisation, tandis que les critères à optimiser pour son dimensionnement (comme le coût de l’énergie, le taux d’autoconsommation, la probabilité de pannes) dépendent de la gestion de ces unités. Cette interdépendance justifie le développement d’une méthodologie de dimensionnement couplée au contrôle à long-terme du micro-réseau.
La gestion d’un micro-réseau est influencée par des grandeurs aléatoires telles que la demande et l’énergie produite à chaque instant. L’apprentissage par renforcement est une méthodologie de prise de décision séquentielle s’appuyant sur un modèle dynamique du système et pouvant adapter sa stratégie à des données aléatoires. Dans un premier temps, une méthodologie de contrôle par apprentissage par renforcement est adoptée en intégrant des non-linéarités telles que le vieillissement du système de stockage. L’apprentissage par renforcement a permis de maintenir une politique de contrôle des unités efficace au regard des critères ciblés. Cette efficacité est maintenue malgré des données différentes et un horizon temporel plus long que ceux sur lesquels le modèle a été construit. Les stratégies de contrôle développées suggèrent que l’intérêt du stockage à long-terme de l’électricité dépend des caractéristiques du micro-réseau et en particulier de l’amplitude de la demande et de la capacité de la batterie. L’étude montre qu’un compromis doit être trouvé entre la rentabilité économique du micro-réseau et la garantie de son autonomie.
Une méthode d’optimisation bi-niveaux est développée afin de parvenir à un dimensionnement des équipements avec contrôle optimal. La gestion du micro-réseau par apprentissage par renforcement en constitue la boucle interne, tandis que le dimensionnement des unités est réalisé via un algorithme de recuit-simulé dans la boucle principale. Une attention particulière est accordée à la minimisation du temps de calcul, grâce au développement d’une méthode de transfert de politique de contrôle d’une itération de la boucle principale à une autre. L’utilisation de l’apprentissage par renforcement hors ligne a permis d’apprendre des stratégies de contrôle des unités sans interaction aléatoire avec la simulation du micro-réseau. L’apprentissage des stratégies s’effectue selon l’observation des décisions de contrôle prises par un modèle entraîné sur d’autres dimensionnements à des itérations antérieures. Le temps de calcul est plus de deux fois plus court et la qualité de la politique de contrôle apprise n’est pas affectée. Les résultats sont analysés au regard des objectifs considérés, de la stratégie de contrôle et des données intégrées à la simulation du micro-réseau.
Mots clés : soutenance
Informations
- Julien Mauries (jmauries)
- 11 décembre 2023 10:17
- Soutenance
- Français
- Doctorat
Commentaire(s)