【講座題目】對電力市場(chǎng)負荷服務(wù)實(shí)體的聯(lián)合投標與定價(jià)的深度強化學(xué)習
【講座時(shí)間】2019年12月16日(星期一)上午10:30
【講座地點(diǎn)】保定校區 教一樓 217
【主 講 人】Hongbo Sun,美國三菱電機研究所高級首席研究科學(xué)家
【主講人簡(jiǎn)介】
Hongbo Sun,在重慶大學(xué)獲得電氣工程博士學(xué)位,現任美國三菱電機研究所高級首席研究科學(xué)家,在加入三菱電機研究所之前,他曾先后擔任過(guò)重慶大學(xué)的全職教授、Oracle 的首席應用工程師、SPL 的技術(shù)架構師。他參與編著(zhù)了一本書(shū)籍專(zhuān)著(zhù),并發(fā)表 110 余篇論文,并獲得 25 項專(zhuān)利。他的研究方向包括電力系統的運行和控制、電力系統的規劃和分析、智能電網(wǎng)的應用。
【內容簡(jiǎn)介】
在本次報告中,主講人將對負荷服務(wù)實(shí)體聯(lián)合在電力批發(fā)市場(chǎng)進(jìn)行能源投標和在零售電力市場(chǎng)能源定價(jià)的問(wèn)題進(jìn)行講解。聯(lián)合投標和定價(jià)問(wèn)題被構建為具有連續狀態(tài)和行為空間的馬爾可夫決策過(guò)程,其中,能源投標和能源定價(jià)是兩個(gè)具有共同目標的行為。應用深度確定性策略梯度算法來(lái)求解此馬爾可夫決策過(guò)程,以獲取最佳的投標和定價(jià)策略。然而,深度確定性策略梯度算法通常需要大量的狀態(tài)轉換樣本,導致很高的計算成本。為此,應用神經(jīng)網(wǎng)絡(luò )從歷史數據中學(xué)習動(dòng)態(tài)報價(jià)和價(jià)格響應函數,去分別構建電力批發(fā)市場(chǎng)和終端用戶(hù)集體行為的模型。這些響應函數可準確捕獲批發(fā)電力市場(chǎng)出清結果與終端用戶(hù)的響應之間的時(shí)間相關(guān)性,并可用于生成狀態(tài)轉換樣本,而無(wú)需任何計算成本。更重要的是,響應函數還為馬爾科夫決策過(guò)程中的狀態(tài)選擇提供了信息。本報告還通過(guò)一個(gè)算例將說(shuō)明所提出方法的有效性。