【講座題目】對(duì)電力市場(chǎng)負(fù)荷服務(wù)實(shí)體的聯(lián)合投標(biāo)與定價(jià)的深度強(qiáng)化學(xué)習(xí)
【講座時(shí)間】2019年12月16日(星期一)上午10:30
【講座地點(diǎn)】保定校區(qū) 教一樓 217
【主 講 人】Hongbo Sun,美國(guó)三菱電機(jī)研究所高級(jí)首席研究科學(xué)家
【主講人簡(jiǎn)介】
Hongbo Sun,在重慶大學(xué)獲得電氣工程博士學(xué)位,現(xiàn)任美國(guó)三菱電機(jī)研究所高級(jí)首席研究科學(xué)家,在加入三菱電機(jī)研究所之前,他曾先后擔(dān)任過(guò)重慶大學(xué)的全職教授、Oracle 的首席應(yīng)用工程師、SPL 的技術(shù)架構(gòu)師。他參與編著了一本書(shū)籍專(zhuān)著,并發(fā)表 110 余篇論文,并獲得 25 項(xiàng)專(zhuān)利。他的研究方向包括電力系統(tǒng)的運(yùn)行和控制、電力系統(tǒng)的規(guī)劃和分析、智能電網(wǎng)的應(yīng)用。
【內(nèi)容簡(jiǎn)介】
在本次報(bào)告中,主講人將對(duì)負(fù)荷服務(wù)實(shí)體聯(lián)合在電力批發(fā)市場(chǎng)進(jìn)行能源投標(biāo)和在零售電力市場(chǎng)能源定價(jià)的問(wèn)題進(jìn)行講解。聯(lián)合投標(biāo)和定價(jià)問(wèn)題被構(gòu)建為具有連續(xù)狀態(tài)和行為空間的馬爾可夫決策過(guò)程,其中,能源投標(biāo)和能源定價(jià)是兩個(gè)具有共同目標(biāo)的行為。應(yīng)用深度確定性策略梯度算法來(lái)求解此馬爾可夫決策過(guò)程,以獲取最佳的投標(biāo)和定價(jià)策略。然而,深度確定性策略梯度算法通常需要大量的狀態(tài)轉(zhuǎn)換樣本,導(dǎo)致很高的計(jì)算成本。為此,應(yīng)用神經(jīng)網(wǎng)絡(luò)從歷史數(shù)據(jù)中學(xué)習(xí)動(dòng)態(tài)報(bào)價(jià)和價(jià)格響應(yīng)函數(shù),去分別構(gòu)建電力批發(fā)市場(chǎng)和終端用戶(hù)集體行為的模型。這些響應(yīng)函數(shù)可準(zhǔn)確捕獲批發(fā)電力市場(chǎng)出清結(jié)果與終端用戶(hù)的響應(yīng)之間的時(shí)間相關(guān)性,并可用于生成狀態(tài)轉(zhuǎn)換樣本,而無(wú)需任何計(jì)算成本。更重要的是,響應(yīng)函數(shù)還為馬爾科夫決策過(guò)程中的狀態(tài)選擇提供了信息。本報(bào)告還通過(guò)一個(gè)算例將說(shuō)明所提出方法的有效性。