基於城市大數據的大氣污染時空因果關係高斯貝葉斯模型

基於城市大數據的大氣污染時空因果關係高斯貝葉斯模型
李安國教授
十月 5, 2022
研究

確定空氣污染物的因果關係並回答諸如北京空氣污染物來自何處等問題,對於為政府決策提供信息至關重要。本文通過挖掘城市大數據,識別了不同位置空氣污染物之間的時空因果關係。這具有挑戰性,原因有兩個:1)由於空氣污染物可以在本地產生或從附近分散,因此我們需要從許多候選位置以時間效率發現ST空間中的原因;2)空氣污染物之間的因果關係受到氣象學等混雜變數的進一步影響。為了解決這些問題,我們提出了一個具有兩個分量的耦合高斯貝葉斯模型:1)高斯貝葉斯網路(GBN)來表示空氣污染物之間的因果關係,使用基於熵的演算法來有效地定位ST空間中的原因;2)將因果關係與氣象學相結合的耦合模型,以更好地學習參數,同時消除混雜的影響。利用2013年6月1日至2015年5月1日期間52個城市的空氣品質和氣象數據對所提出的模型進行了驗證。結果表明,我們的模型在時間效率和預測準確性方面都優於基線因果關係學習方法。

基於城市大數據的大氣污染時空因果關係高斯貝葉斯模型

麻省理工學院學士、碩士、博士;香港大學電子工程系首席教授;清華大學長江學者、客座教授;IEEE院士,香港工程科學院院士;香港特別行政區銅紫荊勳章獲得者。