经典AV网址,牛牛国产在线视频,国产成人精品久久二区二区,日本人妻丰满熟妇www色

財政部唯一指定政府采購信息網絡發布媒體 國家級政府采購專業網站

服務熱線:400-810-1996

數據驅動與因果驅動的雙向賦能

2025年06月06日 14:07 來源:數字中國打印

  中國工程院院士——薛禹勝

  尊敬的領導、各位來賓,我今天匯報的題目是《數據驅動和因果驅動的雙向賦能》。

  匯報分成四個部分:

  一、信息-物理-社會系統 (CPSS) 

  我們知道電力系統經過了很長的時間,在智能電網方面進行了很多研究工作和應用,為了溝通電力系統在智能電網中的研究工作和其他的領域之間的關系,我在IEEE總刊上發了一篇文章,介紹了中國提出來的CPSSE (信息C - 物理P - 社會S - 系統S概念下的,能源 E – 環境 E – 經濟 E協同發展)的框架,這個觀點性的文章發表在IEEE總刊觀點性欄目,欄目創立到現在近十年,能源領域一共有7篇左右的文章,中國機構僅有一篇,這篇文章闡述了我國的電網、電力走過了智能電網的道路,擴展到非電力的能源系統和非能源的物理系統,并且在不斷繼續擴展中。

  未來在以前的成果擴大基礎上還要增加第三維的信息,社會系統包括政策以及人的行為等。這個開放的因素會越來越重要,我們知道電力系統是能源鏈中的核心環節,是溝通可再生能源和終端能源的革命,所以在支撐經濟社會發展的同時,電力系統和能源鏈也是對于大氣中以二氧化碳為代表的溫室氣體的主要負責源頭之一。

  二、確定性模型整體還原(WRT)

  研究復雜系統之間的關系和正確引導政策制定,由此看到智能電網的概念實際就是針對行業能源中的核心環節,融合一個學科,包括Cyber和Physical,所以我們就形成了CPSP電力系統所講的智能電網的概念。

  隨著開放的新型電力系統和新型的能源體系的方向明確以后,我們在行業中就要擴展全部的能源鏈,引入環境鏈和經濟鏈;在學科方面,除了在Cyber和Physical兩個領域之中,我們還要增加社會因素,改革的時候離不開政策的引導也離不開每個參與者的行為方法。

  對于本來已經非常復雜的系統,因為引入了新的因素,使得復雜的系統變得更加復雜。下面講的是確定性的模型是進行研究的方法。

  可以看到,復雜的系統是在一個非常高維空間當中隨著時間變化的,對于非線性系統來講,二維的非線性系統才可以量化求解。要達到一個較好的科學管理和控制效果,一定要解決從高維空間中轉化到二維平面上的數學問題。數學模型是可以降階的,哪怕降一階,在大多數情況下可以接受,特殊情況下就會迎來比較大的風險,近幾百年來人類在整個認知里貫穿的都是如何認識復雜的問題,在近40年當中,中國科學家解決了這樣的問題。

  我們在生產機械零件的時候,例如軸承蓋,這個過程它并不是在三維空間進行的,而是在幾何視圖投影平面進行的,按照這三個平面中制造出來的零部件完全符合原來的設想,這些信息完全保留。這個例子啟發我們,高維空間上的信息是能夠降階的,我們通常說,在空間中丟失一個維度是不同的,而是將一個高維系統降到三個層面來討論。物理系統中四維、五維,可以用視圖表示,狀態空間可以在線性空間表現出來。拓展一下,以四維的空間為例,在數學空間當中可以在三維空間里再增加一個平面,就可以把新的變量多元到原來的系統中。

  我們分析整個系統的時候,在每一個平面系統上并沒有得到完整信息。以俯視圖為例,這個圓到底是一個洞還是柱子看不出來,只有在其他維度上把它補充上來,如果要把全部的信息都保存在俯視圖上,我們可以用顏色的深淺來反映高度信息,可以在這個平面包含整個信息。

  三維很好利用,我們可以在中國的衛星影像上看到海拔高度隨著平面點的變化而變化。如果說增加一個維度應該怎么辦,就提出了把一個復雜系統、一個新的觀點分成兩個部分。

  一個部分就是脫離具體的系統,還有一個部分就是指導問題研究來支撐它。 

  第二,時間的切片可以把非線性和時變性變成定長的線性化,然后再進行分析,因為橋梁映射是一個線性的矩陣,是可以進行變換的,經過理論證明,可以完全保留原來的性質。

  三、 基于符號串的預訓練 (SPT)

  對于具體問題來講,在這樣的認識中要提供模型,要保證映射中的推導、映射的矩陣,另外還要求分段的線性化深層次知識的提取。把這樣的概念應用到實際的復雜系統中,對于空間來講是分成不同的行為模式,在時間上分成不同的時間段,在矩陣中把模式是怎么隨著時間變化表示出來了,就可以把它的微結構表示出來。

  信息通過映射的方法映射到用光點來表示的時候,是不丟失的,這樣一個概念用在了我讀博士學位時創立的面積法則,這個方法是迄今為止國際上唯一一個得到嚴格證明的理論,并且得到大規模應用的量化方法,成功地支撐了電力防御系統。但是這碰到了兩個本質上的困難。

  第一個困難雖能嚴格求解確定性的復雜系,難以應對高維不確定性。原來我們研究的電力系統,是把它的注入量和受到的擾動設定為已知,隨著電力系統的開放、外部的一次能源的變化和自然界的極端災害,包括日常管理、通信系統、人才的適應性和水平都會影響電力系統的正常運行,反過來電力系統的任何擾動也會影響到身邊環境。

  第二個困難雖能揭示系統模型的行為機制,但并不是客觀系統的行為機制。我剛才介紹解決的問題和顏色的部分邊界條件和擾動情況是給定的,可以分析它并且把對策優化出來。這么高維的非線性的東西都是組合的,你如何指定確定性的分析邊界條件這個問題到現在都沒有很好解決,我們的目的是希望經過我們的分析能夠反映實際的客觀系統的規律性。但是我們現在沒有辦法做到,實際上研究的是把客觀的復雜系統變成一個數學模型,是去研究一個數學模型的行為,這個部分是我們認識中已經解決的。

  剛才所介紹的整體還原論的理論,也是我國科學家在國際上首創的,能夠把整體論和還原論結合起來的,并不能夠保證模型反映客觀協同,問題也沒有解決。這兩個問題本質的缺陷都可以溯源到原因,沒有辦法有效地顧及復雜的不確定因素影響,這個對我們因果驅動來講沒有辦法做到,恰恰是人工智能,特別是語言模型的一個長處。我們知道大語言模型實際是反映了條件概率的分布問題,可以根據前面詞匯的順序預測后面的詞匯,就可以在大規模的文本語料中進行預訓練和微調,進行深度強化學習,這個方法已經是得到廣泛的應用,具有非常強大的能力,并且也在不斷地快速發展當中。

  WRT的這兩個本質局限性都可以溯源到:難以有效計及復雜不確定性因素的影響,而基于統計學及概率論的AI 技術則適合于處理不確定性,這種方法和AI技術也都遺傳了本質的局限性,數據和語料的可信度,另外在不同場景的泛化性和可解釋性都比較差。

  在電力系統這樣非常嚴格地要求可靠性和可追溯性的情況下能不能應用大模型就成為我們要解決的主要問題了。

  因此,我引入了這個主題,探討如何將原本的整體還原論視為一種嚴格的數學方法,進而解析其中的機制并最終加以驗證。該方法在底層由非常堅實的因果關系驅動。然而,在計算初始條件時存在一定的不確定性。例如,對于大語言模型或電力系統,我們提出的觀點不能簡單地照搬大語言模型的做法。相反,我們提出了一種符號串預訓練技術,其基本概念與大語言模型非常相似,并且受其啟發。然而,我們的方法不僅僅是給出一個結論,而是提供一系列可能的潛在風險結論。這是我們目前正在進行的一項新的研究工作,旨在將前述的兩種方法綜合成一種新的方法。這張圖,表示的是因果算法和機器學習之間是怎么樣進行算力賦能的框架。這里面每個箭頭都是對另外一側思維方法的支撐,可以分別介紹一下。

  四、SPT的統計觀+WRT的機制觀

  從1986年開始我開始在EEAC 算法中探索因果與AI 思維的融合,并不斷完善后廣泛應用于國內外的電力工程,我們把因果模型轉化成積分的時候,完整的積分就是算子,可以把一個模型所有的信息和參數、故障反映在軌跡上,近百年的研究工作就止于這里,得到這個模型,后面工作就是靠人的解釋和經驗解讀,但是這條路走不通,研究進展因此停滯。我們提出了一種方法,求出曲線并進行量化分析,從而突破了局限,在參數條件和故障場景給定的情況下可以量化分析了。但是,對于未來尚未發生的事件,我無法確定在何種系統參數和故障場景下進行分析。因此,如果是基于因果驅動的方法,我們很難在龐大的空間中找到應關注的重點。我們希望利用人工智能來解決這個關注度的問題,在極其復雜的環境中,找到在未來短時間內或特定時間段內應關注系統的哪個部分。這是我們當前需要解決的關鍵問題。

  在這個過程中,我利用了大量機器學習方法。雖然當時我對其了解不深,也不完全理解自己所做工作的本質,但憑借工程直覺,我對軌跡進行了分解,并在一個二維等值平面上將量化結果進行可視化,然后再將這些結果聚合起來,從而解決了原方案中的問題。經過這20多年的努力,我們已經有了國際上唯一的工程化軟件,在國外,使用的都是20世紀末的出口軟件,后來因為種種關系,他們擔心我們軟件沒把源碼給他們,他們就不愿意采用,我們也不愿意把我們的研究結果再輸出了,所以我們是遙遙領先于國外的水平。

  在因果(EEAC)算法中,我們還可以引入人工智能因素,以協調因果關系的精度和適度。例如,我們有許多不同的近似因果算法。在使用積分時,可以通過不同的積分補償方法來獲得不同的精度。如果采用較大的積分補償,雖然無法得到嚴格的積分結果,但可以得到一個近似的結果。如果我改用大補償,用另一個更大一點的稍微修正一下,得到兩個結果我就塑造到AI中去,如果剛才兩個信號的差別很小,就意味著這個案例對補償是不敏感的,所以我們可以直接按照近似的解來判斷穩定性,如果發現這兩個補償改變以后結果曲線變化很大,就可以結合這樣一個嚴格的因果算法,經過嚴格算法輸出一個非常精確的結果。但是需要比較多的計算量,這樣的方法就可以使天文數字這樣的算力得到比較好地轉化。

  在AI中,我們也可以利用因果關系算法中得到的中間結果,例如每個節點的注入量。由于涉及幾十萬個變量,獲取的信息質量往往較差,因為難以確保所取的變量是關鍵變量。這些變量會隨著不同的擾動而變化,使得確定關鍵變量變得復雜。如果我們把信息綜合下因果關系用Y來表達它的注入量和拓撲結構,那么這個Y中的信息量就大大減少了,這是我們如何用因果關系幫助我們機器學習的例子。

  解決了算法層次上如何把人工智能和因果驅動兩者進行結合后,在宏觀上探討這兩者之間是否存在互補的地方。為此我們提出一個新的做法,現在研究團隊正在全力做這個工作。

  這個工作我們使用確定性的整體還原,保證出口只要在你給定的條件下,它的出口是嚴格的,可以使用數學證明的,剛才講到,第一,外界情況是變化的,比如臺風經過福建的時候,是動態的可能轉向,如果希望提前知道15分鐘的情況,哪些線路處在核心區域、高強度的臺風區域中,按照實際的臺風走向,理清楚哪些線路風險最高,用這個東西從大到小進行風險排序,排成一系列確定性場景,人工智能起到的作用就是把高維的不確定性因素降維到一大批確定性的問題來解決,底層是有確定性的整體還原論保證出口的正確性,這是嚴格的,但是不確定性是靠人工智能捕獲我們的注意力應該在什么地方,所以這兩者結合就可以解決目前的難題,也就是說如何在不確定性問題的風險決策中解決確定性問題的決策。但是對不確定性的問題需要做人工智能的幫助。

  要打破現在的人工智能和語言模型的最大障礙,以電力系統為例,在嚴格控制要求情況下,需要解決的問題是能夠把語言模型提供給確定性分析的模型仿真,發揮作用,這是兩層模型,下層是非常嚴格的因果量化保證,可以保證它的出口是完全精確的,并且可解釋的,但是故障系統的初始條件和考慮在什么擾動情況下分析確定性,這個交給語言模型來做,希望很快就可以做出一個實際的效果。

  直到現在,除了電力系統已經得到了廣泛應用外,這些應用普遍存在一個局限性,即沒有結合嚴格性。

  語言模型的出現使得我們重新反思了一下,解決一系列認識論中的協調過程,這些存在不同視角的協同,把兩個表面上非常矛盾地統一到一個框架里,這是我們正在做的非常宏偉的一個設想。這個設想在國際上都是第一次提出,也沒有其他方法在做。我們想到的就是用機器人的兩只眼睛觀測和左面、右面大腦分別主管不同的確定性分析和不確定性分析,這樣就可以攜手實現復雜系統的風險決策。我們用底層嚴格的整體還原論來表達,但是,高層不確定性的部分由語言模型來做,整體還原論就從一般的經驗性判斷擴展到非常嚴格的應用上面。

  最后簡單總結一下。

  第一點我們處在一個發展動態的社會當中,我們的對象越來越復雜,一定要在決策中從確定性分析提升到風險性決策中去。第二點新型電力系統同CPSSE一樣,是這個領域的護航者。第三點CPSS-EEE是南瑞集團提出新型電力系統發展的優化理論框架。第四點WRT是認識論中提出基礎理論。第五點如何把基礎理論和不確定性人工智能結合起來,以解決風險性方法論,這是一個非常重要的問題,特別是對電力系統,這些關鍵的技術中,不是只靠經驗來解決問題的時候,我們希望能夠找出一條新的路徑。

  謝謝大家的關注。

  (以上內容根據嘉賓發言速記整理)