作者為中國政法大學刑事司法學院教授
習近平總書記指出:“人工智能是新一輪科技革命和產業變革的重要驅動力量,將對全球經濟社會發展和人類文明進步產生深遠影響。”生成式人工智能是指基於算法、模型、規則生成文本、圖片、聲音、視頻、代碼等內容的技術。在海量數據與強大算力支撐下,聽得懂、說得出、能互動的生成式人工智能快速迭代升級,呈現出良好互動性、高度通用性、智能生成性等特征,並正與各行各業形成更加剛性、高頻、泛在、深度的聯結,也導致其潛在風險更多更真實。黨的二十屆三中全會《決定》科學把握人工智能發展規律和特點,提出“建立人工智能安全監管制度”“完善生成式人工智能發展和管理機制”,體現了更好統籌發展和安全的客觀需要,為推動人工智能領域的技術進步、產業發展與安全保障指明前進方向。
生成式人工智能在技術運行上可分為三個階段,即前置性學習訓練及人工標注輔助算法升級的准備階段,輸入數據進行算法處理得出生成物的運算階段,生成物進入社會加以運用的生成階段。我們要深入分析生成式人工智能的運行機理,把握各階段安全風險形成與發展的特征,運用法治手段加強系統性治理,確保生成式人工智能所蘊含的巨大力量始終在法治軌道上發揮作用。
在生成式人工智能的准備階段,數據安全風險易發多發、較為突出。生成式人工智能通過數據訓練、數據處理分析來提煉信息、預測趨勢。這就必須對數據進行適當分類,確立不同類型數據的利用模式和保護方式,以妥善應對相關數據安全風險,避免數據違規利用或者不當泄露,產生侵權方面的糾紛。比如,在政務處理流程中形成的政務數據是數字政府的核心要素。生成式人工智能為了得出相對准確的結論,不可避免地要收集分析政務數據。應當明確生成式人工智能獲取和利用政務數據的法律規則,既滿足利用政務數據服務社會的需求,有力支持人工智能政務服務大模型開發、訓練和應用,提高公共服務和社會治理智能化水平﹔又規范其加工方式,避免利用政務數據得出的成果侵害個人權益、破壞社會公共秩序。對於個人數據而言,生成式人工智能通過組合分析挖掘其潛在價值,其對個人數據的收集利用及其成果可能對公民權利造成侵害。實踐中,生成式人工智能傾向於過度收集個人數據以提升結論准確性,比如,通過分析醫療健康數據來挖掘個人行蹤、預測個人生活軌跡。為此,必須堅持依法收集,按照技術所需的最小范圍收集個人數據,設置合理的數據處理深度,避免過度挖掘潛在信息。綜上,應將分類分級的數據安全監管要求嵌入生成式人工智能的准備階段,避免數據安全風險演化為具體的法益損害后果。
在生成式人工智能的運算階段,內生於人工智能大模型的算法偏見風險值得警惕。生成式人工智能對於數據的分析和處理主要通過算法模型。不同於傳統算法模型,生成式人工智能在進行機器學習的同時,還會以大量的人工標注來校正機器學習的結論,推動人工智能進化。但“機器學習+人工標注”作為算法技術內核,也會使人類的意志與偏好所產生的影響比單純的機器學習更大。個人偏好的影響疊加在算法模型本身的偏見之上,將導致算法偏見的負面效應倍增,算法偏見的產生更加難以追溯和預防。防范化解算法偏見風險,應根據算法偏見的產生原理與產生場域進行針對性治理。要將法律規范的要求深度嵌入生成式人工智能的算法模型之中,推動技術向善,消除算法偏見,確保合理利用生成式人工智能算法並分配算力資源。基於技管結合理念,加強對算法的全周期安全監管,將法律規范的要求落實到生成式人工智能運行的全流程之中。在設置算法之初就要遵循相關法律規則與技術標准,落實“機器學習+人工標注”的規范要求,審查存在風險的算法模塊,更好發現生成式人工智能算法模型中的技術風險﹔當發現先天性算法偏見時,依據法律要求從生成式人工智能的算法內部進行糾正,確保修改后的算法能正常運行﹔事后出現問題時,對人工智能算法進行溯源治理,實現精准歸責並加以糾正,推動完善生成式人工智能的算法監管標准,填補事前預防審查的不足,以技術手段與法律手段並行做到發展與管理並重。
在生成式人工智能的生成階段,存在著與生成物相關的知識產權風險、生成物濫用風險等多種風險。由於生成式人工智能的智能化程度很高,可以實現內容自動化編纂、智能化潤色加工、多模態轉換以及創造性生成,直接改變了內容的生產方式與供給模式,相較於以往的人工智能系統產生了顛覆性變化,由此引發了生成式人工智能的生成物知識產權歸屬、知識產權保護等問題。有的人認為生成式人工智能生成物是數據算法的結論,其本質上是計算與模仿,而非智力勞動,無法成為知識產權的客體。反對者則認為生成式人工智能模擬人腦神經網絡的構造來獲取與輸出數據,通過卷積神經網絡控制自身的設計與制造,其具有獨創性與創新性的生成物應當受知識產權法保護。同時,生成式人工智能還增加了知識產權糾紛風險和保護難度,一些生成物可能含有侵犯他人知識產權的內容,或者經過加工等手段被包裝成個人擁有完全知識產權的原創作品,引發相關知識產權爭議。為及時化解相關問題,應對生成式人工智能的技術模式、技術原理按照知識產權法的標准開展實質分析,如果技術上需要人類意志介入,使生成物能夠產生獨創性與創新性,應賦予知識產權並明確其歸屬,強化生成式人工智能領域知識產權的系統性保護﹔同時要合理確定對生成物知識產權保護的范圍,避免保護范圍無限擴張,妨礙生成式人工智能的推廣運用和技術發展。還要加強對生成物濫用風險的治理。比如,要求作品清楚標識生成式人工智能在作者創作中發揮作用的情況,加強對可能涉及違法犯罪的深度偽造、AI換臉等生成物的精准化、常態化監管,等等。
生成式人工智能在社會應用中產生的擴散影響還有很多,除了上述風險還有很多其他類型的風險,比如加劇信息不對稱、擴大數字鴻溝、損害數字弱勢群體的利益等。要根據實際情況作出應對,盡量降低新技術給社會發展帶來的不良沖擊。