近年來,《國務院關於加強數字政府建設的指導意見》、《國務院辦公廳關於依托全國一體化政務服務平台建立政務服務效能提升常態化工作機制的意見》等文件中,都提出要強化政務服務數字賦能,加強對人工智能等新技術的探索與運用。在《國務院關於進一步優化政務服務提升行政效能推動“高效辦成一件事”的指導意見》中,更具體提出了“探索應用自然語言大模型等技術,提升線上智能客服的意圖識別和精准回答能力,優化智能問答、智能搜索、智能導辦等服務,更好引導企業和群眾高效便利辦事”的要求。
人工智能技術的快速發展為提升政務服務供給能力和行政效能提供了重要支撐,有助於緩解企業和群眾辦事過程中“難、慢、繁”等實際問題,進一步推動我國數字政府建設。然而,在人工智能賦能政務服務的過程中,也暴露出諸多技術矛盾,尤其在數據治理、算法設計、安全機制和用戶體驗方面,亟需厘清人工智能賦能政務服務過程中潛在的技術矛盾。
不同於傳統“互聯網+政務服務”,人工智能賦能政務服務以新一代大模型技術為代表,結合新公共服務理論、整體性治理理論、數字治理理論和協同治理理論,深度變革了政府治理模式﹔並非數字技術與行政權力的簡單結合,而是一種深化。當前,政務數據治理過程復雜,智能算法的准確性和實戰性仍需提升,生成內容的安全性難以保障,以及服務事項之間的關聯協同不夠,導致“標准不統一、業務不協同、服務不便捷”等問題頻現,難以有效滿足公眾日益多樣化、個性化的服務需求。
本文從“數據、算法、安全、評估”四個層面分析當前人工智能技術賦能政務服務應用存在的主要技術矛盾,探索智能政務服務的“精准辦、協同辦、安全辦、滿意辦”的技術路徑,進一步提升政務服務的智能化與便利化水平,推動政務服務新質生產力的躍升。
一、技術矛盾與對策
(一)數據層面:口語化用戶表達與書面化政務語料之間的矛盾(精准辦)
在政務服務領域,大量的政策文件、辦事流程、法律法規等文件都是以標准化、規范化、書面化的語言來撰寫。而在實際政務服務過程中,用戶絕大多數都是以口語化、地域化、非規范化的方式來表達辦事的訴求。因此,僅基於政務語料庫訓練的大模型構建智能問答、智能導辦等系統很難快速精准地理解用戶的真實意圖,從而導致“政務語義鴻溝”問題。而面向政務服務的口語化樣本數據獲取困難、分布不均、高價值樣本稀疏,也導致直接使用有限的口語數據訓練模型時,效果難以達到預期。此外,政務數據的地域化和多樣性特點,也導致了難以滿足跨層級、跨地域的協同辦事需求,制約了政務服務事項的流暢執行。為了有效緩解政務語義鴻溝問題,在技術層面上需要重點探索以下關鍵技術:
1.持續搜集和構建面向政務服務的多地域多語言多事項口語語料庫,並以大模型與領域專家協同的方式構建面向政務服務的政務口語知識圖譜。
2.借助網絡問答社區構建大規模非政務領域口語問答語料庫,結合大規模政務語料庫,對模型進行預訓練﹔並利用有限的政務服務口語語料進行微調和遷移學習,提升模型的政務口語理解能力,提高對用戶口語化查詢的理解和響應能力。
3.探索“數據-知識-模型”協同學習的模型訓練的新范式和新方法,在有限樣本條件下,利用有限高質量數據,在領域專家知識的引導下實現面向政務服務的口語化訴求到書面化表達之間的精准映射。
(二)算法層面:算法堆砌與綜合需求之間的矛盾(協同辦)
隨著深度學習尤其是生成式人工智能技術的快速發展,人工智能在語音識別與生成、自然語言理解與生成、圖像/視頻理解與生成等領域都取得了突破性進展,各種性能優越的智能算法和技術百花齊放。這也導致很多智能政務服務系統在設計時,一味地追求多種新穎的智能技術的引入,在同一任務中冗余使用不同的人工智能算法,或者在不同任務中重復使用機理近似的算法,從而導致了大量人工智能算法的混亂堆砌,忽視了政務服務應用中的綜合性需求的初衷。再加上各種算法或者智能體間協同不足,導致在解決政務服務中的多事項綜合性服務時表現效果不佳,實戰性能有待提升,難以實現協同自助式辦理的服務目標。為了有效緩解這一技術矛盾,在技術層面需要從單智能體性能提升轉向多智能體協同角度,主要包括:
1.政務治理的“條塊”向“聯動”轉變。在政務服務中,傳統的“條塊”模式往往導致各部門孤立工作,難以實現高效協作。通過加強跨部門的“聯動”機制,推動智能體之間的協同調度和資源共享,促進政務服務的整體協同效率的提升。
2.加強意圖理解、任務拆解與多元信息交互能力,構建“總客服”式的一站式解決方案。對於用戶的多元意圖,通過多元信息交互方式利用大模型將用戶的需求拆解為具體的、可執行的多個任務,分發給不同的智能體﹔對於單項復雜任務,通過將其轉化為系統能夠處理的多個具體步驟協同辦理,來提升整體的效率和精准度。
3.多智能體協同與信息共享,通過消息傳遞、任務分配等機制,促進多個智能體之間的信息共享與協作,以實現多部門、跨區域協同,提高政務服務的整體效能。
總之,通過借助多智能體協同機制和靈活的技術架構,保証政務服務能夠快速迭代和調整策略,從而實現“協同辦”目標,推動政務服務更加高效、協同和智能化。
(三)安全層面:生成內容與安全治理之間的矛盾(安全辦)
大模型極大地提升了政務服務中的意圖理解、流程推理、以及內容生成的性能和效果。然而,基於黑盒學習的大模型生成的內容存在安全性和合規性風險,面臨數據泄露、算法偏見和內容安全等挑戰,一定程度上也影響了人工智能賦能政務服務的快速推進。一是技術創新與安全保障的矛盾。人工智能技術的快速發展帶來了創新機會,但也引發了新的安全隱患。在政務服務中,確保技術創新與安全保障並行至關重要。二是自動化與人工干預的矛盾。人工智能技術提升了政務服務的自動化水平,但完全依賴模型的自動化能力可能導致安全風險難以被及時發現。然而人工干預必將大大降低自動化的水平和效率,兩者之間的平衡至關重要。構建安全可信的政務服務大模型是推進智能政務服務安全性的有效技術手段。主要包括:
1.政務服務大模型與人類價值觀對齊。通過對大模型進行價值觀對齊,確保其生成的內容符合社會倫理標准與法律法規。
2.政務服務大模型生成內容的智能審核與預警。建立實時監控機制,對政務大模型生成的內容進行識別與預警,防止出現安全性和合規性問題。
3.政務大模型安全性評估。建立全面系統的政務服務大模型的安全評估體系,定期對政務大模型生成的功能安全和內容安全進行主客觀結合的系統性評估。
總之,通過加強對技術創新與安全保障的平衡管理,以及推行自動化與人工干預相結合的治理模式,可以有效降低大模型應用中的安全風險,確保政務服務在提高效率的同時,保障生成內容安全,從而實現“安全辦”的目標。
(四)評估層面:技術評估與用戶體驗之間的矛盾(滿意辦)
對智能政務服務系統進行系統性評估是判斷系統建設質量和服務效果的重要技術手段。然而人工智能算法的評估往往都是以測試樣本為基礎,以定量指標為准則的技術性評估。這種評估方式往往不能完全滿足以人為中心的政務服務效果的評估需求。主要體現在:一是靜態評價標准與動態服務需求的矛盾。傳統的人工智能系統評價標准通常是靜態的,主要以准確率、召回率等定量指標為依據。然而,政務服務的需求具有高度的動態性,受政策變化、公眾需求波動、地域文化等因素影響。二是技術評價與用戶體驗的矛盾,人工智能系統的技術表現不一定與用戶的主觀感受一致。例如,一個技術上高效的政務服務系統,可能由於交互設計不佳而導致用戶體驗不理想。為了進一步提升政務服務系統評估與用戶體驗的一致性,需要重點探索:
1.綜合評估機制。結合定性與定量、主觀與客觀的評估方法,既能衡量系統的技術性能,也能考慮用戶的主觀體驗,從而實現全面的評估效果。定量評估可以考慮准確率、召回率、F1等技術指標,而定性評價則通過用戶反饋渠道了解他們使用過程中的體驗和感受。
2.全過程無感評估機制。當前大多數的評估與真實用戶使用過程是脫節的,往往是在實驗室環境下對有限的測試用例進行評估,缺乏對完整使用過程中的用戶體驗評估。亟需探索利用大數據技術,對用戶在政務服務平台辦理事項的過程中每個環節頁面停留時間、操作頻率、鼠標狀態等數據進行分析,挖掘潛在用戶體驗感,從而實現全程無感的評估過程。
3.交互式評估與反饋機制。通過整合多元化的用戶參與渠道,如網絡評議、社交媒體互動等,將民眾的實時反饋納入評估過程,確保政務服務的評估結果與公眾的實際體驗和需求相契合,從而實現政務服務的動態優化和持續改進。
通過這些技術探索,可以有效提升政務服務的評估機制和用戶體驗的一致性,推動政務服務的優化與改進,從而實現以“用戶滿意”為目標的政務服務。
二、總結
人工智能賦能政務服務的技術矛盾分析揭示了當前其在數據、算法、安全和評估多個層面上存在的技術挑戰。通過探索政務語義對齊、多智能體協同、可信政務大模型、全過程綜合評估等技術,可以有效促進人工智能技術與政務服務需求的深度融合,實現人工智能從數據、算法、應用、評估多層次深入賦能政務服務,推動政務服務的智能化轉型,全面提升政府治理能力和公眾服務水平。
(本文作者李兵系人民中科研究院院長,阮曉峰、吳方、原春鋒、秦曉魯系人民中科研究院研究員)