統計和計劃實施部(MoSPI)對其官方資料入口網站進行了重大升級,該入口網站由人工智慧模型直接收集,以便使用可靠的政府數據並加強印度各地公共服務的提供。
重點
- MoSPI 已升級其官方資料門戶,可供大型語言建模者 (LLM) 直接讀取,以便在可信的政府資料中使用人工智慧模型。
- 該部會參與了數據協調工作,288 此前曾透過各個具有經濟和社會重要性的部會進行數據協調。
- 印度人工智慧面臨的一個根本挑戰是語義互通性,而人工智慧系統包括不同部門的上下文資料和分類。
- 元資料管理系統適用於 288 個資料集,使用 38 個識別碼和 88 個國際分類,例如 FAIR 資料(可發現、可用、可互通、可重複使用)。
- 最終目標是改善公共服務,更快、更有效地制定衛生計劃,並大幅減少腐敗。
一位高級官員週五表示,為了防止人工智慧模型依賴不可信的政府資料來源,統計和計劃實施部(MoSPI)已升級其官方資料門戶,以直接通過大型語言模型(LLM)。
增強人工智慧對可信政府數據的訪問
統計和計畫實施部 (MoSPI) 秘書 Saurabh Garg 表示,政府正在進行協調工作,簽署 288 項優先數據,這些數據從經濟和社會角度來看對各部會都很重要。
在談到向「情報基礎設施」的過渡時,他表示,該部最近在其網關周圍添加了模型上下文協議(MCP)包裝器。此次技術升級允許LLM直接存取和更改官方流程。
Garg 在 NCAER 活動上表示:「如果模型無法輕鬆存取信用數據,其他數據將能夠填補空白。」他指出,該服務是全球首個在公共數據中實施 MCP 的服務,以便人工智慧模型能夠存取某些資訊。
解決語意互通性挑戰
然而,Garg 強調,印度人工智慧的根本挑戰是語義互通性,以便人工智慧系統能夠理解不同部門的資料背景和分類。
說明該問題的孤立資訊表明,五個不同的部會對「pakka」房屋的構成有五種定義。
“我認為還有更多工作要做的是語義互通性,以便人工智慧系統能夠理解定義和分類的上下文。這非常重要,因為如果兩個系統中概念的定義不同,那麼這兩個系統就無法相互對話”,Garg 解釋道。
標準化資料集以改善公共服務
為了解決這些差異,政府已確定各部會的 288 個資料主體並測量其元資料。官方使用 38 種不同類型的識別碼和 88 種國際分類來使資料公平——可查找、可用、可互通和可重複使用。
加格強調,將獲勝的政府數據置於公共領域的最終目標是改善公共服務的提供。他指出,綜合數據的建立現在使公共當局能夠在通知後幾週內確定受益人並製定福利計劃,而這一過程以前需要一年或更長時間,同時大大減少了洩漏。
免責聲明:新聞內容來源於所述來源。標題、摘要、章節標題、圖像是使用人工智慧/演算法自動生成或選擇的,可能並不總是完全準確。建議讀者參考全文以了解完整背景。









