本文轉自:人民網-上海頻道
人民網上海4月1日電 (記者王文娟)3月31日,上海市檢察院召開新聞發布會,介紹數字檢察建設新一輪三年規劃,并發布上海檢察輔助辦案多智能體和上海檢察語料庫情況。
據介紹,上海檢察輔助辦案多智能體,在檢察辦案行為全面線上化的基礎上,深度推進專業垂直領域中通用大模型的應用,通過對檢察辦案電子卷宗的全量智能識別、提取和分析,提供案情速覽、證據審查、視頻分析、出庭示證、3D展示、智能語控等11個智能體功能。
一方面,智能體可以對案件進行智能解析與脈絡梳理,以思維導圖形式實現案件主要內容和核心關鍵點“一屏全覽”,輔助檢察官顯著提升閱卷效率。
另一方面,可以對證據鏈進行智能校驗,明確提示案件中存在罪與非罪、此罪彼罪的可能性,以及矛盾沖突的可疑點。以故意傷害案件輔助審查為例,在遇到復雜情節時,智能體能自動識別是否系親友、鄰里之間輕傷害的案件,提取正當防衛中防衛時間、防衛對象和防衛限度等關鍵定罪量刑的要素,提醒檢察官注意相應處理結果,并附以相應的法律依據和類案參考。智能體提供3D傷情展示功能,可視化呈現故意傷害案件中傷勢詳情。結合上海數字政法建設成果,依托多模態大模型能力,實現政法協同多來源視頻智能分析,與言辭證據、傷情鑒定報告進行交叉驗證。
此外,智能體還能通過法律文書比對,有效發現偵查、起訴和審判結果在事實認定、罪名適用、量刑建議等方面的差異,有效提升辦案和監督效能。
目前,上海檢察機關已梯次上線了涵蓋32個刑事罪名智能輔助模型,累計為全市1.3萬余起案件提供了智能輔助,相關罪名案件的辦理效率均得到了提升。其中,危險駕駛罪等智能輔助模型已經由最高檢推廣到全國試點檢察機關應用。
大規模、高質量、安全合規的數據,是垂直領域模型落地效果的關鍵變量。檢察專屬語料庫是檢察智能體的知識原料,為數智檢察提供底座支撐。語料庫圍繞“法律法規、名詞解釋、量刑意見、業務規則、檢察案例”五大維度,搭建了基石語料庫、監督微調語料庫(SFT)、思維鏈語料庫(CoT)和測試數據集的四層架構,將審查案件的過程拆解成點、串聯成線、匯聚成面,一方面豐富高質量數據集,通過開發讓智能體分析更加精準,另一方面可以為檢察垂類大模型訓練和輔助決策提供充足支撐。
基石語料庫以生效的法律法規、司法解釋、法學理論著作、司法實務指南等原始數據為主體。監督微調語料庫(SFT)、思維鏈語料庫(CoT)是由一線業務骨干收集或撰寫,主要用于模型微調和智能體建設。
以故意傷害罪相關語料為例,資深檢察官在收集故意傷害罪名相關的30余部法律、司法解釋等規范性文件的基礎上,對“故意”“傷害”“輕傷”等重要法律名詞進行專門性解釋,并根據法學理論和實務辦案經驗,梳理出“傷害行為”“正當防衛”“因果關系”等多個矛盾點分析的決策樹,及一套完整的包含“證據分析—事實認定—犯罪構成—違法阻卻事由—定罪量刑”的故意傷害案件審查規則,再選取50余個典型性案例撰寫形成個案審查思維鏈,將抽象的審查規則進一步具象化。
為更好地明確檢察語料的數據資源、質量管控、價值對齊及數據安全等核心要求,上海市檢察機關聯合多家高校、科研單位,產學研聯動同步開展上海檢察語料相關標準的研制工作,統一上海檢察語料庫建設的行業共識,形成《人工智能 檢察語料庫建設導則》(以下簡稱“《導則》”)作為上海檢察專屬語料庫建設的基礎性標準文件,明確了檢察語料庫數據資源、數據加工處理要求和系統管理機制,為檢察語料庫建設提供原則性指引與理論框架。
目前《導則》已由上海市人工智能行業協會正式發布,這也是全國檢察系統內首個語料庫建設的團體標準,為相關機構或組織構建檢察語料庫提供了技術標桿、規范體系和方向指導。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.