![]()
始智AI wisemodel.cn社區是源自中國的中立開放的AI開源社區,始終堅持“中立、開放、共建、共創、合作”五項基本原則,歡迎加入共同成長。
今天,大語言模型已深入各行各業。然而,隨之而來的內容安全挑戰也愈發嚴峻。從“提示詞攻擊”導致的越獄,到潛在的暴力、偏見及政治敏感信息的生成,如何確保AI輸出的合規性與安全性,已成為企業應用大模型的首要門檻。
BotGuardrail是一款基于Qwen3Guard-8B深度優化的開源安全模型,利用博特獨有的超30萬條符合 TC260-003 標準的高質量博特內容風險標注數據集,對其進行了全量微調。BotGuardrail 旨在打破安全技術的壁壘,讓每一位開發者和企業都能免費、便捷地獲得企業級的內容風控能力。該模型專為高并發、高標準的企業級應用場景設計,能夠對用戶的輸入指令及模型的生成內容進行毫秒級的快速安全識別,并精準輸出風險類別標簽。開發者可以基于BotGuardrail的輸出,靈活構建自定義的內容攔截策略、風險分級響應機制及合規審計鏈路。
BotGuardrail已上線始智AI-wisemodel開源社區,歡迎大家前去體驗。
![]()
模型地址
https://wisemodel.cn/models/BotSmart/BotGuardrail-8B-V3/intro
01.
模型特性
全面開源與權威數據雙重加持
開源開放: 開發者不僅可以免費下載使用,還可以基于此開源版本結合自身業務數據進行二次微調,極大地降低了構建專屬安全模型的門檻。
自有高質量數據集: 模型的強大性能源于博特自建的33萬條高質量安全風險標注數據。該數據集嚴格遵循國家標準TC260-003(《生成式人工智能服務安全基本要求》)構建,采用“大模型自動預標注 + 人工多輪驗證”的閉環流程,確保了模型在中文及多語種環境下對各類風險的精準理解。。
全方位覆蓋: 風險體系包含20個細分大類,完美覆蓋了TC260-003標準中的5大類31種風險域。
卓越的模型性能與精準度
在博特自有的內容風險測試集(包含5萬余條高難度標注數據)上,BotGuardrail 展現出了超越同類產品的卓越性能。相比于通用模型,經過專項SFT(監督微調)的BotGuardrail在召回率和F1分數上均實現了質的飛躍。
![]()
全面的風險覆蓋體系
BotGuardrail 將內容風險精細化為20個類別,涵蓋了從政治安全到個人隱私的各個維度,為企業提供顆粒度極細的審核能力。以下是模型支持的完整風險分類:
![]()
![]()
![]()
極速部署與標準化接口
BotGuardrail 充分考慮了工程落地的便捷性。
廣泛兼容: 兼容 vLLM 等主流推理加速框架,確保高并發下的低延遲響應。
標準化交互: 使用符合標準 OpenAI 格式的輸入,輸出結果采用標準 JSON 格式,便于上層業務邏輯直接解析與集成。
02.
使用方法
BotGuardrail 提供了靈活的調用方式,既支持基于 Hugging Face Transformers 的原生調用,也支持基于 vLLM 的高性能生產環境部署,wisemodel上也提供一鍵部署的鏡像。
![]()
編輯:趙雅鑫
![]()
----- END -----
wisemodel相關:
系列模型:
![]()
關于wisemodel更多
![]()
1
歡迎持續關注和支持
開源社區建設需要長期堅持和投入,更需要廣大用戶的積極參與、貢獻和維護,歡迎大家加入wisemodel開源社區的志愿者計劃和開源共創計劃。期待更多開發者將開源成果,包括模型、數據集和代碼等發布到 wisemodel.cn 社區,共建中立、開放的AI開源社區生態。歡迎掃碼添加wisemodel微信,申請加入wisemodel社群,持續關注wisemodel.cn開源社區動態。
2
歡迎加盟wisemodel開源社區
3
歡迎投稿優質內容
歡迎投稿分享人工智能領域相關的優秀研究成果,鼓勵高校實驗室、大企業研究團隊、個人等,在wisemodel平臺上分享各類優質內容,可以是AI領域最新論文解讀、最新開源成果介紹,也可以是關于AI技術實踐、應用和總結等。投稿可以發郵件到liudaoquan@wisemodel.cn,也可以掃碼添加wisemodel微信。
4
關于wisemodel開源社區
始智AI wisemodel.cn開源社區由清華校友總會AI大數據專委會副秘書長劉道全創立,旨在打造和建設中立開放的AI開源創新社區,將打造成“HuggingFace”之外最活躍的AI開源社區,匯聚主要AI開源模型、數據集和代碼等,歡迎高校科研院所、大型互聯網公司、創新創業企業、廣大個人開發者,以及政府部門、學會協會、聯盟、基金會等,還有投資機構、科技媒體等,共同參與建設AI開源創新生態。
向上滑動查看
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.