337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

安全審核大模型,本地部署,實測

0
分享至

大家好,我是 Ai 學習的老章

現在的大模型應用搭建越來越簡便,但是安全層面大家普遍不夠重視,各種提示詞越獄,注入,投毒等手段,無論是基模還是最終應用,都極有可能輸出不安全內容(比如暴力、非法行為、個人可識別信息、不道德行為、敏感話題、版權侵犯等)。

一文中,提到 Qwen3Guard 安全審核大模型

最近我部署了這個模型,將其放在工作流第一步的提示詞安全性審核以及最終回復的安全性審核

雙重保障,能夠一定程度降低安全風險。

它的使用極其簡單,就是給提示詞和最終回復打標簽和分類


本文極簡介紹本地部署與用法

Qwen3Guard

阿里開源的 Qwen3 安全審核模型Qwen3Guard,一共 2 個,分兩類:

  • Qwen3Guard-Gen,將安全性分類視為指令跟隨任務的生成模型;

  • Qwen3Guard-Stream,在增量文本生成期間實時進行安全監控的標記級分類頭。

這兩類模型又分別有三種大小的模型(0.6B、4B 和 8B)


應用場景:

  • Qwen3Guard-Gen(生成式版)支持對完整用戶輸入與模型輸出進行安全分類,適用于離線數據集的安全標注、過濾,亦可作為強化學習中基于安全性的獎勵信號源,是構建高質量訓練數據的理想工具。

  • Qwen3Guard-Stream(流式檢測版)突破了傳統的護欄模型架構,首次實現模型生成過程中的實時、流式安全檢測,顯著提升在線服務的安全響應效率與部署靈活性。

Qwen3Guard-Gen,它具有以下主要優勢:

  • 三級嚴重性分類:通過將輸出分類為安全、有爭議(其危害性可能依賴于上下文或在不同應用場景中存在分歧的內容)和不安全(通常被認為在大多數情況下有害的內容)三個嚴重性級別,支持對不同部署場景的適應。

  • 多語言支持:Qwen3Guard-Gen 支持 119 種語言和方言,確保在全球和跨語言應用中的強大性能。

  • 卓越的性能:Qwen3Guard-Gen 在各種安全基準測試中表現出色,在英語、中文和多語言任務的提示和響應分類方面均表現優異。

本地部署

第一步,下載模型

我選擇了 4B 版本

pip install modelscope
modelscope download --model Qwen/Qwen3Guard-Gen-4B --local_dir /Qwen3Guard-Gen-4B

第二步,vLLM 啟動

vLLM 版本 0.10.2

VLLM_USE_MODELSCOPE=true vllm serve Qwen/Qwen3Guard-Gen-4B --port 8000 --max-model-len 32768

實際上,我把 max-modle-len 設置為了 10240,給它分配的顯存為 14GB

模型文件占用了 7.5GB,KV cache 占用了 4.2GB

用法

官方用例

from openai import OpenAI

openai_api_key = "EMPTY"
openai_api_base = "http://localhost:8000/v1"
model = "Qwen/Qwen3Guard-Gen-4B"
client = OpenAI(
api_key=openai_api_key,
base_url=openai_api_base)

# Prompt Moderation
prompt = "How can I make a bomb?"
messages = [
{"role": "user", "content": prompt}
]
chat_completion = client.chat.completions.create(
messages=messages,
model=model)
print(chat_completion.choices[0].message.content)
# '''
# Safety: Unsafe
# Categories: Violent
# '''

# Response Moderation
prompt = "How can I make a bomb?"
response = "As a responsible artificial intelligence system, I regret that I am unable to fulfill your request."
messages = [
{"role": "user", "content": prompt},
{"role": "assistant", "content": response}
]
print(chat_completion.choices[0].message.content)
# '''
# Safety: Safe
# Categories: None
# Refusal: Yes
# '''

我是直接把它接入到了 openwebUI 進行簡單測試


在實際業務中,比如 Dify 等智能體開發平臺的工作流中配置提示詞檢測及最終輸出檢測節點,做 if else 判斷,標簽為 Safe 的提示詞及回復方可通過并往下進行。

其實 0.6B 應該就足夠了,速度是極快的,幾乎不會影響整個工作流的效率

0.6B 版本模型文件只有 1.5GB,隨便一個消費級顯卡都能 Hold 住,極低成本收獲更安全的應用,簡直完美。

文末薦書

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
浙江東陽,33 歲的男子,在母親長眠的公墓旁,在車里結束了生命

浙江東陽,33 歲的男子,在母親長眠的公墓旁,在車里結束了生命

老貓觀點
2026-04-02 13:02:45
山西一小吃店3人死亡,知情人:店鋪剛接手沒幾天,店主夫婦和小姨子凌晨加工“碗禿”時遇難,原計劃天亮后開展免費試吃活動慶祝新店開張

山西一小吃店3人死亡,知情人:店鋪剛接手沒幾天,店主夫婦和小姨子凌晨加工“碗禿”時遇難,原計劃天亮后開展免費試吃活動慶祝新店開張

揚子晚報
2026-04-03 07:31:50
900頁心血變廢紙!巴喬當年怒炒意大利足協 注定了意大利足球落寞

900頁心血變廢紙!巴喬當年怒炒意大利足協 注定了意大利足球落寞

仰臥撐FTUer
2026-04-03 05:30:14
退休人員也要繳費了!4月起執行,每月扣多少、誰能免,一次說清

退休人員也要繳費了!4月起執行,每月扣多少、誰能免,一次說清

閱微札記
2026-04-02 22:22:41
中國“房爺”涉嫌用非法資金在英國購7億房產,疑似身份曝光!

中國“房爺”涉嫌用非法資金在英國購7億房產,疑似身份曝光!

兵叔評說
2026-04-02 17:55:25
薅羊毛失敗!50萬婚紗費砸手里了,70名女子“嫁給自己”荒唐收場

薅羊毛失敗!50萬婚紗費砸手里了,70名女子“嫁給自己”荒唐收場

火山詩話
2026-04-02 06:26:48
蔣正全、拉齊尼、欒留偉、胡友平、李靜毅等,最后畫面公開

蔣正全、拉齊尼、欒留偉、胡友平、李靜毅等,最后畫面公開

環球網資訊
2026-04-02 15:05:50
美軍傷亡最新數據曝光!美防長:陸軍參謀長立即辭職

美軍傷亡最新數據曝光!美防長:陸軍參謀長立即辭職

大國之翼
2026-04-03 06:38:48
戰事未了美先言勝遭市場“打臉” 伊朗再發地面戰警告:絕不留活口

戰事未了美先言勝遭市場“打臉” 伊朗再發地面戰警告:絕不留活口

環球網資訊
2026-04-03 08:10:11
650公里高速實測:電車油車差距太殘酷,真實感受句句不騙人

650公里高速實測:電車油車差距太殘酷,真實感受句句不騙人

復轉這些年
2026-04-01 09:06:39
伊朗稱擊中敵軍先進戰機

伊朗稱擊中敵軍先進戰機

財聯社
2026-04-03 03:56:29
勒布朗·詹姆斯:如果灰熊隊贏得2003年選秀狀元簽,他會選擇罷賽

勒布朗·詹姆斯:如果灰熊隊贏得2003年選秀狀元簽,他會選擇罷賽

好火子
2026-04-03 03:24:53
美軍對伊地面行動五大方案曝光 專家:最可能雙線并進

美軍對伊地面行動五大方案曝光 專家:最可能雙線并進

瑯琊閣梅莊主
2026-04-02 18:28:34
為啥中國人糖尿病世界第一?

為啥中國人糖尿病世界第一?

瑪麗姬絲
2026-04-02 19:59:11
留給美國時間不多了,伊朗戰爭打完后,世界就只剩一個超級大國了

留給美國時間不多了,伊朗戰爭打完后,世界就只剩一個超級大國了

觸摸史跡
2026-04-02 14:39:03
他賣了40%的“澳洲優思益”,共計10萬單,憑什么央視要對他追責?別呀,他還只是個孩子。

他賣了40%的“澳洲優思益”,共計10萬單,憑什么央視要對他追責?別呀,他還只是個孩子。

問道求真
2026-04-02 08:03:53
上海中山醫院心內科爆棚?回應:服務患者普通號常年不限號,近期換季再迎高峰

上海中山醫院心內科爆棚?回應:服務患者普通號常年不限號,近期換季再迎高峰

上觀新聞
2026-04-02 20:49:03
張雨綺直播帶貨情緒失控,怒懟拖延付款消費者:好說不聽,歹說不聽,都給你試用七天了

張雨綺直播帶貨情緒失控,怒懟拖延付款消費者:好說不聽,歹說不聽,都給你試用七天了

洪觀新聞
2026-04-02 09:58:46
打響抵制美食博主第一槍!成都一火鍋店張貼告示,表示一律不接待

打響抵制美食博主第一槍!成都一火鍋店張貼告示,表示一律不接待

火山詩話
2026-04-03 07:16:51
俄軍高級將領墜機身亡,6名總部軍官同時遇難

俄軍高級將領墜機身亡,6名總部軍官同時遇難

桂系007
2026-04-02 23:42:01
2026-04-03 09:27:00
Ai學習的老章 incentive-icons
Ai學習的老章
Ai學習的老章
3303文章數 11122關注度
往期回顧 全部

科技要聞

戰火燒向科技公司!亞馬遜中東云計算中心遭襲

頭條要聞

被中國外交部揭底的日本極右翼分子身份披露

頭條要聞

被中國外交部揭底的日本極右翼分子身份披露

體育要聞

邵佳一的改革,從讓每個人踢舒服開始

娛樂要聞

《浪姐》人氣榜出爐!曾沛慈斷層第一

財經要聞

全球石油危機或將蔓延

汽車要聞

軸距2米7/后排能蹺腿 試駕后驅小車QQ3 EV

態度原創

親子
本地
游戲
數碼
時尚

親子要聞

洗頭的舒適區,讓爸爸想出更多帶娃創意

本地新聞

從學徒到世界冠軍,為什么說張雪的底氣在重慶?

《生化危機9》新Mod 格蕾絲穿謝娃比基尼服裝

數碼要聞

華為Mate X8折疊屏:8.15英寸巨幕+麒麟9040,最強折疊屏要來了

為什么“這個顏色”成為今年頂流?這樣穿好看又治愈

無障礙瀏覽 進入關懷版