337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

谷歌翻譯藏了8年的秘密:模型怎么知道"說完了"?

0
分享至


2016年,谷歌翻譯突然從"逐詞替換"變成能讀完整句再輸出。當時沒人解釋清楚:機器生成句子時,怎么判斷該在哪停下?

這個細節被埋在技術文檔里整整8年,直到最近一批工程師復盤Seq2Seq架構時才被重新翻出來。答案藏在三個字母里:EOS。

EOS不是標點,是模型的"剎車踏板"

訓練好的解碼器(Decoder)本質上是個貪婪的單詞預測機器。給它一個起始信號,它會不斷吐詞,直到——遇到那個預設的終止符。

具體流程像流水線:編碼器(Encoder)先把"let's go"壓成一個上下文向量(Context Vector),這個向量初始化解碼器的兩層長短期記憶網絡(LSTM,一種能記住長距離依賴的循環神經網絡)。解碼器第一步吃進一個特殊標記EOS(End of Sequence,序列結束符),輸出"Vamos";第二步把"Vamos"塞回輸入端,預測下一個詞——又是EOS。

兩次EOS之間的所有輸出,就是最終翻譯結果。

這里有個反直覺的設計:EOS既是解碼器的"啟動鑰匙",又是"剎車信號"。訓練時它告訴模型"從這里開始生成";推理時它告訴模型"到這里可以結束了"。同一個標記承擔兩種完全相反的功能,卻從不混淆,因為位置決定了它的身份。

原文作者用了一個精妙的類比:這就像你給朋友發語音,先說"我開始說了"作為開頭標記,最后說"我說完了"作為結束標記。機器需要明確的邊界,否則會在無限循環里耗盡算力。


Teacher Forcing:訓練時的"作弊碼"

推理階段用預測值喂給下一步輸入,但訓練階段完全不同。工程師們搞了個叫"教師強制"(Teacher Forcing)的技巧:不管模型上一步預測出什么,都強行塞進正確答案。

比如目標句子是"Vamos EOS",即使模型第一步預測成了"Hola",第二步的輸入仍然是正確的"Vamos",而不是它自己猜錯的詞。這相當于給模型開卷考試,讓它先學會"正確的上下文長什么樣",再慢慢學會自己走路。

這種設計有個副作用:訓練和推理的輸入分布不一致。模型在訓練時從沒見過自己的錯誤預測,到了真實場景可能懵圈。2015年的原始論文已經注意到這個問題,但直到2019年才有系統性的緩解方案——這又是另一個故事了。

那個被硬編碼的"最大長度"

原文提到一句容易被忽略的話:"預測到EOS,或達到某個最大輸出長度"。這個"或"字背后,是無數線上事故的源頭。

早期系統把最大長度設得偏保守,長句被硬生生截斷;后來放寬限制,又出現過模型陷入循環、瘋狂重復同一個短語的情況。2017年谷歌內部有個著名案例:某次模型更新后,西班牙語譯文的平均長度突然暴漲40%,追查發現是新版本對EOS的置信度閾值調得太激進,模型寧可無限生成也不說結束。

現在的做法通常是雙重保險:EOS預測概率超過閾值就停,同時設置絕對長度上限。兩個條件滿足任意一個,強制終止。這種"軟剎車+硬剎車"的組合,成了工業界的事實標準。


但閾值設多少?上限定多長?不同語言差異極大。日語敬語系統復雜,同樣意思的句子可能比英語長3倍;中文信息密度高,同樣內容可能只有英語60%長度。這些細節不會出現在論文里,是工程團隊用A/B測試一寸一寸試出來的。

從Seq2Seq到注意力:EOS的謝幕演出

原文結尾預告了下一篇主題:注意力機制(Attention Mechanism)。這幾乎是Seq2Seq架構的臨終遺言。

2017年Transformer論文發表后,固定的上下文向量被動態注意力權重取代,LSTM層被多頭自注意力替代,但EOS標記保留了下來。即使在GPT-4里,你依然能在詞表深處找到它——只不過現在它叫`<|endoftext|>`,或者Claude里的`<|assistant|>`。

標記的形式變了,功能沒變:告訴模型,生成到此為止。

有個細節很少被討論:現代大模型的"停止"遠比當年復雜。除了顯式的結束標記,還有隱式的模式匹配(比如檢測到重復的句子結構)、實時的困惑度(Perplexity)監控、甚至外部工具調用的中斷信號。EOS從唯一的剎車踏板,變成了多層安全系統中的一個開關。

但回到2014年,當Ilya Sutskever在論文里第一次寫下那個簡單的循環條件時,他可能沒想到這個設計會延續十年,成為所有生成式AI的底層共識。

下次你用ChatGPT時,可以留意它的輸出是怎么結束的——是突然截斷,還是自然收尾?那個看不見的EOS,正在以毫秒級的速度被計算、被比較、被觸發。而你讀到的每一個完整句子,都是它成功工作的證明。

如果模型突然在某個奇怪的位置停下,比如一句話說到一半就結束,你猜是EOS閾值設得太敏感,還是它其實想繼續但撞上了長度上限?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
張雪峰經典語錄:句句都是人間清醒

張雪峰經典語錄:句句都是人間清醒

山東教育
2026-03-26 08:07:56
越扒越有!張雪峰去世早有預兆,他的2個不良愛好,或成催命符

越扒越有!張雪峰去世早有預兆,他的2個不良愛好,或成催命符

孤城落日
2026-03-28 03:41:07
楊瀚森缺席!開拓者爆冷負5連敗獨行俠 狀元24分克林根6+17被隔扣

楊瀚森缺席!開拓者爆冷負5連敗獨行俠 狀元24分克林根6+17被隔扣

醉臥浮生
2026-03-28 12:32:43
馮鞏在人民日報發文,撕開喜劇圈臟亂內幕,點破岳云鵬尷尬處境

馮鞏在人民日報發文,撕開喜劇圈臟亂內幕,點破岳云鵬尷尬處境

林雁飛
2026-03-27 14:42:10
1980年,一個軍械庫倉庫管理員,他是如何讓66軍炮兵團叛變的?

1980年,一個軍械庫倉庫管理員,他是如何讓66軍炮兵團叛變的?

百年歷史老號
2024-03-29 18:56:45
狗仔爆料:當年張凌赫還沒紅的時候,氣質很素,身邊白鹿陪伴

狗仔爆料:當年張凌赫還沒紅的時候,氣質很素,身邊白鹿陪伴

TVB的四小花
2026-03-27 12:30:49
俄羅斯2025年秋季征兵13.5萬人,承諾不派往特別軍事行動區域

俄羅斯2025年秋季征兵13.5萬人,承諾不派往特別軍事行動區域

魯中晨報
2026-03-28 17:13:12
寫小說判十年,把生殖器放女孩嘴巴里判兩年九個月

寫小說判十年,把生殖器放女孩嘴巴里判兩年九個月

昊軒看世界
2026-03-24 19:56:42
千萬不要小看F-35,雖然打不過殲-20,卻是東風快遞、紅旗導彈的巨大威脅

千萬不要小看F-35,雖然打不過殲-20,卻是東風快遞、紅旗導彈的巨大威脅

利刃號
2026-02-02 19:07:20
打不過就道德綁架!以色列一市長痛哭怒斥戰爭,絲毫沒有悔過之意

打不過就道德綁架!以色列一市長痛哭怒斥戰爭,絲毫沒有悔過之意

滄海旅行家
2026-03-27 15:07:47
多國動手!太子集團陳志引渡受審,背后大佬隱姓埋名15年藏太深

多國動手!太子集團陳志引渡受審,背后大佬隱姓埋名15年藏太深

哭藍了海a
2026-03-28 02:06:44
CBA31輪焦點戰!CCTV5直播!遼寧沖前8,官宣劉傳興重傷仍在急診

CBA31輪焦點戰!CCTV5直播!遼寧沖前8,官宣劉傳興重傷仍在急診

老吳說體育
2026-03-28 10:07:29
張志新的兒女今何在?背后的真相令人淚目

張志新的兒女今何在?背后的真相令人淚目

深度報
2026-03-01 23:48:59
南通球員打架早有前科!雇傭兵加入打破平衡,蘇超第二季充滿浮躁

南通球員打架早有前科!雇傭兵加入打破平衡,蘇超第二季充滿浮躁

中國足球的那些事兒
2026-03-28 07:10:11
伊朗媒體:以美襲擊伊朗核設施

伊朗媒體:以美襲擊伊朗核設施

新華社
2026-03-27 23:30:33
大陸放話:不管臺灣當局點不點頭,廈金大橋照建不誤,直達金門

大陸放話:不管臺灣當局點不點頭,廈金大橋照建不誤,直達金門

汪鏞的創業之路
2026-03-28 10:24:01
替罪羊出現!特朗普無法接受停戰條件,開始甩鍋,沖突或迎轉折點

替罪羊出現!特朗普無法接受停戰條件,開始甩鍋,沖突或迎轉折點

書紀文譚
2026-03-27 17:48:39
美國為什么突然打伊朗?一篇文講清楚

美國為什么突然打伊朗?一篇文講清楚

李月亮
2026-03-02 20:46:25
“實在熬不下去了”,吉林一男子舉債湊齊彩禮,婚后遭妻子家暴!妻子辱罵法官囂張放話:有能耐來國外抓我

“實在熬不下去了”,吉林一男子舉債湊齊彩禮,婚后遭妻子家暴!妻子辱罵法官囂張放話:有能耐來國外抓我

深圳晚報
2026-03-28 14:48:10
快訊!伊朗導彈打不完的真正秘密!

快訊!伊朗導彈打不完的真正秘密!

達文西看世界
2026-03-28 10:58:45
2026-03-28 18:24:49
爬蟲飼養員
爬蟲飼養員
業余養了只叫“龍蝦”的AI爬蟲,主業是給互聯網打工。
319文章數 1關注度
往期回顧 全部

科技要聞

遭中國學界"拉黑"后,這家AI頂會低頭道歉

頭條要聞

美媒:和歐盟"外長"發生激烈交鋒 魯比奧"顯然很惱火"

頭條要聞

美媒:和歐盟"外長"發生激烈交鋒 魯比奧"顯然很惱火"

體育要聞

“我是全家最差勁的運動員”

娛樂要聞

王一博改名上熱搜!個人時代正式開啟!

財經要聞

用AI來“增效”,大廠打錯了算盤

汽車要聞

置換補貼價4.28萬起 第五代宏光MINIEV正式上市

態度原創

教育
游戲
時尚
家居
軍事航空

教育要聞

【中關村·海淀,這片教育熱土為何讓追夢人奔赴?】為什么中關村成為人人向往的教育熱土?答案就藏在他們的...

重大翻車!知名3A游戲PS5光盤貨不對板 玩家集體踩坑

龍蝦來了,厭蠢癥炸了

家居要聞

曲線華爾茲 現代簡約

軍事要聞

美軍中東基地損失最新披露

無障礙瀏覽 進入關懷版