337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

這個(gè)AI能自己造AI,十幾分鐘寫完代碼,一天交付可用模型

0
分享至

近日,在 OpenAI 發(fā)布的機(jī)器學(xué)習(xí)工程師基準(zhǔn)測(cè)試(MLE-bench)中,一個(gè)名為 AIBuildAI 的智能體系統(tǒng)以 63.11% 的整體得分穩(wěn)居第一。

AIBuildAI 是一個(gè)可以自動(dòng)構(gòu)建 AI 模型的 AI 智能體。這意味著,你只需給它一個(gè)自然語(yǔ)言任務(wù)描述和數(shù)據(jù)文件夾,它就能在一天內(nèi)獨(dú)立完成模型設(shè)計(jì)、代碼生成、模型訓(xùn)練、超參數(shù)調(diào)優(yōu)、性能評(píng)估,并持續(xù)迭代改進(jìn)模型性能。


(來(lái)源:受訪者提供)

這個(gè)“AI 工程師”背后的主要負(fù)責(zé)人,正是加州大學(xué)圣地亞哥分校(UCSD)電氣與計(jì)算機(jī)工程系副教授謝澎濤(Pengtao Xie)。他擁有卡內(nèi)基梅隆大學(xué)機(jī)器學(xué)習(xí)系博士背景,研究方向聚焦人類學(xué)習(xí)技能啟發(fā)的機(jī)器學(xué)習(xí),并將其應(yīng)用于大語(yǔ)言模型、基礎(chǔ)模型以及生物醫(yī)學(xué)領(lǐng)域。

據(jù)謝澎濤介紹,AIBuildAI 的誕生,最初是為了解決實(shí)驗(yàn)室內(nèi)部一個(gè)非常現(xiàn)實(shí)的困境。

“我們團(tuán)隊(duì)有兩類學(xué)生。一類是生物醫(yī)學(xué)背景的,他們希望用 AI 預(yù)測(cè) RNA 功能、蛋白質(zhì)結(jié)構(gòu)等具體問(wèn)題,但缺乏建模和編程能力;另一類是 AI 方法背景的,雖然能自己寫代碼,卻要花好幾天甚至幾周反復(fù)實(shí)驗(yàn)。”謝澎濤告訴 DeepTech。

“如果有一個(gè)智能體,能讓用戶只用自然語(yǔ)言描述任務(wù),后續(xù)所有步驟——模型架構(gòu)設(shè)計(jì)、代碼編寫、訓(xùn)練、超參數(shù)調(diào)優(yōu)、性能評(píng)估、甚至自我復(fù)盤改進(jìn)——全部自動(dòng)完成,那對(duì)兩類學(xué)生都是巨大解放。”他補(bǔ)充道。

于是,AIBuildAI 項(xiàng)目正式啟動(dòng)。“智能體本身大約做了半年,但底層的推理、合成數(shù)據(jù)等技術(shù)我們已經(jīng)積累了好幾年。”謝澎濤透露,團(tuán)隊(duì)對(duì)于這款智能體的定位也十分明確:基于成熟 AI 模塊組合設(shè)計(jì)模型,解決落地性強(qiáng)的常規(guī)任務(wù)。

據(jù)悉,AIBuildAI 是一套模塊化、可閉環(huán)運(yùn)行的 AI 智能體系統(tǒng),整體分為三層,各司其職又深度聯(lián)動(dòng),實(shí)現(xiàn)從任務(wù)理解到模型交付的全流程無(wú)人干預(yù)。

頂層是任務(wù)理解與決策層。當(dāng)用戶輸入“預(yù)測(cè) RNA 功能”或“蛋白質(zhì)酶分類”等自然語(yǔ)言指令時(shí),這一層負(fù)責(zé)解析意圖、判斷任務(wù)類型并拆解執(zhí)行步驟。它是整個(gè)系統(tǒng)的“指揮中心”,決定了建模的方向和邏輯。

在這一核心中樞的選擇上,團(tuán)隊(duì)選用了 Claude-Opus-4.6 大模型。“我們測(cè)試對(duì)比了多個(gè)模型,雖然 GPT-5 在某些設(shè)計(jì)思路上表現(xiàn)出色,但在智能體最關(guān)鍵的環(huán)節(jié)——‘寫代碼’上,Claude 的穩(wěn)定性、長(zhǎng)流程邏輯理解和結(jié)構(gòu)化指令執(zhí)行力是最適配建模場(chǎng)景的。”

中層是推理與代碼生成層,也是 AIBuildAI 的技術(shù)核心,搭載團(tuán)隊(duì)自研的 Dream PRM(過(guò)程獎(jiǎng)勵(lì)模型)、Dream ORM(結(jié)果獎(jiǎng)勵(lì)模型)推理模塊,負(fù)責(zé)模型設(shè)計(jì)、代碼編寫、迭代復(fù)盤。PRM 負(fù)責(zé)步驟級(jí)精準(zhǔn)推理,ORM 負(fù)責(zé)結(jié)果校驗(yàn)與優(yōu)化建議,雙重保障每一步執(zhí)行不出錯(cuò),避免“一步錯(cuò)、全流程崩”的問(wèn)題,也是實(shí)現(xiàn)自動(dòng)復(fù)盤改進(jìn)的關(guān)鍵。

底層是執(zhí)行與訓(xùn)練層,其承接中層生成的代碼和方案,自動(dòng)完成數(shù)據(jù)加載、模型訓(xùn)練、超參數(shù)調(diào)優(yōu)、性能評(píng)估、結(jié)果輸出,同時(shí)管控硬件資源和算力消耗。這一層把上層的“設(shè)計(jì)思路”轉(zhuǎn)化為可運(yùn)行、可部署的實(shí)際模型。


(來(lái)源:受訪者提供)

為了驗(yàn)證 AIBuildAI 的能力,團(tuán)隊(duì)在 MLE-bench 的 75 個(gè)任務(wù)(涵蓋醫(yī)療、物理、生物等多個(gè)學(xué)科)中進(jìn)行了測(cè)試。MLE-Bench 是 OpenAI 推出的全球頂尖的全自動(dòng)機(jī)器學(xué)習(xí)測(cè)評(píng)平臺(tái),專門考核 AI 智能體 “獨(dú)立構(gòu)建有效 AI 模型” 的能力,測(cè)評(píng)覆蓋簡(jiǎn)單(Low)、中等(Medium)、高難度(High) 三類真實(shí) AI 任務(wù),最終按整體準(zhǔn)確率排名,是行業(yè)內(nèi)公認(rèn)的“全自動(dòng) ML 能力試金石”。

AIBuildAI 在這個(gè)測(cè)評(píng)中交出了亮眼的成績(jī),在無(wú)測(cè)試數(shù)據(jù)泄露的前提下排名第一。其中簡(jiǎn)單任務(wù)準(zhǔn)確率77.27%;中等任務(wù)準(zhǔn)確率 61.40%;高難度任務(wù)準(zhǔn)確率 46.67%;整體綜合準(zhǔn)確率 63.11%。

以“蛋白質(zhì)酶類別預(yù)測(cè)”為例,該任務(wù)基于發(fā)表在 Science 論文的數(shù)據(jù)集,AIBuildAI 自動(dòng)構(gòu)建的模型,效果完全對(duì)標(biāo)論文成果,普通用戶借助簡(jiǎn)化數(shù)據(jù)集就能快速?gòu)?fù)現(xiàn)。

“對(duì)比學(xué)生手動(dòng)寫代碼需要好幾天,AIBuildAI 十幾分鐘就能完成代碼編寫,大多數(shù)數(shù)據(jù)量不大的任務(wù),一天內(nèi)就能落地。”謝澎濤介紹道。

目前,AIBuildAI 已深度融入團(tuán)隊(duì)實(shí)驗(yàn)室工作,主要服務(wù)生物醫(yī)學(xué)背景的研究者,完美適配分類、回歸、序列分析等單模態(tài)任務(wù),無(wú)論是生物信息數(shù)據(jù)分析,還是產(chǎn)業(yè)界的預(yù)測(cè)建模需求,都能輕松勝任。但對(duì)于 AI方向博士生的前沿研究、多模態(tài)融合任務(wù),目前仍無(wú)法完全滿足,團(tuán)隊(duì)仍在持續(xù)迭代優(yōu)化。

針對(duì)用戶關(guān)心的系統(tǒng)適配問(wèn)題,謝澎濤表示,現(xiàn)階段 AIBuildAI 僅支持 Linux 系統(tǒng),暫無(wú)適配 Mac、Windows 的計(jì)劃。“AI 模型訓(xùn)練依賴 GPU,而 99% 的 GPU 環(huán)境都部署在 Linux 上,足以覆蓋絕大多數(shù)使用場(chǎng)景。”

據(jù)悉,AIBuildAI 已開啟中小企業(yè)試用,收獲了不少真實(shí)反饋,也明確了下一步優(yōu)化方向。用戶反饋的核心問(wèn)題集中在兩點(diǎn):數(shù)據(jù)處理能力不足,難以應(yīng)對(duì)缺失值、標(biāo)注混亂等問(wèn)題;對(duì)用戶意圖理解不夠精準(zhǔn)。

謝澎濤坦言,數(shù)據(jù)處理的技術(shù)難點(diǎn)并不大,通過(guò)增加數(shù)據(jù)質(zhì)量檢查工具就能逐步優(yōu)化,但現(xiàn)實(shí)場(chǎng)景中數(shù)據(jù)問(wèn)題繁雜,實(shí)現(xiàn)泛化適配仍有挑戰(zhàn)。這也是團(tuán)隊(duì)接下來(lái)的重點(diǎn)攻堅(jiān)方向。

對(duì)于 AIBuildAI 的長(zhǎng)遠(yuǎn)未來(lái),謝澎濤有著更宏大的構(gòu)想:讓智能體具備自我學(xué)習(xí)、自我進(jìn)化的能力。“未來(lái)它能主動(dòng)閱讀最新論文,歸納新知識(shí)、轉(zhuǎn)化為自身技能,不用人工干預(yù)就能實(shí)現(xiàn)能力升級(jí)。”

1.https://pengtaoxie.github.io/

2.https://github.com/aibuildai/AI-Build-AI

3.https://github.com/openai/mle-bench/pull/126

4.https://www.science.org/doi/10.1126/science.adf2465

運(yùn)營(yíng)/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
震驚!張雪峰助理萬(wàn)霞竟是公司“001號(hào)員工”陪創(chuàng)業(yè)9年成最強(qiáng)搭檔

震驚!張雪峰助理萬(wàn)霞竟是公司“001號(hào)員工”陪創(chuàng)業(yè)9年成最強(qiáng)搭檔

鄉(xiāng)野小珥
2026-03-26 21:28:25
費(fèi)率0.3%,社保“第六險(xiǎn)”來(lái)了,退休人員也要交

費(fèi)率0.3%,社保“第六險(xiǎn)”來(lái)了,退休人員也要交

財(cái)話連篇
2026-03-26 13:09:33
掛斷王毅電話后,伊朗向全球發(fā)出"照會(huì)",把小薩拉曼鼻子都?xì)馔崃?>
    </a>
        <h3>
      <a href=聞香閣
2026-03-25 22:48:26
調(diào)查發(fā)現(xiàn):若50歲前沒(méi)患這4種疾病,以后患癌的幾率或微乎其微?

調(diào)查發(fā)現(xiàn):若50歲前沒(méi)患這4種疾病,以后患癌的幾率或微乎其微?

醫(yī)學(xué)科普匯
2026-03-26 20:55:03
瘋爽被塘主追著求復(fù)合

瘋爽被塘主追著求復(fù)合

毒舌扒姨太
2026-03-26 22:44:25
TOP14位身高170以上的女神,有顏有燈有演技

TOP14位身高170以上的女神,有顏有燈有演技

素然追光
2026-01-02 02:45:02
震碎三觀!鄧兆尊節(jié)目自曝多人運(yùn)動(dòng),交3個(gè)女友還能一碗水端平

震碎三觀!鄧兆尊節(jié)目自曝多人運(yùn)動(dòng),交3個(gè)女友還能一碗水端平

橙星文娛
2026-03-26 09:20:10
陳云晚年首次披露:遵義會(huì)議上這兩個(gè)人死活不同意毛主席,吵得面紅耳赤

陳云晚年首次披露:遵義會(huì)議上這兩個(gè)人死活不同意毛主席,吵得面紅耳赤

老杉說(shuō)歷史
2026-03-21 17:38:44
馬英九疑似患失智癥,臺(tái)律師:大陸已注意到,沒(méi)讓其擔(dān)任統(tǒng)一大使

馬英九疑似患失智癥,臺(tái)律師:大陸已注意到,沒(méi)讓其擔(dān)任統(tǒng)一大使

卷史
2026-03-26 20:08:36
我們看印度人是奇葩,印度人看我們也一樣?真相是我們想象的百倍

我們看印度人是奇葩,印度人看我們也一樣?真相是我們想象的百倍

番外行
2026-03-24 13:04:28
50℃高溫鎖住國(guó)運(yùn)!電不夠水沒(méi)有,印度的未來(lái),徹底沒(méi)希望了?

50℃高溫鎖住國(guó)運(yùn)!電不夠水沒(méi)有,印度的未來(lái),徹底沒(méi)希望了?

Hi科普啦
2026-03-25 14:57:31
斬草除根!美以聯(lián)合空襲打擊伊朗伊斯法罕關(guān)鍵光電及導(dǎo)彈研究設(shè)施

斬草除根!美以聯(lián)合空襲打擊伊朗伊斯法罕關(guān)鍵光電及導(dǎo)彈研究設(shè)施

軍迷戰(zhàn)情室
2026-03-25 07:42:05
伊朗戰(zhàn)爭(zhēng)還將持續(xù)多久?據(jù)傳特朗普希望4-6周內(nèi)終結(jié)戰(zhàn)事

伊朗戰(zhàn)爭(zhēng)還將持續(xù)多久?據(jù)傳特朗普希望4-6周內(nèi)終結(jié)戰(zhàn)事

財(cái)聯(lián)社
2026-03-26 18:29:05
開源作者把5個(gè)免費(fèi)賬號(hào)拼成1個(gè)無(wú)限額度,AI公司還沒(méi)反應(yīng)過(guò)來(lái)

開源作者把5個(gè)免費(fèi)賬號(hào)拼成1個(gè)無(wú)限額度,AI公司還沒(méi)反應(yīng)過(guò)來(lái)

報(bào)錯(cuò)免疫體
2026-03-26 12:07:59
有網(wǎng)友在大冰直播間看到彈幕稱張雪峰因心臟驟停離世,大冰隨即回應(yīng):我下午就已得知此事,心情十分沉重

有網(wǎng)友在大冰直播間看到彈幕稱張雪峰因心臟驟停離世,大冰隨即回應(yīng):我下午就已得知此事,心情十分沉重

畫夕
2026-03-26 01:20:12
巴蒂:馬拉多納離世時(shí)身邊沒(méi)有人,最后走得像條狗一樣

巴蒂:馬拉多納離世時(shí)身邊沒(méi)有人,最后走得像條狗一樣

懂球帝
2026-03-26 06:43:02
2-0晉級(jí)八強(qiáng)!中國(guó)女網(wǎng)15歲新星連續(xù)爆冷真猛:下一輪對(duì)決王曦雨

2-0晉級(jí)八強(qiáng)!中國(guó)女網(wǎng)15歲新星連續(xù)爆冷真猛:下一輪對(duì)決王曦雨

李喜林籃球絕殺
2026-03-26 17:04:26
中國(guó)移動(dòng)官宣!4月30日起全國(guó)統(tǒng)一執(zhí)行,事關(guān)所有手機(jī)號(hào)

中國(guó)移動(dòng)官宣!4月30日起全國(guó)統(tǒng)一執(zhí)行,事關(guān)所有手機(jī)號(hào)

Thurman在昆明
2026-03-26 13:35:46
看了新加坡媒體的披露,我才知道,中國(guó)已經(jīng)沒(méi)必要向世界證明什么

看了新加坡媒體的披露,我才知道,中國(guó)已經(jīng)沒(méi)必要向世界證明什么

觸摸史跡
2026-03-21 02:58:06
人類史上最高級(jí)零元購(gòu),榨干印度200年,留下45萬(wàn)億天價(jià)賬單

人類史上最高級(jí)零元購(gòu),榨干印度200年,留下45萬(wàn)億天價(jià)賬單

掠影后有感
2026-03-26 10:39:36
2026-03-27 00:40:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
16491文章數(shù) 514798關(guān)注度
往期回顧 全部

科技要聞

美團(tuán)發(fā)布外賣大戰(zhàn)后成績(jī)單:虧損超200億

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

體育要聞

申京努力了,然而杜蘭特啊

娛樂(lè)要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財(cái)經(jīng)要聞

油價(jià)"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

本地
時(shí)尚
數(shù)碼
游戲
公開課

本地新聞

救命,這只醬板鴨已經(jīng)在我手機(jī)復(fù)仇了一萬(wàn)遍

400萬(wàn)人愛過(guò)的女孩,被黃謠網(wǎng)暴180天后

數(shù)碼要聞

英特爾發(fā)Q1.26版Arc Pro專業(yè)顯卡驅(qū)動(dòng),支持B70 / B65顯卡

PS1大IP游戲藏私貨!成人手繪與盜版馬里奧ROM塞滿

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版