![]()
在AI界里最火,也最被關注的就是OpenAI的GPT。他們的發布會跟蘋果發布會,華為發布會一樣備受全球的科技互聯網愛好者的關注。因為這些都代表著互聯網科技的未來和方向。
就在當地時間5月13日上午10點,OpenAI春季發布會終于千呼萬喚始出來。而上一次的發布會已經是一年前的事了。在上次發布會推出GPT-4后,震驚了整個科技互聯網,而這次發布會,大家都帶著強烈的期待,在此之前有太多的猜測,像AI搜索引擎,GPT5等等,但真的沒有一個能猜到。在新發布的版本里,還有大家更猜不到的。
![]()
本次發布會發布的不是GPT-5,而是GPT-4的迭代版本,GPT-4o。OpenAI表示,GPT-4o是一個“原生多模態”模型,它的命名來源于“omni”,即包羅萬象之意。
這么一上來就來了一個“王炸”,真的讓人又有了更高的期待。米拉·穆拉蒂一上來就說OpenAI的目標是進一步減小人們使用AI的障礙,讓所有人都能在工作、學習、創造中用上AI工具。
看來OpenAI在過去的一年中,也發現了不少的問題,其中最大的問題就是功能太分散,用戶使用不方便,現在這么一更新,也算是把用戶的痛點給整上了。
發布會上也說:在未來幾周內,用戶將會陸續自動更新到GPT-4o。
![]()
總結一下:在這一年中,OpenAI做了三件事:
1、集合研究了更強大的模型GPT-4o
2、更新用戶界面提高使用體驗
3、免費開放給用戶。
GPT-4o作為新一代旗艦模型,把AI工具的使用門檻降到了更低的程度,不僅比上一代速度快兩倍,能實現無延遲實時對話,而且用戶不用注冊,功能全部免費。這一次已經給了用戶不少的驚喜啦。
ChatGPT現在也有桌面版本了,據OpenAI的CTO米拉·穆拉蒂(Mira Murati)表示,這也是他們第一次在易用性上做出改進。
![]()
另外,薩姆·奧爾特曼在X上補充道,模型升級不只在GPT上,開發者也可以在API里同步使用GPT-4o,價格是GPT-4 Turbo的一半,速度是GPT-4 Turbo的兩倍。GPT-4o還在50多種除英文外的語言能力上得到了加強。
在發布會上,還有一個現場測試的環節。說到現場測試就讓我想起了雷軍在叫小愛的現場測試,太調皮了。我們來看看OpenAI研究員Marc Chen和Barret Zoph現場測試怎么測試GPT-4o。
![]()
可以毫不夸張地說,新模式的接受能力太強了,連呼吸都能辨別!Chen對GPT說,自己有點緊張,然后開始急促地呼吸。
GPT識別到了他呼吸的聲音,說,別緊張,你喘得像個吸塵器,深呼吸,再吐氣,接著GPT還開始指導Chen怎么深吸慢呼平復心情。
能辨別周圍環境的動靜,還能及時反饋!這么智能的反應,這么快就能有對策,比真人還要快啊。
另外,就像我們生活中的一樣,當你想打斷對方的講話時,對方會怎么回應呢?在新模型中,又會有什么樣反饋?
Chen讓GPT給Zoph講個睡前故事哄他入睡,Chen反復打斷GPT的講述,問它能不能講得更刺激點,最后,GPT跟迪士尼公主似的把故事用歌唱了出來。在新版本里,你要是不想聽可以立刻打斷或者提出意見,就像在真實生活里的交流一樣。
![]()
最后,我們再總結一下,GPT-4o可以綜合利用語音、文本和視覺信息進行推理,該模型將在未來幾周內分階段集成至OpenAI的各個產品之中,將免費提供給所有用戶使用。新模型 GPT-4o的基本的功能:
1、API 2 倍速度、一半價格、5 倍頻率,更快的響應頻率,就像人與人之間的對話交流一樣。
2、語音更自然,可以唱歌,可以學機器人說話,音頻功能還可以實時打斷不必等待完成,更加人性化了。
3、通過視覺功能,可以在線教你解題,還可以看你的表情并理解。
4、能讀懂你的屏幕,可以直接展示代碼,它告訴你代碼什么問題、圖表是什么意思。
5、強大的實時翻譯功能,作為中介幫你翻譯給對方,并幫對方翻譯給你,以后的翻譯都要失業了。
![]()
另外,對于咱們來說,還有一個功能很友好,那就是GPT-4o對中文的理解能力更強了。
看完發布會,還有這些介紹之后,真的很想馬上就去體驗一下這一款號稱:包羅萬象 的AI新工具。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.