女女百合av大片一区二区三区九县_成人免费在线小视频_国产欧美日韩在线播放_每日更新av_亚洲精品欧洲_狠狠操狠狠色

首頁 > 實用技巧 > 干貨教程 > OpenAI推出全新推理模型o3、o4-mini,以及一個編程智能體

OpenAI推出全新推理模型o3、o4-mini,以及一個編程智能體

發布時間:2025-04-17 11:49:33來源: 13041198719

4月17日凌晨,OpenAI正式宣布推出目前OpenAI系列里能力最強的推理模型——o3模型和o4-mini模型。

去年12月,OpenAI就預熱過o3推理模型,當時強調的重點是o3模型在解決困難問題上的能力,要顯著強于OpenAI第一代推理模型o1。

而此次正式發布中,OpenAI不僅強調了o3模型在能力上的領先性,同時還強調了o3的Agent能力,且強調o3是第一代能夠在思維鏈中使用圖像進行推理的模型。

自主調用工具是Agent能力最重要的體現。OpenAI表示,曾看到o3為了解一個特別難的任務,連續調用了大約600次工具。

隨著OpenAI的O系列、DeepSeek R1等推理模型日趨成熟,業內普遍認為,只需一條指令即可完成整套任務的AI Agent能力將迎來顯著提升。

相比于Google,Anthropic等從去年就開始宣傳Agent能力,甚至已經開始推動MCP、A2A等Agent協議普及的公司,OpenAI之前在Agent能力上的布局相對缺失。而今天的發布,證明OpenAI在Agent能力上,仍然有自己的思考和布局。

OpenAI宣布, 從今天開始,Plus、Pro和Team用戶就可以使用o3模型和o4-mini模型了,接下來幾周還會推出o3-pro模型,替代過去的o1-pro模型。

在彩蛋環節,OpenAI還表示,未來將發布一系列編程工具,重新定義AI時代的編程,首發的是一個叫Codex CLI的開源輕量化編程agent。Codex CLI可以直接使用OpenAI的模型(最終包括o3和o4-mini),接管本地計算機終端命令行界面,直接進行代碼編寫和文件移動等等。

OpenAI的展示很有意念編程(vibe coding)的味道了:直接在網頁上截圖了一個別人編程好的效果圖,丟給Codex CLI,跟它說做一個html文件復現這個效果,并做一些改動。很快,Codex CLI就自己寫了代碼,調用了系統工具,復現出了一個類似的效果。

OpenAI今日的發布大致符合預期——o3和 o4-mini已經預熱多時,視覺推理與Agent能力也早已在其他公司的模型中有所體現。

不過,從今天的發布中仍能看出OpenAI在Agent等前沿方向上的布局節奏,以及將已有能力產品化的獨特能力。

OpenAI的模型迭代,也再一次重新肯定了后訓練Scaling Law的存在。目前看來,AI模型在接下來幾年,仍然會出現能力的快速進化,還未到達瓶頸。

OpenAI的Agent能力,目前更多的是調用自身的工具

OpenAI此次發布的一大亮點在于Agent的能力。最初的兩個展示都與工具調用能力有關。

第一個展示是研究員給了OpenAI一個十年前寫過的論文圖片,讓o3模型找到一個特定的結果,并和最新的研究成果進行比較。

o3模型首先利用內置的視覺推理能力,放大圖片,找到了研究員想要的特定結果,然后根據圖片中的內容進行推理,算出了論文推導的數值,然后使用搜索功能,查找了十篇論文,比較了最新研究成果與作者十年前論文的結果的區別,最后給出了自己的建議。

第二個演示是研究員問OpenAI,根據我的興趣,讀新聞,告訴我一些我可能感興趣的事情。

這個演示則利用的是OpenAI內置的記憶工具——OpenAI幾天前剛剛宣布OpenAI的模型目前有了可以訪問用戶全量記憶的能力。

o3模型先是訪問記憶后,找出用戶喜歡水肺潛水和彈奏音樂,然后利用搜索功能,找到了一條交叉兩條興趣的新聞:研究人員會錄下健康珊瑚礁的聲音,然后用水下揚聲器在海里播放這些聲音,以保護珊瑚。

最后o3模型使用了OpenAI的canvas工具和數據分析工具,生成了一個漂亮的博客界面,完成了任務。

可以看到,在OpenAI目前的布局當中,Agent能力更多的是調用OpenAI的內部工具。

不過,在基礎的工具調用能力水平存在的情況下,如果想要接入其他工具,似乎也并不是很難。OpenAI今年3月剛剛宣布接入MCP協議,為之后使用其他工具打下了基礎。

o4-mini 表現出色,RL的Scaling Law仍在起作用

雖然在去年12月OpenAI曾經預熱過o3模型的具體能力,這次正式發布,官方表示因為進行了「對推理成本和實用性做了大量優化」,在評測結果上,OpenAI表示可能會有差別。

在發布會直播中,OpenAI展示了幾組測試結果,o3模型和o4-mini模型在數學能力、代碼能力和多模態能力上都表現出色:

干貨教程更多>>

榮威IMAX8的配置比GL8還香嗎?真實車主告訴你值不值! 解碼地平線、Momenta 背后的“上汽力量”:以人-車-生活為支點,實現智能化生態平權進階 何小鵬的雄心:從造車到飛行汽車與機器人小鵬要做“中國特斯拉” 為什么英偉達顯卡比AMD賣得更貴,但仍然銷量很不錯? 索泰(ZOTAC)GEFORCE RTX 5070 12GB XGAMING顯卡測試 隨便刷機玩!零刻ME mini NAS迷你主機,可玩性還挺高! 廣汽集團新注冊《汽車車體約束模態建模分析一體化軟件V1.0》項目的軟件著作權 首個人形機器人半馬完賽,天工Ultra沖線奪冠 “打造人人愛用的智能駕駛產品”,地平線發布L2城區輔助駕駛系統HSD “杭州六小龍”爆火出圈后,浙江高規格部署人工智能發展 AI賦能,新能源汽車產業在“智”與“競”中前行 京東超市百億農補一周年成績單發布:投入35億 價格優化20% 2500萬消費者省下近10億 合肥人都在看!二手房成交top100小區,均價揭曉 廣州五一買房人必看!層高3米的新房,藏著多少居住驚喜呢? 6300mAh大電池!榮耀全新千元神機即將開售,搭載高通經典神U 一加 13T 吊打 iPhone 16?安卓小屏機這波操作直接讓果粉沉默! 榮耀GT Pro手機參數曝光:驍龍8 Eite領先版,7200mAh電池 選購電視看過來!TCL T7L Pro 憑啥脫穎而出? 深冷黑科技+雙系統設計 TCL冰麒麟冰箱解鎖食材保鮮新境界 王騰暗示紅米新機售價,繼續升級,越級迎戰友商! 雷軍說:所有人都說小米造車晚,小米來得正是時候 華為折疊屏手機價格引爭議,這5款大內存機型更值得買 OPPO Reno14系列再次被確認:天璣8350+金屬中框,開始下放長焦! 首搭地平線HSD,九月正式量產,星途這款新車是SUV還是MPV? 比亞迪騰勢首款概念超跑將于2025上海車展亮相 人民之選,五菱:新能源時代的“國民神車”傳奇 寶駿享境:新能源轎車,性價比之王!這次能坐上頭把交椅嗎? 哈弗H5車長5米2,全系四驅帶差速鎖12.78萬起,有什么優缺點? 鄭州日產 Z9 上市:雙動力 + 10 種模式,家用越野一車滿足全場景需求 本田CR-V推出30周年紀念版概念車:內置雙人床、爐灶、水槽
主站蜘蛛池模板: 久久久久.com | 色婷婷久久一区二区三区麻豆 | 欧美亚洲一区 | 91久久精品视频 | 欧美一级片 | 国产在线资源 | 国产激情视频 | 国产精品美女久久久久高潮 | 亚洲精品成人在线 | 中文字幕亚洲综合久久久软件 | 成人免费激情视频 | 日韩成人在线视频 | 成人午夜精品一区二区三区 | 凹凸日日摸日日碰夜夜爽孕妇 | 久久国产综合 | 日韩欧美一区二区三区在线观看 | 91一区二区在线 | 欧美日韩在线一区二区 | 曰韩一级鸥美一级 | 一区二区三区在线播放 | 91麻豆产精品久久久久久 | 日本一区二区三区精品视频 | 成人性生交大片免费看网站 | 黄久久久| 成人精品一区二区三区 | 不卡一区| 日本一区二区三区在线视频 | 亚洲一区国产 | 国产毛片毛片 | 日韩城人免费 | 成人在线观看免费视频 | 亚洲在看 | 91视频一区二区 | 成人三级视频网站 | 亚洲国产aⅴ成人精品无吗 黄色免费在线看 | 91精品久久久久久久久久 | 91视频入口| 亚洲欧美日韩精品久久亚洲区 | 国产精品一区二 | 欧美一级片在线 | 免费毛片黄色视频 |