歡迎訪問漢海網(wǎng),帶你進(jìn)入知識的海洋！

豆包大模型1.6-vision正式發(fā)布：首次具備工具調(diào)用能力

由 愛自由 分享時(shí)間：2025-09-30 20:56:00 瀏覽：0

9月30日消息，據(jù)“火山引擎”微信公眾號發(fā)文，豆包大模型1.6-vision正式發(fā)布，這是豆包大模型家族首個(gè)具備工具調(diào)用能力的視覺深度思考模型，擁有更強(qiáng)的通用多模態(tài)理解和推理能力，并支持Responses API。

新模型以工具調(diào)用的差異化能力，將圖像融入其思維鏈中，實(shí)現(xiàn)對圖片的定位、剪裁、點(diǎn)選、畫線、縮放、旋轉(zhuǎn)等精細(xì)處理。 并通過模擬人類從“從全局掃描到局部聚焦”的視覺推理過程，在增強(qiáng)推理可解釋性的同時(shí)，可高效精準(zhǔn)地完成圖像操作。

豆包大模型1.6-vision支持Responses API，可自主選擇調(diào)用工具，大幅度減少Agent開發(fā)過程中的代碼量，提升開發(fā)效率，讓開發(fā) 者應(yīng)用開發(fā)更加高效。

此外，對比上一版視覺理解模型Doubao-1.5-thinking-vision-pro，綜合成本降低約50%，以更低成本解鎖更強(qiáng)性能。

本文轉(zhuǎn)載于快科技，文中觀點(diǎn)僅代表作者個(gè)人看法，本站只做信息存儲

本站部分文章來自網(wǎng)絡(luò)或用戶投稿。涉及到的言論觀點(diǎn)不代表本站立場。閱讀前請查看【免責(zé)聲明】發(fā)布者：愛自由，如若本篇文章侵犯了原著者的合法權(quán)益，可聯(lián)系我們進(jìn)行處理。本文鏈接：http://www.gdyuanyu.cn/article/139448.html

上一篇：人在工位心已飛走網(wǎng)友：今天只有一個(gè)狀態(tài) 等放假

下一篇：直擊全國多地出城高峰：出城大軍已經(jīng)堵上了