豆包大模型1.6-vision正式發(fā)布:首次具備工具調(diào)用能力
由 愛自由 分享
時(shí)間:
瀏覽:0
9月30日消息,據(jù)“火山引擎”微信公眾號發(fā)文,豆包大模型1.6-vision正式發(fā)布,這是豆包大模型家族首個(gè)具備工具調(diào)用能力的視覺深度思考模型,擁有更強(qiáng)的通用多模態(tài)理解和推理能力,并支持Responses API。

新模型以工具調(diào)用的差異化能力,將圖像融入其思維鏈中,實(shí)現(xiàn)對圖片的定位、剪裁、點(diǎn)選、畫線、縮放、旋轉(zhuǎn)等精細(xì)處理。 并通過模擬人類從“從全局掃描到局部聚焦”的視覺推理過程,在增強(qiáng)推理可解釋性的同時(shí),可高效精準(zhǔn)地完成圖像操作。

豆包大模型1.6-vision支持Responses API,可自主選擇調(diào)用工具,大幅度減少Agent開發(fā)過程中的代碼量,提升開發(fā)效率,讓開發(fā) 者應(yīng)用開發(fā)更加高效。
此外,對比上一版視覺理解模型Doubao-1.5-thinking-vision-pro,綜合成本降低約50%,以更低成本解鎖更強(qiáng)性能。

本文轉(zhuǎn)載于快科技,文中觀點(diǎn)僅代表作者個(gè)人看法,本站只做信息存儲
本站部分文章來自網(wǎng)絡(luò)或用戶投稿。涉及到的言論觀點(diǎn)不代表本站立場。閱讀前請查看【免責(zé)聲明】發(fā)布者:愛自由,如若本篇文章侵犯了原著者的合法權(quán)益,可聯(lián)系我們進(jìn)行處理。本文鏈接:http://www.gdyuanyu.cn/article/139448.html
