今天,在 FORCE 原動(dòng)力大會(huì)上,火山引擎正式發(fā)布豆包大模型1.6、豆包·視頻生成模型 Seedance 1.0 pro、豆包·語(yǔ)音播客模型,豆包·實(shí)時(shí)語(yǔ)音模型在火山引擎全量上線,豆包大模型家族已成為擁有全模態(tài)、全尺寸、高性價(jià)比的領(lǐng)先模型。截至2025年5月底,豆包大模型日均 tokens 使用量超過16.4萬億,較去年5月剛發(fā)布時(shí)增長(zhǎng)137倍。
字節(jié)跳動(dòng) CEO 梁汝波表示,做好火山引擎對(duì)字節(jié)跳動(dòng)成為一家優(yōu)秀的科技公司、保持技術(shù)競(jìng)爭(zhēng)力很重要。未來,字節(jié)跳動(dòng)會(huì)堅(jiān)定長(zhǎng)期投入,追求智能突破,服務(wù)產(chǎn)業(yè)應(yīng)用。
字節(jié)跳動(dòng) CEO 梁汝波
在價(jià)格方面,豆包大模型1.6采用統(tǒng)一定價(jià)模式,首創(chuàng)按“輸入長(zhǎng)度”區(qū)間定價(jià),在企業(yè)使用最多的輸入?yún)^(qū)間0-32K 范圍內(nèi),豆包大模型1.6的價(jià)格為輸入0.8元/百萬 tokens、輸出8元/百萬 tokens,綜合成本比豆包1.5·深度思考模型、DeepSeek R1降低63%。Seedance 1.0 pro 模型每千 tokens 0.015元,相當(dāng)于每生成一條5秒的1080P 視頻只需3.67元,行業(yè)最低。
目前,能自主思考、規(guī)劃、完成任務(wù)的 Agent 正在逐步進(jìn)入企業(yè)生產(chǎn)場(chǎng)景,這不僅需要模型做到強(qiáng)推理、多模態(tài)、低成本,也需要升級(jí) AI 云原生全棧服務(wù)。大會(huì)上,字節(jié)跳動(dòng)技術(shù)副總裁洪定坤、火山引擎總裁譚待發(fā)布了12款面向 Agent 開發(fā)和應(yīng)用的工具產(chǎn)品。
針對(duì) Agent 開發(fā),升級(jí) AI IDE“TRAE”,發(fā)布火山引擎 MCP 服務(wù)、Prompt 優(yōu)化工具“PromptPilot”、開源的 veRL 強(qiáng)化學(xué)習(xí)框架、AI 知識(shí)管理產(chǎn)品;大數(shù)據(jù)服務(wù)上,發(fā)布多模態(tài)數(shù)據(jù)湖、AI 數(shù)字專家“Data Agent”;AI 基礎(chǔ)設(shè)施上,針對(duì) Agent 開發(fā)、模型訓(xùn)練和推理,發(fā)布 AgentKit、TrainingKit、Servingkit;安全是一切 Agent 運(yùn)行的基礎(chǔ),為此火山引擎發(fā)布 AICC 私密計(jì)算、大模型應(yīng)用防火墻。
譚待表示,AI 時(shí)代,開發(fā)范式、大數(shù)據(jù)、計(jì)算、安全都在發(fā)生重大變化,由此構(gòu)成的“AI 云原生”全新技術(shù)棧,是企業(yè)構(gòu)建好 Agent、創(chuàng)新發(fā)展的關(guān)鍵。
火山引擎總裁 譚待
豆包大模型1.6正式發(fā)布 更強(qiáng)模型 更高性價(jià)比
全新發(fā)布的豆包大模型1.6系列由三個(gè)模型組成,為企業(yè)提供多樣化選擇。
doubao-seed-1.6:All-in-One 的綜合模型,是國(guó)內(nèi)首個(gè)支持256K 上下文的思考模型,支持深度思考、多模態(tài)理解、圖形界面操作等多項(xiàng)能力。支持選擇開啟或關(guān)閉深度思考、自適應(yīng)思考三種方式,其中自適應(yīng)思考模式可根據(jù)提示詞難度自動(dòng)決定是否開啟思考,提升效果的同時(shí)大幅減少 tokens 消耗。
doubao-seed-1.6-thinking:豆包大模型1.6系列在深度思考方面的強(qiáng)化版本;在代碼、數(shù)學(xué)、邏輯推理等基礎(chǔ)能力上進(jìn)一步提升;支持256K 上下文。
doubao-seed-1.6-flash:豆包大模型1.6系列的極速版本,支持深度思考、多模態(tài)理解、256K 上下文;延遲極低,TOPT 僅需10ms;視覺理解能力比肩友商旗艦?zāi)P汀?/p>
豆包大模型1.6具有更強(qiáng)的模型效果,在眾多權(quán)威測(cè)評(píng)集上,得分均屬于國(guó)際第一梯隊(duì)。在推理能力、多模態(tài)理解能力、GUI 操作能力上具備領(lǐng)先優(yōu)勢(shì)。
推理能力
豆包大模型1.6在推理速度、準(zhǔn)確度與穩(wěn)定性上顯著提升,可支撐更復(fù)雜的業(yè)務(wù)場(chǎng)景落地。
例如,有媒體針對(duì)今年的高考全國(guó)新一卷數(shù)學(xué)單科做了測(cè)評(píng),豆包的成績(jī)是144分,全國(guó)第一。而在高考前,在針對(duì)海淀區(qū)模擬全卷的測(cè)評(píng)中,相比去年的模型,豆包大模型1.6理科成績(jī)顯著提升了154分,文科提升了90分。
豆包大模型1.6具有邊想邊搜、DeepResearch 深度研究能力,能獨(dú)立思考、規(guī)劃、使用搜索等各種研究工具。例如豆包 APP 和 PC 端正在小流量測(cè)試的 DeepResearch 功能,可以把過去需要多名專業(yè)人士花費(fèi)數(shù)天寫成的調(diào)研報(bào)告,縮短到5-30分鐘內(nèi)完成,還能自動(dòng)提煉信息,總結(jié)成網(wǎng)頁(yè),方便查閱。
為方便企業(yè)使用“邊想邊搜”和 DeepResearch 功能,火山引擎打造了大模型應(yīng)用實(shí)驗(yàn)室,并開源了手機(jī)助手、實(shí)時(shí)視頻理解、DeepSearch 等應(yīng)用,幫助企業(yè)快速搭建 AI 應(yīng)用原型,靈活編排自己的專屬智能體。用戶可在火山引擎官網(wǎng)大模型應(yīng)用實(shí)驗(yàn)室、GitHub 方舟開源站點(diǎn)下載使用。
多模態(tài)理解
多模態(tài)理解的核心是“讓模型像人一樣理解世界”。豆包大模型1.6全系列均原生支持多模態(tài)思考能力,讓模型可以理解和處理真實(shí)世界的問題。該能力支持了豆包 APP 最新的實(shí)時(shí)視頻通話功能,在企業(yè)端可廣泛應(yīng)用于電商商品審核、自動(dòng)駕駛標(biāo)注、安全巡檢等場(chǎng)景。
GUI操作能力
豆包大模型1.6憑借領(lǐng)先的視覺深度思考能力、精準(zhǔn)的視覺定位能力,能夠讓智能體與瀏覽器及其他軟件進(jìn)行交互和操作,高效執(zhí)行各類任務(wù)。
更高性價(jià)比
豆包大模型1.6采用統(tǒng)一定價(jià)模式,無論是否開啟深度思考模式,無論是文本還是視覺,tokens 價(jià)格均一致,按照輸入上下文長(zhǎng)度區(qū)間定價(jià)。
在絕大部分企業(yè)使用的輸入?yún)^(qū)間0-32K 范圍內(nèi),價(jià)格是輸入0.8元/百萬 tokens,輸出8元/百萬 tokens
在輸入?yún)^(qū)間32K-128K 的范圍內(nèi),價(jià)格是輸入1.2元/百萬 tokens,輸出16元/百萬 tokens
在輸入?yún)^(qū)間128K-256K 的范圍內(nèi),價(jià)格是輸入2.4元/百萬 tokens,輸出24元/百萬 tokens
從綜合成本來看,絕大部分請(qǐng)求輸入都在32K 以內(nèi),輸入輸出占比在3:1,豆包大模型1.6的綜合成本(2.6元)比豆包大模型1.5·深度思考模型、DeepSeek R1的綜合成本(7元)下降63%,相當(dāng)于只需原來三分之一的價(jià)格,就能使用能力更強(qiáng)、原生多模態(tài)的新模型。
此次火山引擎還增設(shè)特惠區(qū),對(duì)于輸入32K、輸出200 tokens 以內(nèi)的請(qǐng)求,豆包大模型1.6的價(jià)格將進(jìn)一步降低到輸入0.8元/百萬 tokens、輸出2元/百萬 tokens。相當(dāng)于絕大部分非思考模型的需求,也可以安心使用更好效果的新模型。
豆包·視頻生成模型Seedance 1.0 pro正式發(fā)布
全新發(fā)布的豆包·視頻生成模型 Seedance 1.0 pro 具備三大特性:無縫多鏡頭敘事、多動(dòng)作及隨心運(yùn)鏡、穩(wěn)定運(yùn)動(dòng)與真實(shí)美感,在電商、影視、游戲等行業(yè)應(yīng)用前景廣闊。
根據(jù)第三方權(quán)威榜單 Artificial Analysis 最新結(jié)果,Seedance 1.0 pro 在文生視頻、圖生視頻兩個(gè)維度都超越了業(yè)界諸多主流模型,登頂全球競(jìng)技場(chǎng)第一。
Seedance 1.0 pro 的價(jià)格是每千 tokens 1分5厘,相當(dāng)于每生成一條5秒的1080P 視頻只需3.67元。假如有1萬元預(yù)算,通過 Seedance 1.0 Pro 可制作2,700多條5秒的1080P 視頻,通過 Seedance 1.0 lite 可以制作9,700多條視頻。
兩款豆包語(yǔ)音大模型上新
語(yǔ)音正在成為 AI 應(yīng)用和 Agent 的核心交互方式,小米汽車、OPPO、美圖、兒歌多多等企業(yè)已使用豆包語(yǔ)音大模型提升產(chǎn)品創(chuàng)新體驗(yàn)。
今天,豆包·實(shí)時(shí)語(yǔ)音模型全量上線火山方舟,對(duì)企業(yè)客戶開放使用。該模型支持自然語(yǔ)言高級(jí)指令控制,具備唱歌表演、聲線模仿、方言演繹等多種能力,語(yǔ)氣、用語(yǔ)、思考方式等擬人感大幅提升,能隨時(shí)打斷與主動(dòng)搭話。
此外,火山引擎還發(fā)布了豆包·語(yǔ)音播客模型。只需輸入一句話、網(wǎng)頁(yè)鏈接、長(zhǎng)文本或文檔,語(yǔ)音播客模型即可快速搜索學(xué)習(xí),生成播客腳本后創(chuàng)作出來;模型可秒級(jí)生成雙人對(duì)話式播客作品,效果自然,具有互相附和、插話、猶豫等播客節(jié)奏;自帶的深度搜索功能可生成跟進(jìn)熱點(diǎn)話題的播客內(nèi)容。
AI云原生全棧服務(wù)發(fā)布 讓Agent從Demo走進(jìn)企業(yè)生產(chǎn)系統(tǒng)
AI 時(shí)代,開發(fā)范式將發(fā)生重大變化,調(diào)用中心正在從程序員轉(zhuǎn)移到大模型,這就需要更好的模型和模型工具平臺(tái)。在基礎(chǔ)設(shè)施層,計(jì)算(以 GPU 為核心的計(jì)算和網(wǎng)絡(luò)系統(tǒng))、大數(shù)據(jù)(多模態(tài))、安全(防御惡意AI)也正在發(fā)生巨變。為此,火山引擎發(fā)布AI云原生全棧服務(wù),幫助企業(yè)加速 Agent 落地。
Agent開發(fā) 用好AI+做好AI
火山引擎智能算法負(fù)責(zé)人吳迪表示,要構(gòu)建高生產(chǎn)力的 Agent,既要用好 AI,整合高質(zhì)量的應(yīng)用;又要做好 AI,關(guān)注底層技術(shù)本身的優(yōu)化和創(chuàng)新。
為幫助企業(yè)高效構(gòu)建 Agent,此次火山引擎發(fā)布和升級(jí)了五款產(chǎn)品:
AI IDE產(chǎn)品TRAE升級(jí):為開發(fā)者提供代碼補(bǔ)全、局部代碼生成功能,支持代碼重構(gòu)、批量修改、知識(shí)問答等復(fù)雜任務(wù),下一個(gè)版本還將整合不同 Agent 和工具,協(xié)調(diào)任務(wù)流程,實(shí)現(xiàn)自動(dòng)串聯(lián)操作,逐步從 AI 輔助編程向支持 AI 開發(fā)全流程進(jìn)階。今年1月上線至今,TRAE 月活用戶已經(jīng)超過了100萬。
發(fā)布火山引擎MCP服務(wù):鏈接 Agent 開發(fā)體系、大模型工具生態(tài)、云服務(wù)。與 TRAE、 火山方舟、 扣子打通,一鍵選擇200+豐富 MCP 服務(wù);開發(fā)者可以通過 MCP,控制火山引擎的云服務(wù)組件,便捷地完成計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)等環(huán)境部署,更快地把一個(gè)創(chuàng)意,變成一個(gè)成熟的產(chǎn)品。
發(fā)布PromptPilot:可以幫助開發(fā)者把模糊的訴求變?yōu)榫呦蠡哪繕?biāo),在互動(dòng)中引導(dǎo)用戶明確需求、理想回答和評(píng)估標(biāo)準(zhǔn);自動(dòng)撰寫和優(yōu)化提示詞;產(chǎn)生 badcase 能自動(dòng)優(yōu)化提示詞,實(shí)現(xiàn)精準(zhǔn)調(diào)控;具備多輪對(duì)話、視覺理解、復(fù)雜工具調(diào)用的優(yōu)化能力,以及自主判斷是否開啟模型精調(diào)等。
發(fā)布AI知識(shí)管理產(chǎn)品:支持文本、圖像、音頻、視頻等多模態(tài)內(nèi)容對(duì)話式交互,融合本地與互聯(lián)網(wǎng)知識(shí),提供內(nèi)容理解和問答服務(wù);首創(chuàng)可交互的推理“做個(gè)計(jì)劃”功能,實(shí)現(xiàn)人機(jī)協(xié)作制定、修改計(jì)劃。目前已在火山引擎全量邀測(cè)。
發(fā)布開源的veRL強(qiáng)化學(xué)習(xí)框架:可輕松擴(kuò)展多種強(qiáng)化學(xué)習(xí)算法,無縫集成現(xiàn)有 LLM 基礎(chǔ)設(shè)施與模塊化 API,助力開發(fā)者快速搭建 RL 模型開發(fā)管線,提升對(duì)話規(guī)劃、智能編程、復(fù)雜策略優(yōu)化等場(chǎng)景的開發(fā)效率與資源利用率。 除了提供開源框架,此次還上線了 veRL 平臺(tái),用充沛的算力支持強(qiáng)化學(xué)習(xí)需求。
數(shù)據(jù) 從支持BI到支持AI
AI 時(shí)代,數(shù)據(jù)基礎(chǔ)設(shè)施的價(jià)值已從 “支持 BI” 邁向 “支持 AI”?;鹕揭姘l(fā)布多模態(tài)數(shù)據(jù)湖解決方案、Data Agent,助力企業(yè)構(gòu)建智能化、可感知、可行動(dòng)的數(shù)據(jù)體系,實(shí)現(xiàn)數(shù)據(jù)的“主動(dòng)思考”,讓數(shù)據(jù)真正成為企業(yè)的智慧大腦”。
多模態(tài)數(shù)據(jù)湖:新一代 AI Native 的數(shù)據(jù)基建,幫助企業(yè)在多模態(tài)數(shù)據(jù)處理、檢索和分析場(chǎng)景上,更快、更好地識(shí)別和利用多模態(tài)數(shù)據(jù)資產(chǎn),成為驅(qū)動(dòng)企業(yè) AI 模型訓(xùn)練與決策的核心設(shè)施。
Data Agent:新一代企業(yè)級(jí) AI 數(shù)字專家,具備數(shù)據(jù)主動(dòng)分析、智能洞察、策略生成能力;可將日常取數(shù)速度從小時(shí)級(jí)到分鐘級(jí),數(shù)據(jù)獲取成本降低80%;復(fù)雜分析效率從周級(jí)到小時(shí)級(jí),洞察及時(shí)性提升90%;深度分析報(bào)告及營(yíng)銷方案的產(chǎn)出時(shí)間和人力成本都能大幅節(jié)省。
AI基礎(chǔ)設(shè)施 更強(qiáng)、更易用、更開放的AI Infra
火山引擎 AI infra 提供性能和功能更強(qiáng)大、使用更簡(jiǎn)易的 Agent 套件、推理套件、訓(xùn)練套件,幫助企業(yè)全鏈路加速 Agent 構(gòu)建。
AgentKit:為企業(yè)級(jí) Agent 打造的全棧開發(fā)和服務(wù)工具鏈,集成豆包大模型1.6與 Computer Use 等工具;基于火山引擎 veFaaS 預(yù)置模板,用戶只需選擇模型和配置參數(shù)即可快速部署,可實(shí)現(xiàn)分鐘級(jí)10萬核擴(kuò)容;構(gòu)建完整工具生態(tài)體系,支持多終端 Tool Use、覆蓋數(shù)十類三方 MCP Server。
云原生訓(xùn)練套件TrainingKit:實(shí)現(xiàn)高達(dá)60%+的 MFU(算力利用率);面向后訓(xùn)練環(huán)節(jié),通過 veRL 框架、 Sandbox 百萬核秒并發(fā)能力,有效提升后訓(xùn)練效率,為 AI 訓(xùn)練全流程筑牢技術(shù)底座。
云原生推理套件ServingKit:從模型部署、在線推理、服務(wù)運(yùn)維三個(gè)階段進(jìn)行加速和提效,支持開源推理框架,并針對(duì)主流模型進(jìn)行算子優(yōu)化,性能相比社區(qū)最新版本可以提升2-3倍;已在互聯(lián)網(wǎng)、物流、汽車等各行業(yè)應(yīng)用,提升模型訓(xùn)推效率,降低成本。
安全 一切Agent運(yùn)行的基礎(chǔ)
針對(duì)企業(yè)數(shù)據(jù)和用戶隱私保護(hù),如何防止惡意攻擊等安全挑戰(zhàn),火山引擎發(fā)布兩款 AI 安全產(chǎn)品,目前已在聯(lián)想、中國(guó)銀聯(lián)、長(zhǎng)安汽車等眾多企業(yè)落地。
AICC密態(tài)計(jì)算:通過用戶個(gè)人密鑰加密、CPU/GPU 硬件可信環(huán)境計(jì)算、數(shù)據(jù)流轉(zhuǎn)落盤全密文的方式,在不損失推理效果的前提下,讓企業(yè)像使用私部模型一樣安全合規(guī)的使用云端模型。
大模型應(yīng)用防火墻:通過精調(diào)的小參數(shù)模型、分層漏斗策略、流式送檢機(jī)制,保障精準(zhǔn)攔截攻擊變種,同時(shí)不會(huì)增加推理延遲,為企業(yè)智能體應(yīng)用構(gòu)建安全可信的大模型推理空間。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )