“公元5世紀(jì)中期,一位不知名的基督教詩(shī)人離世,而這一年恰好是某古代環(huán)境重建年表的截止年份。這個(gè)科學(xué)年表叫什么名字?”
面對(duì)如此冷門的問題,恐怕連最資深的學(xué)者都會(huì)陷入沉思。既不知道詩(shī)人姓名,又不清楚年表名稱,傳統(tǒng)搜索引擎在這里完全失靈,兩個(gè)看似毫不相關(guān)的信息點(diǎn)就像大海中的兩粒沙子,讓人無(wú)從下手。
就是這樣讓人一頭霧水的難題,一款名叫WebSailor的智能體卻能通過交叉驗(yàn)證快速鎖定正確答案:詩(shī)人是 Synesius of Cyrene、科學(xué)年表“PAGES 2k”、時(shí)間414年。
這不禁讓人震驚:什么時(shí)候AI已經(jīng)進(jìn)化到如此程度?
要知道,就在半年前,Agent還被普遍認(rèn)為是玩具屬性大于工具屬性。大部分產(chǎn)品內(nèi)測(cè)名額一票難求,實(shí)際表現(xiàn)卻頻頻翻車。
盡管最初效果不如人意,智能體的進(jìn)化速度卻很快。如今,在營(yíng)銷、醫(yī)療等專業(yè)領(lǐng)域,Agent的表現(xiàn)甚至已超過人類水平。
今天,我們一起來(lái)扒一扒上半年有哪些智能體,已經(jīng)超出了我們以往的想象。
面對(duì)世錦賽級(jí)別的金融建模題,即便是經(jīng)驗(yàn)豐富的分析師,往往也需要數(shù)小時(shí)推演驗(yàn)證。但如果現(xiàn)在告訴你,有人能在10分鐘內(nèi)給出準(zhǔn)確答案,你相信嗎?
這樣復(fù)雜的任務(wù),即使放給市面上最優(yōu)秀的大模型,也可能一籌莫展。但一款名叫Shortcut的智能體卻在短短10分鐘內(nèi)完成了,不僅準(zhǔn)確率超80%,時(shí)間比人類快了整整10倍。
Excel世錦賽有多難?
它由微軟官方背書、FMWC 組委會(huì)運(yùn)營(yíng),任務(wù)涵蓋復(fù)雜函數(shù)、Power Query、動(dòng)態(tài)數(shù)組、蒙特卡洛模擬等,被選手形容為“最殘忍的函數(shù)修羅場(chǎng)”。參賽選手來(lái)自全球各地,多為投行數(shù)據(jù)分析師、四大財(cái)務(wù)建模總監(jiān)、微軟前MVP,學(xué)歷資歷含金量拉滿。
而這一屆考題,也就是Shortcut的首秀試題,以《魔獸世界》30周年為主題,要求選手在40分鐘內(nèi)完成20多個(gè)關(guān)聯(lián)表格操作。參賽者需手動(dòng)建立VLOOKUP、INDEX-MATCH等公式,在復(fù)雜的數(shù)據(jù)迷宮中建立精準(zhǔn)鏈接。
對(duì)此,Shortcut不僅克服了傳統(tǒng)AI模型在數(shù)據(jù)處理量上的限制,更完美避開了幻覺輸出的痛點(diǎn)。面對(duì)海量無(wú)序數(shù)據(jù)和確定性極強(qiáng)的函數(shù)規(guī)則,它能像經(jīng)驗(yàn)豐富的分析師一樣,快速理解任務(wù)需求并給出精準(zhǔn)解決方案。原本需要人類選手1~2小時(shí)才能完成的賽題,Shortcut僅用10分鐘就交出了完美答卷。
據(jù)開發(fā)團(tuán)隊(duì)透露,Shortcut支持自然語(yǔ)言指令交互,能輕松應(yīng)對(duì)金融建模、5000行CSV數(shù)據(jù)分析、數(shù)據(jù)可視化甚至像素畫創(chuàng)作等復(fù)雜任務(wù)。其核心能力涵蓋智能填充、錯(cuò)誤自動(dòng)排查、多表關(guān)聯(lián)分析等專業(yè)功能,堪稱Excel領(lǐng)域的六邊形戰(zhàn)士。
看到這樣的財(cái)務(wù)人員,或許會(huì)直呼遇到了救星。
因?yàn)樨?cái)務(wù)部門最愁的就是數(shù)不勝數(shù)的數(shù)據(jù)、表格、文件,但前期AI發(fā)展受制于token限制和幻覺,無(wú)法處理成百上千的數(shù)據(jù),一個(gè)小數(shù)點(diǎn)、標(biāo)點(diǎn)符號(hào)的錯(cuò)誤都會(huì)給公司帶來(lái)難以估量的損失。這一度也給公眾留下了AI無(wú)法解決實(shí)際難題的印象。
而Shortcut的出現(xiàn)則打破局面,給這個(gè)痛點(diǎn)帶來(lái)了新的可能。
畢竟,5000行CSV數(shù)據(jù)如果一行一行錄入校對(duì),可將近一周的工作量?,F(xiàn)在,盡管Shortcut仍存在復(fù)雜函數(shù)作圖出錯(cuò)的可能,但就是解決單一的信息整理工作,也能挽救他們?nèi)諠u稀少的發(fā)量了。
在外貿(mào)行業(yè),銷售團(tuán)隊(duì)拼盡全力,可能也只能將成交率從10%推到15%。但有一家公司,卻悄無(wú)聲息地把這個(gè)數(shù)字拉到了50%——不是靠瘋狂加班,不是靠人海戰(zhàn)術(shù),而是靠一個(gè)看不見的銷售王牌。
竟對(duì)公司以為對(duì)方請(qǐng)來(lái)了高人,客戶認(rèn)為自己在自主決策?不,他們可能早已掉進(jìn)Agent精心設(shè)計(jì)的溫柔陷阱。
數(shù)據(jù)顯示,一個(gè)傳統(tǒng)業(yè)務(wù)員的成單率一般在10%~15%。而一款叫Agentforce的智能體成單率卻達(dá)到了50%。自2024年上線以來(lái),成單超過8000單。
最讓業(yè)務(wù)員扎心的是,這款A(yù)gent不僅成交率高、簽單額也不低,動(dòng)輒七位數(shù)美元級(jí)。這些大單如果由自己簽下,提成起碼四位數(shù)起??涩F(xiàn)實(shí)是,最老練的銷冠也不得不思考,為什么苦心經(jīng)營(yíng)的技巧和話術(shù),被一個(gè)橫空出世的Agent截胡了?
第一點(diǎn),要休息的人類拼不過輪軸轉(zhuǎn)的機(jī)器。跨國(guó)貿(mào)易中流傳著一句話,誰(shuí)越能熬夜,誰(shuí)就越能賺錢。時(shí)差的存在產(chǎn)生了外貿(mào)的白夜班作息,但仍然沒有人能24h堅(jiān)守崗位,在顧客決定下單的那一時(shí)間精準(zhǔn)說(shuō)服他。Agentforce做到了,它像一臺(tái)永不疲倦的數(shù)字銷售系統(tǒng),在7×24h模式下并發(fā)處理數(shù)千條對(duì)話,把人工坐席數(shù)減少30~60%。
第二點(diǎn),統(tǒng)一刻板的話術(shù)比不過八面玲瓏的“奉承”。為什么客戶在下單時(shí)常常意識(shí)不到是AI讓它動(dòng)心了呢?因?yàn)樵?1世紀(jì),真的找不到比AI更會(huì)阿諛奉承的角色了。傳統(tǒng)銷售依賴人力,業(yè)務(wù)員靠經(jīng)驗(yàn)判斷客戶意向,受個(gè)人情緒、疲勞度影響,很難編織出對(duì)胃口的話。但Agentforce能夠?qū)崟r(shí)分析官網(wǎng)瀏覽、郵件互動(dòng)等行為痕跡,鎖定高意向目標(biāo),并通過情感分析自動(dòng)調(diào)整話術(shù),提升后續(xù)轉(zhuǎn)化率。
第三點(diǎn),只會(huì)母語(yǔ)的人比不過精通外語(yǔ)和百科的AI。有了AI,會(huì)一門外語(yǔ)真的不能算是顯著的有實(shí)力。據(jù)悉,Agentforce的訓(xùn)練語(yǔ)料橫跨17種語(yǔ)言,涵蓋74萬(wàn)份Salesforce官方文檔與元數(shù)據(jù)。依托Salesforce總量高達(dá)200~300PB的行業(yè)級(jí)數(shù)據(jù)湖,Agentforce獲得了遠(yuǎn)超同類產(chǎn)品的上下文深度和領(lǐng)域精度,從而顯著降低幻覺風(fēng)險(xiǎn),給出更可靠的結(jié)果。
我們有理由相信,在未來(lái),Agent業(yè)務(wù)員將會(huì)進(jìn)攻到每一個(gè)交易領(lǐng)域,不管是大宗商品、還是小本生意,它的成交率將越來(lái)越高、成交范圍也會(huì)越來(lái)越廣。
AI開的藥,你敢吃嗎?
我們都知道,AI已經(jīng)走進(jìn)了各個(gè)領(lǐng)域,醫(yī)療也不例外,但對(duì)于直接吃AI開的藥,或許大部分人還是會(huì)膽戰(zhàn)心驚。畢竟,用藥量的微小差異可能導(dǎo)致成癮性,用藥方案的微小偏差也可能引發(fā)嚴(yán)重的副作用,可謂失之毫厘、謬以千里。
但如果告訴你,AI醫(yī)生的診斷準(zhǔn)確率甚至超過了專業(yè)醫(yī)生,你能相信嗎?
在美國(guó),一款名叫Polaris的醫(yī)療Agent能夠?yàn)榛颊咛峁┱鎸?shí)的用藥意見,醫(yī)療建議準(zhǔn)確率超過99%,遠(yuǎn)高于美國(guó)注冊(cè)護(hù)士81%的平均水平。并且,該智能體推薦的藥品和復(fù)診意見,在病人的好評(píng)率中趨近于90%。這意味著,AI不僅比人準(zhǔn),甚至比人更受患者信任。
但作為Agent,它是如何做到的呢?這源于多個(gè)智能體的協(xié)同工作和交叉驗(yàn)證機(jī)制。
Polaris由三個(gè)Agent共同出診,而非單一模型獨(dú)立決策。例如,當(dāng)患者詢問某種藥物的副作用時(shí),實(shí)驗(yàn)室Agent檢索最新的藥物臨床試驗(yàn)數(shù)據(jù),確保信息基于權(quán)威醫(yī)學(xué)研究;藥物Agent核對(duì)患者的用藥史、過敏記錄,避免潛在的藥物相互作用風(fēng)險(xiǎn);主要Agent綜合前兩者的分析,生成最終建議,并標(biāo)注置信度。
為了進(jìn)一步保證用藥安全和患者福利,超過6500名護(hù)士、500名醫(yī)生參與了最終安全評(píng)估,助力該系統(tǒng)獲得FDA認(rèn)可的醫(yī)療AI專利。
據(jù)悉,在阿聯(lián)酋,Polaris已被整合進(jìn)Burjeel醫(yī)療集團(tuán)的數(shù)字系統(tǒng)。在超過185萬(wàn)次真實(shí)患者互動(dòng)測(cè)試中,Polaris3.0臨床準(zhǔn)確率高達(dá)99.38%,患者滿意度達(dá)8.95/10。
但需要注意的是,Polaris目前只能在有明確解法和醫(yī)學(xué)案例的疾病上給出問診方案和醫(yī)療建議,無(wú)法直接參與藥物研究開發(fā)。也就是說(shuō),醫(yī)療智能體更強(qiáng)調(diào)常規(guī)病例的診斷正確率,而不是研發(fā)創(chuàng)新工作。所以某種程度上,它只能在臨床發(fā)揮作用,而不能參與罕見病藥物開發(fā)等前沿工作。因?yàn)閷?duì)于醫(yī)院這樣生命優(yōu)先的場(chǎng)景,安全一定是第一位的。Agent想要跟專業(yè)醫(yī)生媲美,還有一大段路要走呢。
不難看出,短短一年,智能體已經(jīng)逐漸超出了人們的想象。從這些智能體的發(fā)展軌跡中,我們能清晰地看到一個(gè)趨勢(shì):Agent正在從概念走向?qū)嵱?,從?shí)驗(yàn)室走進(jìn)我們的日常工作生活。它們不是冷冰冰的機(jī)器,而是逐漸成為各領(lǐng)域?qū)I(yè)人士的得力助手。WebSailor讓研究人員不再被海量文獻(xiàn)淹沒,Shortcut解放了財(cái)務(wù)人員的雙手,Agentforce成為銷售團(tuán)隊(duì)的秘密武器,Hippocratic則是醫(yī)護(hù)人員的第二大腦。
這些智能體最可貴之處在于,它們并非要取代人類,而是通過彌補(bǔ)人類在效率、記憶力和計(jì)算能力上的局限,讓我們能把更多精力投入到真正需要人類智慧的領(lǐng)域。就像望遠(yuǎn)鏡延伸了人類的視野,這些Agent工具正在擴(kuò)展我們的認(rèn)知邊界。
在可以預(yù)見的將來(lái),我們每個(gè)人或許都會(huì)擁有一個(gè)甚至多個(gè)智能體作為助手:幫我們學(xué)習(xí)新知識(shí)的Agent導(dǎo)師、管理日程的Agent秘書、照顧健康的Agent醫(yī)生、創(chuàng)作內(nèi)容的Agent伙伴……但就像歷史上所有偉大的工具一樣,它們不會(huì)取代我們,但會(huì)讓我們變得更強(qiáng),最終成為人類能力的一部分。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 飛書 “打破” AI 與協(xié)同辦公的「黑箱」
- 三星手機(jī)全球第一且增長(zhǎng)最快,國(guó)產(chǎn)手機(jī)vivo搶眼
- 機(jī)器人產(chǎn)業(yè)迎來(lái)“覺醒時(shí)刻”:技術(shù)與生態(tài)雙成熟,萬(wàn)億場(chǎng)景正打開
- 那些超出想象的AI Agent
- 付費(fèi)49萬(wàn)元成為“親傳弟子”,“AI”知識(shí)付費(fèi)圍獵銀發(fā)族
- “硬核之王”榮耀X70正式發(fā)布,打造行業(yè)“耐用鐵三角”
- 電商送外賣,外賣做電商?巨頭混戰(zhàn)背后:一場(chǎng)爭(zhēng)奪產(chǎn)業(yè)互聯(lián)網(wǎng)王座的暗戰(zhàn)
- 企業(yè)級(jí)AI超級(jí)應(yīng)用,下一個(gè)關(guān)鍵籌碼?
- 火極一時(shí)的AI蛋白質(zhì)解析,怎么樣了?
- 智能體浪潮里,豆包的崛起之路
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。