極客網(wǎng)·極客觀察(舒云)3月31日 還記得百度文心一言被質(zhì)疑是"套殼"事件嗎?近日外媒爆料,谷歌似乎也這么干了。
據(jù)The Information報道,前谷歌人工智能研究員Jacob Devlin最近離開公司加入了OpenAI,但在此之前,他爆料曾向谷歌母公司Alphabet的CEO 桑達爾·皮查伊(Sundar Pichai)警告,谷歌的聊天機器人Bard正在以一種間接的方式從ChatGPT獲取數(shù)據(jù)。
據(jù)Devlin描述,Bard的開發(fā)團隊訪問了一個名為ShareGPT的網(wǎng)站,該網(wǎng)站分享發(fā)布了大量用戶通過ChatGPT獲取的聊天內(nèi)容。這意味著,Bard使用了ChatGPT現(xiàn)成的數(shù)據(jù)來“武裝”自己,相當(dāng)于竊取了ChatGPT的早期成果。
對此,谷歌發(fā)言人 Chris Pappas 很快向媒體發(fā)布聲明,堅決而明確地表示,"Bard沒有使用任何ShareGPT或ChatGPT的數(shù)據(jù)進行訓(xùn)練。(“Bard is not trained on any data from ShareGPT or ChatGPT.”)"
對于媒體追問谷歌Bard此前是否曾經(jīng)利用過ChatGPT的數(shù)據(jù),Pappas拒絕回答,堅稱自己能說的只是如上聲明內(nèi)容。
這一事件不由得令人想起日前百度文心一言遭遇的類似質(zhì)疑。
3月下旬,有網(wǎng)友發(fā)文質(zhì)疑百度文心一言作畫實質(zhì)上是“把中文句子機翻成英語單詞,拿去用國外剛剛開源的人工智能Stable Diffusion生成了圖畫,再返給你,說是自己畫的?!?/p>
當(dāng)時網(wǎng)友舉的例子包括在文心一言輸入指令,要求其畫出“鼠標和總線”,文心一言作出的畫面是“老鼠和公共汽車”,因為“鼠標”和“總線”對于的英文是“mouse”和“bus”。
對此百度方面也是緊急回應(yīng)。3月23日,百度發(fā)布聲明稱,文心一言完全是百度自研的大語言模型,文生圖能力來自文心跨模態(tài)大模型ERNIE-ViLG。在大模型訓(xùn)練中,百度使用的是全球互聯(lián)網(wǎng)公開數(shù)據(jù),符合行業(yè)慣例。同時表示文心一言正在使用過程中不斷學(xué)習(xí)和成長,希望大家給自研技術(shù)和產(chǎn)品一點信心。
隨后,百度對類似問題做了修正,用戶很快發(fā)現(xiàn)相關(guān)問題已經(jīng)不存在,表明類似情況正隨著用戶反饋而被修正。
對于百度文心一言的問題,業(yè)界專家也表示使用網(wǎng)絡(luò)公開數(shù)據(jù)是行業(yè)基本操作。這個行業(yè)存在一批專門為AI應(yīng)用訓(xùn)練數(shù)據(jù)的中間服供商,它們基于公開數(shù)據(jù)標注訓(xùn)練的AI數(shù)據(jù)集確實存在同時被多個AI應(yīng)用采用的情況。
不過業(yè)內(nèi)基本操作在消費者層面可能不會得到同樣的理解和認同,此番谷歌Bard被曝使用ChatGPT的數(shù)據(jù)進行訓(xùn)練也在國外引發(fā)軒然大波,不少網(wǎng)友指責(zé)谷歌是在盜竊OpenAI的成果。
包括網(wǎng)站信息在內(nèi)的網(wǎng)絡(luò)公開數(shù)據(jù)很容易被技術(shù)手段抓取,這對搜索引擎出身的谷歌更是小菜一碟。加之這樣的爆料來自谷歌剛離職的員工,可信度自然提升了一大截。
不過也有網(wǎng)友指出,Devlin離開谷歌AI團隊后轉(zhuǎn)而就加入了競爭對手OpenAI,其爆料難免涉及商業(yè)利益,真實度有待進一步確認。
不過在極客網(wǎng)看來,不管這樣的事件真實度如何,都充分表明一個“鐵律”:AI大模型領(lǐng)域真是一步落后步步落后,后來者想要趕上先發(fā)者是水平,非常不容易。
這背后的影響因素有很多,包括算法、算力,以及訓(xùn)練數(shù)據(jù)的質(zhì)量等。更重要的是,先發(fā)的AI大模型在探明成功之路后,便會一直訓(xùn)練、一直進化,不會停下來等待追趕者。
正因為如此,OpenAI的GPT已經(jīng)很快由GPT-3升級到了GPT-4時代,為此還引發(fā)了包括馬斯克在內(nèi)的多位名人聯(lián)名發(fā)布公開信,呼吁大公司暫停大模型的研發(fā)速度,避免威脅人類。
李彥宏此前面對媒體采訪時也表示,盡管在某些領(lǐng)域表現(xiàn)更出色,總體看百度文心一言與OpenAI ChatGPT的水平還有一兩個月的差距。他同時指出,ChatGPT早期剛推出時外界反饋比文心一言還要糟糕。
對于谷歌Bard來說,還有一個不利消息是據(jù)傳谷歌的 Brain 人工智能團隊正在與另一家隸屬于 Alphabet 的人工智能公司 DeepMind 合作,共同進行一個代號為 Gemini 的新項目,目標是開發(fā)出一個能與 OpenAI的GPT競爭的產(chǎn)品。這似乎在暗示,谷歌對Bard并不自信,希望開發(fā)更領(lǐng)先的AI大模型,打造更先進的AI聊天機器人。
- “流量波動”下的DeepSeek:東南亞機遇顯現(xiàn),但觀望心態(tài)未解
- 英偉達恢復(fù)H20銷售 這杯毒酒中國企業(yè)要不要喝?
- 首席AI官和首席數(shù)據(jù)官,哪個能走到最后?
- 從VTuber到Faceless頻道,AI虛擬角色改寫內(nèi)容創(chuàng)作賺錢邏輯
- 華為聯(lián)發(fā)科專利官司再燃戰(zhàn)火 雙方到底爭的是什么?
- 瑞金醫(yī)院與華為“博士天團”聯(lián)手攻堅 煉就頂級病理大模型并啟動開源
- 投行稱英偉達市值將沖擊6萬億美元 AI之外還有機器人萬億市場
- 中國信通院提出AI WAN目標架構(gòu),運營商IP廣域網(wǎng)價值變現(xiàn)迎契機
- 5G-A,聯(lián)通用AI幫你這么玩兒
- 共建AI時代全球化開發(fā)者生態(tài),華為云持續(xù)加碼海外布局
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。