AI手機(jī)重大突破?!湖南這家公司把視覺(jué)大模型塞進(jìn)了端側(cè)

文 | 智能相對(duì)論

作者 | 陳泊丞

在DeepSeek爆火之后,各行各業(yè)對(duì)AI大模型的應(yīng)用與部署明顯加快。在這個(gè)過(guò)程中,端側(cè)AI模型的價(jià)值逐步被發(fā)掘,憑借低時(shí)延、實(shí)時(shí)處理、安全可靠以及成本優(yōu)化等特性備受市場(chǎng)重視,成為業(yè)內(nèi)探索AI大模型應(yīng)用的一個(gè)重要方向。

以智能手機(jī)行業(yè)為例,蘋果、小米、OPPO等終端廠商都在積極探索端側(cè)AI模型在智能終端上的部署和應(yīng)用,以提升智能終端的體驗(yàn)。但是,由于移動(dòng)設(shè)備的計(jì)算能力和存儲(chǔ)空間有限,如何在保證模型性能的同時(shí)減小模型體積,并成功部署在移動(dòng)端是一個(gè)關(guān)鍵問(wèn)題。

直到今天,這一問(wèn)題正在被湖南的一家科技公司破解。湖南匯視威發(fā)布基于國(guó)產(chǎn)算力預(yù)訓(xùn)練的視覺(jué)基座大模型V1端側(cè)版本,成功滿足了視覺(jué)模型在移動(dòng)端(如手機(jī)、電腦等)上的部署和推理需求,實(shí)現(xiàn)輕量級(jí)文生圖功能體驗(yàn)。

繼DeepSeek之后,又一國(guó)產(chǎn)模型迎來(lái)新突破,并很有可能在端側(cè)革新AI模型的應(yīng)用范式。這在技術(shù)層面和商業(yè)層面都有著特別的意義。

端側(cè)視覺(jué)模型照進(jìn)現(xiàn)實(shí),補(bǔ)上云端AI的短板

即使在DeepSeek火爆的基礎(chǔ)上,廠商們依然致力于探索和優(yōu)化端側(cè)AI模型的部署與應(yīng)用。通過(guò)湖南匯視威的視覺(jué)基座大模型V1端側(cè)版本可見(jiàn),端側(cè)模型在實(shí)際應(yīng)用中所展現(xiàn)出來(lái)的優(yōu)勢(shì)正好彌補(bǔ)上了云端AI的短板。

一、擺脫云端算力限制,具備更低的時(shí)延和更強(qiáng)的場(chǎng)景適配性。端側(cè)AI模型可以直接在用戶的移動(dòng)端實(shí)現(xiàn)本地運(yùn)行,無(wú)須依賴云端傳輸。湖南匯視威的視覺(jué)基座大模型V1端側(cè)版本不僅能顯著降低時(shí)延,快速響應(yīng)用戶的創(chuàng)作需求,還支持離線場(chǎng)景使用,哪怕是在偏遠(yuǎn)地區(qū)或是網(wǎng)絡(luò)不穩(wěn)定場(chǎng)景也能保障體驗(yàn),讓用戶隨時(shí)隨地體驗(yàn)輕量級(jí)的視覺(jué)文生圖手機(jī)應(yīng)用。

基于本地化運(yùn)行,端側(cè)模型對(duì)比云端方案更穩(wěn)定可靠。由此,B端的企業(yè)和開(kāi)發(fā)者就可以基于湖南匯視威的視覺(jué)基座大模型打造自己的專屬AI產(chǎn)品,如虛擬試衣等,不僅可以基于端側(cè)部署提供更優(yōu)質(zhì)的體驗(yàn),還能顯著降低視覺(jué)大模型邊端推理成本,從而實(shí)現(xiàn)更優(yōu)的商業(yè)回饋。

二、隱私安全保護(hù)進(jìn)階,真正實(shí)現(xiàn)“數(shù)據(jù)不出域”。基于本地化運(yùn)行模式,端側(cè)AI模型直接處理本地?cái)?shù)據(jù),避免將生成的圖片數(shù)據(jù)共享在云端,提升了用戶數(shù)據(jù)的隱私保護(hù)性,也將顯著降低數(shù)據(jù)泄漏風(fēng)險(xiǎn)。

三、推動(dòng)邊緣智能普及,加速AI普惠。湖南匯視威的視覺(jué)基座大模型V1端側(cè)版本通過(guò)實(shí)現(xiàn)輕量級(jí)的視覺(jué)文生圖手機(jī)應(yīng)用,有利于進(jìn)一步提升手機(jī)端AI的用戶滲透率和場(chǎng)景滲透率,并在企業(yè)和開(kāi)發(fā)者的二次開(kāi)發(fā)下讓越來(lái)越多的用戶用上安全可靠的、低成本文生圖功能。

隨著這種端側(cè)部署模式推廣開(kāi)來(lái),更多的邊緣智能如電腦、可穿戴終端等都將迎來(lái)新一輪的產(chǎn)品功能變革,釋放更多的AI紅利,讓更多的人接觸到AI,享受AI。

又一次國(guó)產(chǎn)重大突破,湖南把視覺(jué)大模型塞進(jìn)了端側(cè)

雖說(shuō)端側(cè)模型方案被視為是接下來(lái)智能進(jìn)階、實(shí)現(xiàn)邊緣智能的關(guān)鍵,但是很長(zhǎng)一段時(shí)間內(nèi),云端AI方案占據(jù)主流。究其原因,在于AI模型的端側(cè)部署考慮到模型性能、模型參數(shù)以及移動(dòng)終端的算力局限、本地存儲(chǔ)局限等一系列問(wèn)題,在實(shí)際落地上存在較為嚴(yán)苛的要求。

湖南匯視威基于國(guó)產(chǎn)算力預(yù)訓(xùn)練的視覺(jué)基座大模型V1端側(cè)版本是國(guó)內(nèi)相關(guān)領(lǐng)域的首個(gè)突破項(xiàng)目,尤其是在國(guó)產(chǎn)算力和端側(cè)AI領(lǐng)域。面向特定領(lǐng)域從0到1的技術(shù)攻關(guān),背后的難度可想而知,而具體聚焦國(guó)產(chǎn)算力、模型蒸餾以及性能保障三個(gè)方面,我們或許更能體會(huì)到這一項(xiàng)目落地的嚴(yán)苛與高標(biāo)準(zhǔn)。

這或?qū)⒊蔀閲?guó)產(chǎn)端側(cè)模型進(jìn)一步擴(kuò)大發(fā)展的關(guān)鍵起點(diǎn),湖南匯視威基于國(guó)產(chǎn)算力預(yù)訓(xùn)練的視覺(jué)基座大模型V1端側(cè)版本為行業(yè)帶來(lái)了三個(gè)亮點(diǎn)。

一、國(guó)產(chǎn)路徑。本次項(xiàng)目基于中科曙光國(guó)產(chǎn)算力在4千多萬(wàn)張圖片上從0到1搭建視覺(jué)基座大模型并完成預(yù)訓(xùn)練。這也就意味著,其底層計(jì)算資源已經(jīng)開(kāi)始傾向于國(guó)產(chǎn)化路徑,打破了此前AI領(lǐng)域高度依賴國(guó)外算力的單一局面,不只是端側(cè)模型的部署,更為國(guó)產(chǎn)模型的發(fā)展提供了更多的可能性。

二、極限蒸餾。此前,視覺(jué)大模型多采用云端方案,能真正實(shí)現(xiàn)端側(cè)部署的在國(guó)內(nèi)還是首次。在這方面,湖南匯視威設(shè)計(jì)了跨模型結(jié)構(gòu)極限蒸餾技術(shù),將基座大模型和 8.1B大模型進(jìn)行混合蒸餾,保證在最小性能損失下,得到了0.4B的輕量化模型,讓視覺(jué)模型具備了在端側(cè)部署的可能,填補(bǔ)了國(guó)產(chǎn)端側(cè)視覺(jué)模型的技術(shù)空白。

三、性能在線。盡管是0.4B的端側(cè)模型,但是在相關(guān)的文生圖測(cè)試上依舊可以媲美8.1B的通用大模型。據(jù)了解,湖南匯視威的視覺(jué)基座大模型V1端側(cè)版本在移動(dòng)端文生圖體驗(yàn)處于國(guó)內(nèi)第一梯隊(duì),在安卓和IOS端均可以做到秒級(jí)生成一張圖片,成功突破移動(dòng)端生成高分辨力圖像的能力,生成圖像分辨率可達(dá)1024?1024。

秒級(jí)圖像生成能力意味著用戶可以在手機(jī)上直接完成高質(zhì)量圖像AI創(chuàng)作,并支持離線場(chǎng)景。這對(duì)攝影、設(shè)計(jì)、娛樂(lè)等場(chǎng)景的用戶體驗(yàn)具有革命性意義,湖南匯視威的視覺(jué)基座大模型V1端側(cè)版本通過(guò)端側(cè)部署解決隱私、延遲等問(wèn)題的同時(shí),還能保障性能在線,將進(jìn)一步加速端側(cè)AI在智能終端的爆發(fā),打造全新的端側(cè)AI生態(tài)。

寫在最后

本次項(xiàng)目的突破充分證實(shí)了一點(diǎn):小模型,也有大作為;國(guó)產(chǎn)化,開(kāi)拓新局面。不管是在國(guó)產(chǎn)算力層面還是在端側(cè)AI層面,湖南的這次突破作為行業(yè)標(biāo)桿將推動(dòng)更多的國(guó)產(chǎn)AI技術(shù)走向成熟,并可能催生更多的端側(cè)AI商業(yè)生態(tài)。

那么,對(duì)于用戶而言,更高效、更安全、更可靠的本地化AI體驗(yàn)即將到來(lái),未來(lái)在更多的智能終端上,我們將可以無(wú)懼網(wǎng)絡(luò)、算力等諸多嚴(yán)苛要求一鍵開(kāi)啟AI創(chuàng)作體驗(yàn)。而對(duì)于行業(yè)而言,這是國(guó)產(chǎn)化路徑和端側(cè)AI技術(shù)突破的重要里程碑,新的行業(yè)發(fā)展范式將持續(xù)革新AI產(chǎn)品形態(tài),創(chuàng)造更多的可能。

*本文圖片均來(lái)源于網(wǎng)絡(luò)

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2025-05-22
AI手機(jī)重大突破?!湖南這家公司把視覺(jué)大模型塞進(jìn)了端側(cè)
文 | 智能相對(duì)論作者 | 陳泊丞在DeepSeek爆火之后,各行各業(yè)對(duì)AI大模型的應(yīng)用與部署明顯加快。在這個(gè)過(guò)程中,端側(cè)AI模型的價(jià)值逐步被發(fā)...

長(zhǎng)按掃碼 閱讀全文