A股語料勢力榜

GPT-4初步證明了這一點:只要掌握足夠多的宇宙知識,就能夠還原出足夠深的宇宙邏輯,就能夠成為文明的一脈。

而人類社會繁衍至今,在對客觀世界與顱內(nèi)世界的認(rèn)知、改造的整個過程中,所形成的所有宇宙知識,都以語言文字這個容器所承載。

人類的語言文字,即人類的文明本身。這也正是OPenAI的秘密:以能夠?qū)崿F(xiàn)“語言洛希極限”的算力,基于對腦科學(xué)的模仿,對人類語言文字庫進行建模(Transfomer)計算,最終實現(xiàn)了所謂“智能的涌現(xiàn)”。在對語言文字的計算過程中,語料的價值等級依次展開:1.字:構(gòu)建語言大模型,首先要為每個字賦予獨特且足夠多的向量參數(shù)(理解向量參數(shù),可以顏色為例:字本身是沒有顏色的,但它對應(yīng)的客體在特定狀態(tài)下都是有顏色的,所以需要以特定的向量數(shù)值去標(biāo)記不同顏色的深淺程度);

2.詞:詞的意義在于,當(dāng)多個字構(gòu)成詞以后,一個完整的邏輯就出現(xiàn)了——它必然可以形成一個句子,一個或多個句子可以形成一個完整的垂直領(lǐng)域內(nèi)的邏輯子集。邏輯本身,就是一幅圖——這是為什么語言大模型可以平順的生成圖片的原因。3.邏輯語料:數(shù)學(xué)、物理、化學(xué)、哲學(xué)等等各個基礎(chǔ)學(xué)科的語料內(nèi)容。凡是需要通過N個句子表達的基本宇宙邏輯,最終都將構(gòu)成不同的學(xué)科。而這些學(xué)科內(nèi)的邏輯語料,就是我們說的規(guī)律,即(認(rèn)知)宇宙的基本框架??蚣懿粩嘌诱?,最終無限趨于宇宙本身。

4.輔助語料:邏輯是抽象的、枯燥且晦澀的。需要通過輔助型語料予以潤滑,進而使得計算體(比如人類)在無意識并行計算過程中,能夠建立起彼此間的交互可能性——喜怒哀樂這類淺層次的感情,以及幽默、愛這種深層次感情,都是輔助語料,它們的作用是使不同算力(能力)的計算體,都能在一個參照系內(nèi)形成非歧視的平衡關(guān)系。這類語料,*質(zhì)的即文學(xué)——文學(xué)通過對人性的抽離,實現(xiàn)人體計算的邏輯平權(quán)(人在人性上是平等的)。這也意味著,GPT-4這類機器智能最終如何得以與人類和平共處,需要未來在人與機器之間形成一種可平權(quán)的新型輔助語料體裁。

最近,業(yè)界出現(xiàn)了一個很“新穎”的點:用以訓(xùn)練語言大模型的中文語料不足。以上述4類語料為參照,其中的不足,可能主要在于第3類與第4類。

有基于此,在我們看來,那些握有——或有能力整理出版——第3、4類語料的公司機構(gòu),將在GPT時代,有機會獲得價值中樞的擢升——畢竟ChatGPT、GPT-4更大化的向人類證明了那句名言:書籍是人類進步的階梯。也就是說,無論對機器,還是對人,自此之后,讀書已被確認(rèn)為最核心的生存方式。

有鑒于此,本文將聚焦A股傳媒企業(yè),對各方價值一探究竟。

01出版商—語料價值鏈核心

2021年全球傳媒產(chǎn)業(yè)產(chǎn)值達到2.2萬億美元,同比增長6.5%,高于全球GDP增速5.8%。相較于門戶網(wǎng)站和搜索引擎紛繁復(fù)雜,充斥著虛假信息的數(shù)據(jù)集,傳媒出版行業(yè)的價值躍然紙上。

而出版發(fā)行行業(yè)產(chǎn)業(yè)鏈以出版社為核心,印刷和物資供應(yīng)為產(chǎn)業(yè)基礎(chǔ),通過發(fā)行環(huán)節(jié)實現(xiàn)最終交易。根據(jù)國家新聞出版署出版物種類劃分出版圖書劃分為書籍、課本、圖書和附錄四類,在我國,出版行業(yè)的平均利潤率一般為15%-25%,其中出版環(huán)節(jié)占全行業(yè)利潤額的70%以上。

(1)出版:出版機構(gòu)向上觸達內(nèi)容提供商、印刷商及紙張、油墨供應(yīng)商,圖書出版一般包括申請書號、封面及版式設(shè)計、排版、審校、印刷成書等流程,最后向下連接發(fā)行機構(gòu),整合資源后將核心內(nèi)容呈現(xiàn)給市場。

出版機構(gòu)按照職能可以簡單分為社科類、科技類、大學(xué)類、教育類、古籍類、少兒類、文學(xué)類和美術(shù)類八大類。由于我國出版發(fā)行行業(yè)具有高意識形態(tài)特性,實行出版社許可制度,只有國企單位才具有出版資質(zhì),民營公司只能發(fā)行除教輔外的一般圖書。

(2)發(fā)行:發(fā)行機構(gòu)承接圖書出版之后的工作,主要負(fù)責(zé)將作品上架到發(fā)行渠道進行宣發(fā)售賣的過程,具體包括進貨、倉儲、運輸、銷售、調(diào)劑等基本環(huán)節(jié)。目前中國主流的發(fā)行模式分為兩種:一種是產(chǎn)銷結(jié)合的直接發(fā)行,該種模式下由出版機構(gòu)直接銷售給消費者;另一種為產(chǎn)銷分離的間接發(fā)行,該種模式出版單位通過出版物發(fā)行商將出版物銷售給消費者,因此有些情況下,發(fā)行機構(gòu)與出版機構(gòu)會有重合。

關(guān)于語料價值鏈的認(rèn)知有兩個層面的理解:

縱向來看,無論是任何品牌的機器學(xué)習(xí)模型,對于語料的需求度僅是需求量+1,比如GPT如果學(xué)習(xí)辭海,只需要作為讀者身份買一本書。對于出版商而言,只不過是新增了一位顧客,不會有指數(shù)級的價值增量。

橫向來看,機器的學(xué)習(xí)能力遠(yuǎn)高于人腦,所以橫向接觸語料的光度非常高,對于出版商而言,可供出版的版權(quán)種類和廣度就顯得額外重要。

因此帶著這兩個層面的理解,我們來梳理下A股上市的出版商近況。

02A股語料勢力榜

1、基礎(chǔ)概況

根據(jù)職能的不同,目前中國比較流行三種出版方式,分別是出版社出版、合作出版和自費出版??傮w來看,行業(yè)中市值排名前五分別為鳳凰傳媒、中南傳媒、浙版?zhèn)髅健⒅形膫髅胶蜕綎|傳媒。

2、語料價值

根據(jù)出版圖書類別的不同,各企業(yè)聚焦方向各有不同,但總體主要分布在少兒、社科、教輔教材幾個大類中,其中少兒與教材教輔類別的銷量與我國新出生人口呈現(xiàn)正相關(guān)性,而社科類圖書的銷量則與目前大熱的ChatGPT直接相關(guān)。

行業(yè)市值排名前五的企業(yè)出版圖書構(gòu)成情況如下:

因此從數(shù)據(jù)上來看,中文傳媒的一般圖書(社科、文學(xué))比重最高,根據(jù)開卷網(wǎng)的信息,2021年出版集團層面實洋占有率排名前三的分別是中國出版,鳳凰傳媒和中文傳媒。

除此之外,ROIC(投入資本回報率)也能體現(xiàn)出版企業(yè)的語料價值,出版商的盈利模式是在獲取版權(quán)后,盡可能的獲取長尾收益。因此高價值的版權(quán)長期回報率更高,代表語料價值也更高。我們可以看到,內(nèi)蒙新華、新華文軒和鳳凰傳媒的ROIC排名前三。

另外無形資產(chǎn)也是版權(quán)價值具象化的體現(xiàn)之一,目前南方傳媒的無形資產(chǎn)超過了30億元,高于同營收水平的其他企業(yè),具體到構(gòu)成上,南方傳媒的無形資產(chǎn)主要為土地使用權(quán),知識產(chǎn)權(quán)價值并不高。

3、盈利能力

A股出版企業(yè)營收橫向?qū)Ρ龋心蟼髅綘I收最高,為126.17億元,營收增速為8.20%。但從收入構(gòu)成來看,出版類別的實際收入中南傳媒為32.73億元,排名第二,出版業(yè)務(wù)收入最高的為中國出版44.69億元。

毛利率在一定程度上能夠反映企業(yè)核心盈利能力和在產(chǎn)業(yè)鏈中的價值,出版作為產(chǎn)業(yè)鏈中的核心環(huán)節(jié),行業(yè)多數(shù)企業(yè)毛利率較為平均,分布在30%-45的區(qū)間內(nèi)。其中中文在線因為主營業(yè)務(wù)為線上出版發(fā)行,所以毛利率達到70.85%,為行業(yè)最高。

4、研發(fā)能力

再來看出版企業(yè)的研發(fā)支出,研發(fā)投入排名前三的分別為中文傳媒、中文在線和中南傳媒,分別為2.38億元、1.15億元和0.63億元。其中中文在線研發(fā)支出占收入比重居行業(yè)首位,為9.68%。

5、流動性

經(jīng)營性現(xiàn)金流方面,行業(yè)整體成熟度較高,所以行業(yè)整體近三年經(jīng)營性現(xiàn)金流入水平較為穩(wěn)定,其中以鳳凰傳媒、山東出版、新華文軒現(xiàn)金流入規(guī)模*,分別為33.21億元、25.57億元及20.47億元。

財務(wù)綜合表現(xiàn)端,中南傳媒是行業(yè)中的佼佼者,無論是代表企業(yè)整體盈利能力的毛利率方面表現(xiàn),還是研發(fā)投入的持續(xù)性,亦或是無形資產(chǎn)儲備以及營收增速方面都名列前茅;從成長性角度來看,在具備一定規(guī)模的基礎(chǔ)上,時代出版成長性表現(xiàn)可圈可點,其同等營收水平的公司里,擁有較高的研發(fā)投入與無形資產(chǎn)儲備,另外其流動性也較強,具備更高的抗風(fēng)險能力。

具體到與ChatGPT的聯(lián)動方面,如果考慮機器學(xué)習(xí)橫向增長大于縱向增長,結(jié)合市值中文傳媒的潛在增長空間較大,因為營收種類中一般圖書占比*,其次實洋也排名前三。除此之外,鳳凰傳媒和中國出版的實洋占比也比較高。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-04-06
A股語料勢力榜
A股語料勢力榜

長按掃碼 閱讀全文