在信息爆炸的時代,我們面對的選擇越來越多。內容提供商們,比如音樂電臺、視頻流媒體、應用商店等,常常把內容分成不同的類型,以供用戶們選擇。不過,類型常常是一種寬泛的分類,并不能完全滿足用戶個性需求,而且類型區(qū)分過細的話,常常使人無所適從。
在這種情況下,智能推薦開始出現(xiàn)了。得益于計算機技術的進步,內容提供商能夠對用戶的愛好做出更為細致的分析,從而做出更加個性化的推薦。通過對Netflix影片分類的深入分析,以及采訪Netflix產(chǎn)品副總裁,Atlantic網(wǎng)站的Alexis C. Madrigal揭示了Netflix影視推薦背后的真相。
Netflix推薦影片的時候,會給出一個非常細致的類型,或者說是一種“微類型”.Alexis 想要整理出一份完整的微類型列表。由于Netflix的微類型多得離譜,他不得不借助于自動處理軟件。在計算機連續(xù)運作一天之后,他看到了Netflix微類型的數(shù)量:76897個。這些微類型是由一些基本要素構成的,基本語法是這樣:
地區(qū)+形容詞+類型(名詞) +基于……+……為背景+來自……+關于……+從 X 歲到 Y 歲
(Region + Adjectives + Noun Genre + Based On… + Set In… + From the… + About… + For Age X to Y)
當然,有些微類型是不符合上述語法的,比如“有強勢女主角”和“適合無可救藥的浪漫主義者。”
在同事Ian Bogost 的建議下,Alexis還編寫了一個類型生成器,試圖理解Netflix的算法究竟是什么樣子的。不過,他還是感覺沒有看到全貌。于是,他聯(lián)系了Netflix,并見到了公司的產(chǎn)品副總裁Todd Yellin,那個創(chuàng)建了 Netflix 推薦系統(tǒng)的人。
在接受采訪的時候,Todd Yellin說,他早就等著人們來問這個問題了。為所有的電影加上標簽,正是他的主意,而他還自己寫了一張24頁的文檔,講述加標簽的方法。他為早期的一些電影加過標簽,而且主導了整個系統(tǒng)的創(chuàng)建過程。
“我的第一個任務是:把內容撕裂開來!”他說。
2006 年,Yellin組織了十幾個工程師,花費數(shù)月時間編寫一份名為“Netflix 量子理論”的文檔。當時,他把組成影片的基本元素稱作“量子”.如今,他更喜歡“微標簽”的說法,因為現(xiàn)在看來,“量子理論”是一個自命不凡的名字。
這份文檔描述了為影片各種層面加標簽的方法,涉及到影片結尾、主角的“社會接受程度”等等方面。標簽是帶標量的,從1到5,就是說,所有的影片都有一個“浪漫程度”的標示,而不僅僅是那些表明是“浪漫片”的電影。每個電影的結局都有打分,從幸福到悲傷。每個情節(jié)都有標簽。主角的工作有標簽。影片的地點有標簽。
Netflix的工程師以“微標簽”為基礎,創(chuàng)造了一種語法,來生成各種類型。這是一種人工和機器算法的結合。Netflix 的做法,與 Pandora 的音樂基金組計劃有些類似,但是 Netflix 不僅僅展示給你喜歡的內容,還能夠對其進行文字描述。
這些標簽數(shù)據(jù)不僅僅用來生成類型,也用來增加推薦的個性化程度。如果你喜歡動作冒險類電影,并且浪漫程度比較高的,Netflix 可以推薦給你。“我們將對影片中的浪漫程度做出標注。我們不會告訴你它有多浪漫,但是我們會推薦它,”Yellin 說,“你會看到動作場面,里面的浪漫程度如何,那取決于我們對你的了解。”
在采訪結束之前,Alexis 向Yellin展示了一個有趣的圖表。Netflix上最受歡迎的演員排名中,占據(jù)第一名的是Raymond Burr,50 年代電視劇Perry Mason的主演,而占據(jù)第七名的是Barbara Hale,在劇中扮演主演的秘書。為什么這兩個人能夠超過梅麗爾·斯特里普、塞繆爾·杰克遜、尼古拉斯·凱奇和肖恩·康納利?
這是一個謎題。即使是Yellin也搞不懂,為什么他們的名字出現(xiàn)在那么多的“微類型”中。這是無法用邏輯來解釋的問題。
“讓我們做些哲學思考吧。在人類社會中,生命由于意外而變得有趣。”他說,“當你把復雜的東西添加到機器的世界時,你也在添加自己無法想象的意外。Perry Mason就會發(fā)生。這些機器中的鬼魂,經(jīng)常是復雜帶來的副產(chǎn)品。有時候我們稱它為失誤,有時候我們稱之為特色。”
- 康迪科技與云深處科技聯(lián)手進軍北美市場,機器狗能否征服北美市場?
- 攜手共進:奇富科技引領AI安全與人臉識別合規(guī)兩大行業(yè)倡議,共建安全未來
- AI主播遭無理指令操控:風險無處不在,警惕數(shù)字人亂象
- 螞蟻數(shù)科申請香港穩(wěn)定幣牌照,探索數(shù)字金融新篇章
- 奔馳車主崩潰:導航音樂突然失效,車機系統(tǒng)竟崩潰!
- 百萬粉絲博主誠懇道歉:對努比亞手機的侮辱言論深感后悔
- 爆料: 高通驍龍8 Elite 2旗艦價格穩(wěn)定, 驍龍8 Elite 3明年漲價預期大
- iOS 26開發(fā)預覽版翻車:首批嘗鮮者黑屏困擾,體驗遭重擊
- 小米SU7 Ultra圈速再破紀錄,揭開與官方回應的計時差異之謎
- OpenAI GPT-4O模型自保傾向引發(fā)安全風險:警惕未來的AI威脅
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。