近期,由阿里巴巴“圖像和美”團隊聯(lián)合華南理工大學共同舉辦ICPR MTWI (Multi-Type Web Image)2018 挑戰(zhàn)賽正式開啟,并開放業(yè)內(nèi)第一個基于網(wǎng)絡圖片的中英混合數(shù)據(jù)集——MTWI數(shù)據(jù)集。大賽聚焦OCR領域相關實用知識點的突破與解決,旨在與全球AI科研人才一起共同推動OCR在工業(yè)界的應用和發(fā)展。
互聯(lián)網(wǎng)世界中,圖片是傳遞信息的重要媒介。特別是電子商務、社交、搜索等領域,每天都有數(shù)以億兆級別的圖像在流動傳播?;谏疃葘W習的圖片文字識別(OCR)技術正飛速發(fā)展,并深刻影響著信息的交互和傳遞方式,乃至改變相關行業(yè)的生產(chǎn)方式。而在學術領域,圖片中的文字識別(OCR)同樣也是研究重點,但目前業(yè)內(nèi)依舊缺少基于網(wǎng)絡圖片的、以中文為主的OCR數(shù)據(jù)集。
本次大賽發(fā)布的MTWI數(shù)據(jù)集來源于真實網(wǎng)絡場景,以“來源于實踐,且高于實踐”為構建理念,既考慮到學術價值同時也兼顧工業(yè)適用性。
不同于純文檔圖片和場景文字圖片,MTWI數(shù)據(jù)集中的圖片多為作者設計或者二次加工所得。整體上看,這類圖片不僅包含部分場景圖片和文檔圖片,更多的是在這些圖片基礎上添加設計好的文字而成的新圖片。
左一:空心字,切斷字,中英混排;左二:封面印刷文字,離散單字,重疊字;左三:實拍,自然場景,藝術文字;左四:大字中鑲嵌小字,不同字號混排
從數(shù)據(jù)場景上看,本數(shù)據(jù)集涵蓋了數(shù)碼合成、物體表面、封面類印刷的中英文以及少量日文、韓文等類型的文字。而從文字版式上來看,包含了各種字體類型的單字、橫排、豎排、傾斜排列、曲線排列、復雜混排(不同字號、不同字體、不同字間距的混合排布)等。
因此,本次大賽發(fā)布的數(shù)據(jù)集既有圖片文字識別的共性也有本身的特性,突出覆蓋前沿技術尚未解決或者遺漏的樣例,并基于OCR領域乃至計算機視覺領域的前沿指標,設置文本檢測,文本行識別,端到端的整圖文字識別三個層次的賽題,對相關技術點的解決以及在工業(yè)領域的信息數(shù)字化應用將具有直接的推動作用。
本次ICPR MTWI 2018 挑戰(zhàn)賽基于天池數(shù)據(jù)眾智平臺,目前已開啟報名通道,吸引了來自國內(nèi)外2000余支隊伍報名參賽,其中不乏OCR研究領域的知名院校團隊。賽事組委會將在2018年6月1日評出獲獎名單,并于ICPR2018大會期間在北京進行頒獎。
關于主辦團隊:
阿里巴巴“圖像和美“團隊是阿里巴巴從事圖像技術歷史最悠久的團隊,在OCR領域,多年來不斷整合前沿技術和行業(yè)經(jīng)驗,打磨出了能夠承載跨行業(yè)應用的技術架構,形成了完備的圖像文字定位、識別和理解的人工智能技術體系。目前已在阿里巴巴集團內(nèi)部的圖片管控,搜索,智能審核等領域扮演重要角色,并推出“讀光”OCR云產(chǎn)品,包括文檔圖片,網(wǎng)絡圖片,表格圖片和卡證照圖片的文字識別服務,正致力于為政務、司法以及金融等行業(yè)提供安全高效的OCR解決方案。
- 京東螞蟻競相追逐:加密貨幣新寵——穩(wěn)定幣揭秘
- 蘋果首款折疊屏iPhone驚現(xiàn):顛覆傳統(tǒng),與華為Pura X有異曲同工之妙
- 2025Q1全球車用網(wǎng)絡設備出貨量增長,數(shù)字化轉(zhuǎn)型助力汽車行業(yè)新篇章
- 谷歌Pixel 7系列手機在日本遭專利侵權禁售,銷售前景堪憂
- 賽力斯汽車嚴正聲明:虛假信息傳播者將承擔法律責任
- 寶馬應對環(huán)保法規(guī):內(nèi)燃機研發(fā)與創(chuàng)新燃料并舉,破局環(huán)保與動力之爭
- B站COO李旎揭秘:年輕用戶熱衷公益,超百萬用戶捐款,9成年齡在30歲以下
- HDMI 2.2新規(guī)格震撼發(fā)布:帶寬翻倍至96Gbps,未來視界一觸即達
- Windows 11啟動聲音Bug:Beta版修復進展,Dev版用戶仍遭遇Vista音效挑戰(zhàn)
- 小米汽車創(chuàng)紀錄:三分鐘賣空全年銷量,雷軍再為車圈帶來驚喜
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。