日前,由搜狗搜索聯(lián)合中國中文信息學(xué)會(CIPS)共同舉辦的“CIPS-SOGOU問答比賽”正式啟動報名。作為國內(nèi)首檔基于大規(guī)模真實用戶問答數(shù)據(jù)集的問答評測任務(wù),此次大賽的舉辦,不僅能為參賽者提供挑戰(zhàn)及展示能力的舞臺,還將促進(jìn)學(xué)術(shù)界及業(yè)界在智能問答領(lǐng)域的研究發(fā)展,推動智能問答系統(tǒng)更加廣泛地面向公眾提供信息服務(wù)。
此次問答比賽分為事實型問答和非事實型問答兩項子任務(wù)。按照賽制,參賽者需要根據(jù)給定的問題設(shè)計算法,從候選篇章中抽取合適的詞語、短語或句子,作為問題的標(biāo)準(zhǔn)答案,能夠?qū)崿F(xiàn)正確、完整、簡潔地回答問題。每個問題對應(yīng)給出10個候選答案篇章,每個篇章約50 - 500個漢字。
在評測指標(biāo)方面,事實型問答子任務(wù)將采用Accuracy和Precision-Recall(F1)指標(biāo)對預(yù)測答案進(jìn)行評價,其中Accuracy計算預(yù)測答案和標(biāo)準(zhǔn)答案是否精確匹配,F(xiàn)1計算預(yù)測答案相對標(biāo)準(zhǔn)答案的詞級重合度,以兩者平均值作為最終指標(biāo)。非事實型問答子任務(wù)采用ROUGE和BLEU指標(biāo)對預(yù)測答案進(jìn)行綜合評價。
據(jù)悉,此次比賽的事實型問答子任務(wù),將從9月1日起開始提交報名,有興趣參賽的高校生、業(yè)內(nèi)研究人員等,可通過“搜狗實驗室”官網(wǎng)提交報名信息。非事實型問答子任務(wù),則將在12月中旬開始接受提交報名,并陸續(xù)公布比賽數(shù)據(jù)集和Leaderboard。在2018年CIPS的學(xué)術(shù)年會上,將會對兩項子任務(wù)中勝出的團(tuán)隊進(jìn)行頒獎。
值得一提的是,作為聯(lián)合主辦方的搜狗搜索,將向大賽提供來自搜索引擎的大規(guī)模真實用戶問答數(shù)據(jù)集。其中,6萬個問題(事實型問題3萬、非事實型問題3萬),代表了最真實廣泛的網(wǎng)民信息需求;60萬對應(yīng)問題的候選篇章,來自搜索引擎返回的若干互聯(lián)網(wǎng)頁面;而經(jīng)過對頁面進(jìn)行人工分析標(biāo)注,搜狗搜索構(gòu)建了針對問題的標(biāo)準(zhǔn)答案,最終形成大規(guī)模、極具價值的問答數(shù)據(jù)集。
據(jù)了解,目前在智能問答研究領(lǐng)域,可用的大規(guī)模公開數(shù)據(jù)集,尤其是反映真實用戶問答需求的中文數(shù)據(jù)集非常稀缺。業(yè)界和學(xué)術(shù)界受限于技術(shù)、數(shù)據(jù)等因素,當(dāng)前的研究主要針對“事實型問答”領(lǐng)域,而在與用戶搜索場景息息相關(guān)的“開放域智能問答”領(lǐng)域則一直無法取得突破性進(jìn)展。搜狗搜索此次公開的大規(guī)模數(shù)據(jù)集,不僅能促進(jìn)“CIPS-SOGOU問答比賽”的正常開展,還能將給整個智能問答行業(yè)的研究發(fā)展提供寶貴的數(shù)據(jù)支撐,從而推動智能問答系統(tǒng)更加廣泛地面向公眾提供信息服務(wù)。
事實上,憑借在人工智能領(lǐng)域的持續(xù)投入及搜索引擎的數(shù)據(jù)優(yōu)勢,搜狗搜索目前在智能問答領(lǐng)域已處于行業(yè)領(lǐng)先地位。搜狗搜索此前已上線的“立知”智能問答系統(tǒng),就是搜狗研發(fā)的面向未來的搜索技術(shù)。該系統(tǒng)能夠理解用戶搜索意圖和問題,直接為用戶提供想要的答案。目前“立知”智能問答系統(tǒng)不僅能精準(zhǔn)回答事實性問題,在分析類問題、觀點類問題、數(shù)字類問題、隱式問題等方面,都能直接返回精確答案,背后應(yīng)用了語義分析、問題理解、信息抽取、知識圖譜、信息檢索、深度學(xué)習(xí)等眾多人工智能技術(shù)。
作為智能問答領(lǐng)域的引領(lǐng)者,搜狗搜索在切實推進(jìn)產(chǎn)品落地、為用戶帶來優(yōu)質(zhì)搜索體驗的同時,也注重向行業(yè)開放問答能力,不斷推動業(yè)界及學(xué)術(shù)界的研究發(fā)展。今年4月份,搜狗搜索曾聯(lián)合CCIR 2017(2017全國信息檢索學(xué)術(shù)會議)成功舉辦了國內(nèi)首次大規(guī)模真實用戶問答數(shù)據(jù)集上的問答評測任務(wù)——首屆“面向智能問答的篇章排序”評測比賽,并公開了來自用戶真實搜索需求的5萬個問題以及從搜狗搜索全網(wǎng)檢索結(jié)果提供的50萬條候選篇章,極大促進(jìn)了智能問答技術(shù)的發(fā)展和應(yīng)用。
相比“面向智能問答的篇章排序”評測比賽,此次“CIPS-SOGOU問答比賽”的賽制、公開數(shù)據(jù)集等都將進(jìn)行全新升級,將會在更大程度上促進(jìn)智能問答領(lǐng)域的學(xué)術(shù)交流和研究水平。對此次問答評測比賽感興趣的高校生或業(yè)內(nèi)從業(yè)者,均可報名參加。
- 三星尋求與中國企業(yè)合作,共謀OLED面板降成本之道,打造行業(yè)新引擎
- 曹操出行港交所即將上市:六家巨頭投資9.5億港元,共享出行未來正式起航
- 特斯拉自動駕駛在瑞典受阻:斯德哥爾摩拒絕其測試申請,技術(shù)爭議再起波瀾
- 阿里巴巴新架構(gòu)助力蘋果,為AI入華鋪路:Qwen3升級版引領(lǐng)新潮流
- 廣汽埃安辟謠:員工股權(quán)風(fēng)波并非謠言,正等待真相大白
- 蘋果未進(jìn)全球收入前3榜單,中國公司強(qiáng)勢上榜:巨頭時代的新篇章
- 蘋果因《數(shù)字市場法案》風(fēng)險擔(dān)憂,或限制iPhone鏡像功能:小心駛過法規(guī)深海
- Meta AI應(yīng)用新提醒:隱私安全別忽視,分享信息需謹(jǐn)慎
- 谷歌被曝用ChatGPT訓(xùn)練新模型遭質(zhì)疑,Scale AI回應(yīng)引爭議
- TP-Link芯片部門裁員風(fēng)波:疑業(yè)績下滑背后揭秘
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。