隨著人工智能與各個行業(yè)的加速融合,如何快速、高效地進行算法開發(fā)已經(jīng)成為AI行業(yè)落地的驅(qū)動力。一直以來,無論是學術界的研究者、需求AI技術的企業(yè)、個人AI開發(fā)者還是在校學生,都為開發(fā)和應用人工智能算法付出大量冗余的時間、資源和成本。2020年3月,曠視科技開源了在內(nèi)部工程實踐超過 6 年的深度學習框架天元(MegEngine),助力開發(fā)者實現(xiàn)深度學習,簡單開發(fā)。
我們期望通過此次大賽,鼓勵參賽者借助天元深度學習框架實現(xiàn)算法創(chuàng)新,匯聚才智,為現(xiàn)實問題尋找最優(yōu)解決方案。
視頻是當前網(wǎng)絡媒體主要形式,也是網(wǎng)絡帶寬資源的主要消耗者。新冠疫情帶來的對網(wǎng)絡直播、在線教育等在線業(yè)務的需求增長,其核心也是如何高效進行視頻的傳輸以及高質(zhì)量的進行視頻呈現(xiàn)。
現(xiàn)實環(huán)境中,視頻質(zhì)量會受到網(wǎng)絡帶寬資源的制約。通過視頻壓縮技術,我們可以使視頻能以較小的網(wǎng)絡帶寬消耗進行傳輸,但我們也希望傳輸后的壓縮視頻能盡可能的恢復到原有的畫面質(zhì)量。因此,壓縮視頻的畫面質(zhì)量恢復對于改善在網(wǎng)絡帶寬受限環(huán)境或者高分辨率顯示設備上的視頻觀看體驗有現(xiàn)實的價值和積極的作用。
在此背景下,我們希望通過此次大賽,鼓勵高校科研人員、學生、初創(chuàng)企業(yè)以及企業(yè)人工智能算法工程和開發(fā)者利用深度學習技術,挑戰(zhàn)壓縮圖像的畫面質(zhì)量恢復任務,探索基于深度學習的視頻質(zhì)量提升的上限。
本次比賽的任務為視頻超分辨率。比賽中,參賽團隊通過訓練深度學習模型,針對給定的被降分辨率并壓縮后的視頻,盡可能保真的恢復壓縮前的視頻。
本次比賽提供的所有待恢復視頻都是由原視頻進行了4倍的下采樣以及重新編碼后的結(jié)果,比賽要求參賽團隊提交對測試視頻恢復后的結(jié)果。
本次比賽中,主辦方提供訓練集,請見 這里 。
對于訓練集中的數(shù)據(jù),有對應的原視頻和壓縮后的視頻;對于測試集中的數(shù)據(jù),只有壓縮后的視頻。為方便起見,訓練集以mp4和png的格式提供,測試集以png圖片序列的方式提供。您可在比賽關聯(lián)的MegStudio項目的./dataset/game1/train_png/目錄找到數(shù)據(jù)集,也可在 這里 下載訓練集。
對于部分解碼軟件,訓練集視頻解碼的結(jié)果可能是不一樣的(甚至總幀數(shù)都會不一樣),主辦方提供的基線方法將展示一個用以參考的解碼方法。同時,您也可以直接用png格式的訓練集進行訓練,避免出現(xiàn)幀數(shù)不同的問題。
對于測試集中的圖片序列,以tar包的形式提供,即,對于一個圖片序列文件test.tar,里面按視頻幀的順序存儲了所有的圖片文件,圖片文件的格式都是png。
訓練框架:本次比賽要求使用開源的曠視天元深度學習框架MegEngine做為模型訓練的框架,關于MegEngine的信息和參考資料請訪問 天元官網(wǎng)
訓練數(shù)據(jù):參賽者應當只使用提供的數(shù)據(jù)作為訓練的數(shù)據(jù),在訓練和測試的過程中不得使用其他來源的視頻或者圖片。
參賽提交:本次競賽要求選手將測試視頻的恢復結(jié)果以tar包的格式提交,里面按視頻幀的順序存儲了所有的結(jié)果圖片文件,文件名以及文件夾結(jié)構和測試輸入的tar內(nèi)的文件名以及文件夾結(jié)構保持相同。結(jié)果圖片的尺寸應當剛好是測試輸入圖片尺寸的4倍(也就是,對于h x w的輸入,應當輸出4h x 4w的結(jié)果)。
比賽期間,參賽團隊每24小時可在比賽平臺上進行一次有效提交。(所謂有效提交,指格式正確、可產(chǎn)生測評分數(shù)的提交。)
代碼審核:本次競賽主辦方有權要求所有進入決賽的參賽者提交源代碼供審查。確認參賽者工作的獨創(chuàng)性和以及是否符合其他比賽要求,審查不通過者,取消名次。
MegStudio比賽模塊 為此次比賽參賽平臺,參賽團隊需要在此平臺上完成報名,組隊、提交等比賽任務。同時比賽相關數(shù)據(jù)、腳本和其他相關資源也會通過此平臺提供。
本次比賽曠視為參賽團隊提供MegStudio作為算力平臺,供有需要的參賽選手選用。
在MegStudio提供的30小時GPU算力基礎上,在參賽期間每支團隊從第二次提交開始,每完成一次提交且得分較前一次提交有提高的,團隊可以再申請50小時GPU算力。在需求合理的前提下,每支團隊初賽階段最多可以申請三次,決賽階段不受次數(shù)限制。
MegStudio的詳細信息,請訪問 MegStudio
本次競賽采用Peak Signal to Noise Ratio(PSNR)指標作為評價指標。
參賽選手提交的結(jié)果將與原視頻進行比較,計算所有輸出像素的誤差的平方的平均,并換算為PSNR值。PSNR越大的方法的排名越靠前。
主辦方將提供基線方法和驗證腳本,幫助選手在線下測試模型效果。基線方法、驗證腳本以及詳細使用方法,將與數(shù)據(jù)集同時發(fā)布。
大賽面向全社會開放,個人、高等院校、科研單位、企業(yè)、創(chuàng)客團隊等人員均可報名參賽。
大賽組織單位賽題組相關人員禁止參賽。
報名方法:
報名開始時間:2020年8月10日(UTC+8)。
截止報名及組隊變更時間:2020年8月31日(UTC+8)。
選手可單人成隊或組隊參賽,每位選手只能加入一支隊伍,每支參賽團隊最多不超過5個人。
報名方式:登錄比賽指定平臺,完成個人信息注冊,提交相關材料即可報名參賽。
選手需確保報名信息準確有效,主辦方有權取消不符合條件隊伍的參賽資格及獎勵。
比賽設初賽和決賽兩個階段:
初賽時間為2020年9月1日00:01(UTC+8) 到2020年9月14日23:59(UTC+8)。初賽采用大賽提供測試數(shù)據(jù)集作為測試數(shù)據(jù)進行評分,比賽期間參賽團隊可多次提交,以團隊在初賽階段取得的最佳成績做為初賽最終得分,初賽團隊成績最高的前十支團隊進入決賽。
決賽時間為2020年9月16日00:01(UTC+8) 到2020年9月24日23:59(UTC+8)。決賽采用大賽提供測試數(shù)據(jù)集作為測試數(shù)據(jù)進行評分,以團隊在決賽階段取得的最佳成績最為決賽最終得分,決賽以團隊最終得分高低進行排名和獎項評比。
大賽設置如下獎項:
第一名:團隊獎金人民幣5萬
第二名:團隊獎金人民幣2萬
第三名:團隊獎金人民幣1萬
第四到十名:團隊獎金人民幣1千
(所有獎金額為稅前獎金額)
參與獎:所有參加初賽,并且提交了有效結(jié)果的團隊,紀念T-Shirt衫
大賽前三名團隊的成員將獲得曠視校招面試直通卡,在曠視招聘中直接進入面試環(huán)節(jié)
郵箱:比賽支持郵箱為: mgesupport@megvii.com 比賽全程如有任何問題或者需要幫忙可以通過此郵箱聯(lián)系我們。我們也會通過這個郵箱向你發(fā)送比賽相關信息,敬請關注
討論區(qū):歡迎在MegEngine社區(qū)為比賽設立的 討論區(qū) 中討論大賽相關事宜
關于MegEngine的討論,大家可以加入“天元開發(fā)者交流群”(QQ群號:1029741705)
使用手機QQ掃碼加入QQ群: