近日,大華股份基于深度學(xué)習算法的圖像語(yǔ)義分割技術(shù),刷新了KITTI語(yǔ)義分割競賽(The KITTI Semantic Segmentation Evaluation)全球最好成績(jì),取得語(yǔ)義分割排行榜第一名,超越其他一流AI公司和頂尖的學(xué)術(shù)研究機構,這標志著(zhù)大華股份在語(yǔ)義分割領(lǐng)域處于領(lǐng)先水平。
大華股份DH-MDS算法取得KITTI Semantic Segmentation排行榜第一名
(網(wǎng)址: www.cvlibs.net/datasets/kitti/eval_semseg.php)
大華股份已建成用于算法訓練的超大規模計算中心和數據中心,重點(diǎn)研究并商用化多個(gè)領(lǐng)域算法,已形成核心競爭力。2017年大華股份在場(chǎng)景流、光流和文字識別檢測等領(lǐng)域分別取得第一;2018年在2D車(chē)輛目標檢測、MOT跟蹤、行人重識別等國際競賽中分別取得第一;2019年初,在實(shí)例分割國際競賽中取得第一。本次在語(yǔ)義分割算法領(lǐng)域再次取得新突破。
關(guān)于KITTI:
KITTI數據集由德國卡爾斯魯厄理工學(xué)院和豐田美國技術(shù)研究院聯(lián)合創(chuàng )辦,是目前國際上最大的計算機視覺(jué)算法評測數據集之一。數據集用于評測立體圖像(Stereo)、光流(Optical Flow)、視覺(jué)測距(Visual Odometry)、物體檢測(Object Detection)和跟蹤(Tracking)、道路分割(Road)、語(yǔ)義分割(Semantics)等計算機視覺(jué)技術(shù)在車(chē)載環(huán)境下的性能。KITTI包含市區、鄉村和高速公路等場(chǎng)景采集的真實(shí)圖像數據,每張圖像中最多包含15輛車(chē)和30個(gè)行人,且存在不同程度的遮擋與截斷。
語(yǔ)義分割:
語(yǔ)義分割是指將計算機輸入圖像的每個(gè)像素分類(lèi)為所屬對象類(lèi)別的過(guò)程。它不僅是計算機視覺(jué)的基本任務(wù),同時(shí)在自動(dòng)駕駛、機器人場(chǎng)景理解以及虛擬現實(shí)方面有著(zhù)非常重要的應用。
在KITTI語(yǔ)義分割任務(wù)中,需要把各種場(chǎng)景下的汽車(chē)、行人、道路、摩托車(chē)、自行車(chē)、交通標志、建筑物和植被等19類(lèi)物體準確分割出來(lái)。同時(shí),訓練集只提供200張數據,屬于小樣本學(xué)習。
本次國際比賽,大華股份為提升語(yǔ)義分割精度,汲取了圖像分類(lèi)、單目標分割和全像素語(yǔ)義分割等先進(jìn)算法的優(yōu)點(diǎn),構建了基于多位置和通道特征的全局關(guān)注機制,并采用遷移學(xué)習和增量學(xué)習方法,有效提升了算法的分割精度。
該競賽語(yǔ)義分割效果:
在大華實(shí)際產(chǎn)品和未來(lái)產(chǎn)品中的應用
車(chē)道線(xiàn)分割
車(chē)道線(xiàn)分割并疊加顯示
機器人場(chǎng)景理解及語(yǔ)義地圖構建: