本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
這篇同樣發表在CVPR2018上的論文,解決了在自動駕駛環境中從點雲中進行實時3D物體檢測的問題。通過從鳥瞰圖(BEV)中表示場景,更有效地利用3D數據,Uber團隊提出了PIXOR,一種無提議的單級檢測器,輸出從像素方式神經網絡預測解碼的定向3D對象估計。輸入表示,網絡架構和模型優化專門用於平衡高精度和實時效率,並在兩個數據集上驗證了PIXOR:KITTI BEV物體檢測基準和大規模3D車輛檢測基準。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_PIXOR_Real-Time_3D_CVPR_2018_paper.pdf
6.Hierarchical Recurrent Attention Networks for Structured Online Maps
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
這篇同樣發表在CVPR2018上的論文,解決了在自動駕駛環境中從點雲中進行實時3D物體檢測的問題。通過從鳥瞰圖(BEV)中表示場景,更有效地利用3D數據,Uber團隊提出了PIXOR,一種無提議的單級檢測器,輸出從像素方式神經網絡預測解碼的定向3D對象估計。輸入表示,網絡架構和模型優化專門用於平衡高精度和實時效率,並在兩個數據集上驗證了PIXOR:KITTI BEV物體檢測基準和大規模3D車輛檢測基準。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_PIXOR_Real-Time_3D_CVPR_2018_paper.pdf
6.Hierarchical Recurrent Attention Networks for Structured Online Maps
除此之外,Uber團隊也解決了從稀疏3D點雲提取在線道路網絡的問題。該方法受註釋器構建車道圖的啟發,首先確定有多少車道,然後依次繪製每個車道。他們開發了一個分級循環網絡,它通過輸出結構化折線來處理車道邊界的初始區域並完全跟蹤它們。在90公里長的高速公路上,證明了該方法的有效性。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Homayounfar_Hierarchical_Recurrent_Attention_CVPR_2018_paper.pdf
7.Deep Parametric Continuous Convolutional Neural Networks
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
這篇同樣發表在CVPR2018上的論文,解決了在自動駕駛環境中從點雲中進行實時3D物體檢測的問題。通過從鳥瞰圖(BEV)中表示場景,更有效地利用3D數據,Uber團隊提出了PIXOR,一種無提議的單級檢測器,輸出從像素方式神經網絡預測解碼的定向3D對象估計。輸入表示,網絡架構和模型優化專門用於平衡高精度和實時效率,並在兩個數據集上驗證了PIXOR:KITTI BEV物體檢測基準和大規模3D車輛檢測基準。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_PIXOR_Real-Time_3D_CVPR_2018_paper.pdf
6.Hierarchical Recurrent Attention Networks for Structured Online Maps
除此之外,Uber團隊也解決了從稀疏3D點雲提取在線道路網絡的問題。該方法受註釋器構建車道圖的啟發,首先確定有多少車道,然後依次繪製每個車道。他們開發了一個分級循環網絡,它通過輸出結構化折線來處理車道邊界的初始區域並完全跟蹤它們。在90公里長的高速公路上,證明了該方法的有效性。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Homayounfar_Hierarchical_Recurrent_Attention_CVPR_2018_paper.pdf
7.Deep Parametric Continuous Convolutional Neural Networks
一種對象實例的半自動註釋方法,Uber打破了將對象分割視為像素標註問題,而是將其轉換為多邊形預測任務,模仿大多數當前數據集的註釋方式。用該方法將圖像裁剪作為輸入,並順序生成對象的多邊形頂點。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Deep_Parametric_Continuous_CVPR_2018_paper.pdf
8.SBNet: Sparse Blocks Network for Fast Inference
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
這篇同樣發表在CVPR2018上的論文,解決了在自動駕駛環境中從點雲中進行實時3D物體檢測的問題。通過從鳥瞰圖(BEV)中表示場景,更有效地利用3D數據,Uber團隊提出了PIXOR,一種無提議的單級檢測器,輸出從像素方式神經網絡預測解碼的定向3D對象估計。輸入表示,網絡架構和模型優化專門用於平衡高精度和實時效率,並在兩個數據集上驗證了PIXOR:KITTI BEV物體檢測基準和大規模3D車輛檢測基準。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_PIXOR_Real-Time_3D_CVPR_2018_paper.pdf
6.Hierarchical Recurrent Attention Networks for Structured Online Maps
除此之外,Uber團隊也解決了從稀疏3D點雲提取在線道路網絡的問題。該方法受註釋器構建車道圖的啟發,首先確定有多少車道,然後依次繪製每個車道。他們開發了一個分級循環網絡,它通過輸出結構化折線來處理車道邊界的初始區域並完全跟蹤它們。在90公里長的高速公路上,證明了該方法的有效性。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Homayounfar_Hierarchical_Recurrent_Attention_CVPR_2018_paper.pdf
7.Deep Parametric Continuous Convolutional Neural Networks
一種對象實例的半自動註釋方法,Uber打破了將對象分割視為像素標註問題,而是將其轉換為多邊形預測任務,模仿大多數當前數據集的註釋方式。用該方法將圖像裁剪作為輸入,並順序生成對象的多邊形頂點。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Deep_Parametric_Continuous_CVPR_2018_paper.pdf
8.SBNet: Sparse Blocks Network for Fast Inference
2018年,Uber團隊通過改進深度卷積神經網絡(CNN)得到稀疏卷積算法,驗證了稀疏CNN對基於LiDAR的3D物體檢測的有效性。
論文下載鏈接:
https://arxiv.org/abs/1801.02108
9.Fast and Furious: Real Time End-to-End 3D Detection, Tracking and Motion Forecasting with a Single Convolutional Net
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
這篇同樣發表在CVPR2018上的論文,解決了在自動駕駛環境中從點雲中進行實時3D物體檢測的問題。通過從鳥瞰圖(BEV)中表示場景,更有效地利用3D數據,Uber團隊提出了PIXOR,一種無提議的單級檢測器,輸出從像素方式神經網絡預測解碼的定向3D對象估計。輸入表示,網絡架構和模型優化專門用於平衡高精度和實時效率,並在兩個數據集上驗證了PIXOR:KITTI BEV物體檢測基準和大規模3D車輛檢測基準。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_PIXOR_Real-Time_3D_CVPR_2018_paper.pdf
6.Hierarchical Recurrent Attention Networks for Structured Online Maps
除此之外,Uber團隊也解決了從稀疏3D點雲提取在線道路網絡的問題。該方法受註釋器構建車道圖的啟發,首先確定有多少車道,然後依次繪製每個車道。他們開發了一個分級循環網絡,它通過輸出結構化折線來處理車道邊界的初始區域並完全跟蹤它們。在90公里長的高速公路上,證明了該方法的有效性。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Homayounfar_Hierarchical_Recurrent_Attention_CVPR_2018_paper.pdf
7.Deep Parametric Continuous Convolutional Neural Networks
一種對象實例的半自動註釋方法,Uber打破了將對象分割視為像素標註問題,而是將其轉換為多邊形預測任務,模仿大多數當前數據集的註釋方式。用該方法將圖像裁剪作為輸入,並順序生成對象的多邊形頂點。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Deep_Parametric_Continuous_CVPR_2018_paper.pdf
8.SBNet: Sparse Blocks Network for Fast Inference
2018年,Uber團隊通過改進深度卷積神經網絡(CNN)得到稀疏卷積算法,驗證了稀疏CNN對基於LiDAR的3D物體檢測的有效性。
論文下載鏈接:
https://arxiv.org/abs/1801.02108
9.Fast and Furious: Real Time End-to-End 3D Detection, Tracking and Motion Forecasting with a Single Convolutional Net
Uber在一篇論文中提出了一種新的深度神經網絡,能夠在給定3D傳感器接受的數據下共同推理出3D檢測,跟蹤和運動預測。通過共同推理這些任務,對於遮擋以及範圍內的稀疏數據更加穩健。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Luo_Fast_and_Furious_CVPR_2018_paper.pdf
10. End-to-End Deep Structured Models for Drawing Crosswalks
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
這篇同樣發表在CVPR2018上的論文,解決了在自動駕駛環境中從點雲中進行實時3D物體檢測的問題。通過從鳥瞰圖(BEV)中表示場景,更有效地利用3D數據,Uber團隊提出了PIXOR,一種無提議的單級檢測器,輸出從像素方式神經網絡預測解碼的定向3D對象估計。輸入表示,網絡架構和模型優化專門用於平衡高精度和實時效率,並在兩個數據集上驗證了PIXOR:KITTI BEV物體檢測基準和大規模3D車輛檢測基準。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_PIXOR_Real-Time_3D_CVPR_2018_paper.pdf
6.Hierarchical Recurrent Attention Networks for Structured Online Maps
除此之外,Uber團隊也解決了從稀疏3D點雲提取在線道路網絡的問題。該方法受註釋器構建車道圖的啟發,首先確定有多少車道,然後依次繪製每個車道。他們開發了一個分級循環網絡,它通過輸出結構化折線來處理車道邊界的初始區域並完全跟蹤它們。在90公里長的高速公路上,證明了該方法的有效性。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Homayounfar_Hierarchical_Recurrent_Attention_CVPR_2018_paper.pdf
7.Deep Parametric Continuous Convolutional Neural Networks
一種對象實例的半自動註釋方法,Uber打破了將對象分割視為像素標註問題,而是將其轉換為多邊形預測任務,模仿大多數當前數據集的註釋方式。用該方法將圖像裁剪作為輸入,並順序生成對象的多邊形頂點。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Deep_Parametric_Continuous_CVPR_2018_paper.pdf
8.SBNet: Sparse Blocks Network for Fast Inference
2018年,Uber團隊通過改進深度卷積神經網絡(CNN)得到稀疏卷積算法,驗證了稀疏CNN對基於LiDAR的3D物體檢測的有效性。
論文下載鏈接:
https://arxiv.org/abs/1801.02108
9.Fast and Furious: Real Time End-to-End 3D Detection, Tracking and Motion Forecasting with a Single Convolutional Net
Uber在一篇論文中提出了一種新的深度神經網絡,能夠在給定3D傳感器接受的數據下共同推理出3D檢測,跟蹤和運動預測。通過共同推理這些任務,對於遮擋以及範圍內的稀疏數據更加穩健。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Luo_Fast_and_Furious_CVPR_2018_paper.pdf
10. End-to-End Deep Structured Models for Drawing Crosswalks
在一篇發表於ECCV2018的論文中,Uber解決了從LiDAR和攝像機圖像中檢測人行橫道的問題。為了實現這一目標,給定了多個LiDAR掃描和相應的圖像,將兩個輸入投影到地面上以產生場景的俯視圖。然後,利用卷積神經網絡提取關於人行橫道位置的語義線索。將這些與來自免費可用地圖(例如,OpenStreetMaps)的道路中心線結合使用,以解決繪製最終人行橫道邊界的結構化優化問題。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
11.Deep Continuous Fusion for Multi-Sensor 3D Object Detection
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
這篇同樣發表在CVPR2018上的論文,解決了在自動駕駛環境中從點雲中進行實時3D物體檢測的問題。通過從鳥瞰圖(BEV)中表示場景,更有效地利用3D數據,Uber團隊提出了PIXOR,一種無提議的單級檢測器,輸出從像素方式神經網絡預測解碼的定向3D對象估計。輸入表示,網絡架構和模型優化專門用於平衡高精度和實時效率,並在兩個數據集上驗證了PIXOR:KITTI BEV物體檢測基準和大規模3D車輛檢測基準。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_PIXOR_Real-Time_3D_CVPR_2018_paper.pdf
6.Hierarchical Recurrent Attention Networks for Structured Online Maps
除此之外,Uber團隊也解決了從稀疏3D點雲提取在線道路網絡的問題。該方法受註釋器構建車道圖的啟發,首先確定有多少車道,然後依次繪製每個車道。他們開發了一個分級循環網絡,它通過輸出結構化折線來處理車道邊界的初始區域並完全跟蹤它們。在90公里長的高速公路上,證明了該方法的有效性。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Homayounfar_Hierarchical_Recurrent_Attention_CVPR_2018_paper.pdf
7.Deep Parametric Continuous Convolutional Neural Networks
一種對象實例的半自動註釋方法,Uber打破了將對象分割視為像素標註問題,而是將其轉換為多邊形預測任務,模仿大多數當前數據集的註釋方式。用該方法將圖像裁剪作為輸入,並順序生成對象的多邊形頂點。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Deep_Parametric_Continuous_CVPR_2018_paper.pdf
8.SBNet: Sparse Blocks Network for Fast Inference
2018年,Uber團隊通過改進深度卷積神經網絡(CNN)得到稀疏卷積算法,驗證了稀疏CNN對基於LiDAR的3D物體檢測的有效性。
論文下載鏈接:
https://arxiv.org/abs/1801.02108
9.Fast and Furious: Real Time End-to-End 3D Detection, Tracking and Motion Forecasting with a Single Convolutional Net
Uber在一篇論文中提出了一種新的深度神經網絡,能夠在給定3D傳感器接受的數據下共同推理出3D檢測,跟蹤和運動預測。通過共同推理這些任務,對於遮擋以及範圍內的稀疏數據更加穩健。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Luo_Fast_and_Furious_CVPR_2018_paper.pdf
10. End-to-End Deep Structured Models for Drawing Crosswalks
在一篇發表於ECCV2018的論文中,Uber解決了從LiDAR和攝像機圖像中檢測人行橫道的問題。為了實現這一目標,給定了多個LiDAR掃描和相應的圖像,將兩個輸入投影到地面上以產生場景的俯視圖。然後,利用卷積神經網絡提取關於人行橫道位置的語義線索。將這些與來自免費可用地圖(例如,OpenStreetMaps)的道路中心線結合使用,以解決繪製最終人行橫道邊界的結構化優化問題。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
11.Deep Continuous Fusion for Multi-Sensor 3D Object Detection
camera圖像和雷達俯視圖分別用ResNet提取不通尺度特徵的,將camera圖像提取的多尺度特徵進行融合,經過本文設計的“連續融合層”以融合到BEV的不通尺度的特徵中,學到的特徵經個兩個固定尺度的anchor,每個尺度兩個方向(0,90°)NMS獲取最終的3D目標檢測。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
12.Efficient Convolutions for Real-Time Semantic Segmentation of 3D Point Clouds
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
這篇同樣發表在CVPR2018上的論文,解決了在自動駕駛環境中從點雲中進行實時3D物體檢測的問題。通過從鳥瞰圖(BEV)中表示場景,更有效地利用3D數據,Uber團隊提出了PIXOR,一種無提議的單級檢測器,輸出從像素方式神經網絡預測解碼的定向3D對象估計。輸入表示,網絡架構和模型優化專門用於平衡高精度和實時效率,並在兩個數據集上驗證了PIXOR:KITTI BEV物體檢測基準和大規模3D車輛檢測基準。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_PIXOR_Real-Time_3D_CVPR_2018_paper.pdf
6.Hierarchical Recurrent Attention Networks for Structured Online Maps
除此之外,Uber團隊也解決了從稀疏3D點雲提取在線道路網絡的問題。該方法受註釋器構建車道圖的啟發,首先確定有多少車道,然後依次繪製每個車道。他們開發了一個分級循環網絡,它通過輸出結構化折線來處理車道邊界的初始區域並完全跟蹤它們。在90公里長的高速公路上,證明了該方法的有效性。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Homayounfar_Hierarchical_Recurrent_Attention_CVPR_2018_paper.pdf
7.Deep Parametric Continuous Convolutional Neural Networks
一種對象實例的半自動註釋方法,Uber打破了將對象分割視為像素標註問題,而是將其轉換為多邊形預測任務,模仿大多數當前數據集的註釋方式。用該方法將圖像裁剪作為輸入,並順序生成對象的多邊形頂點。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Deep_Parametric_Continuous_CVPR_2018_paper.pdf
8.SBNet: Sparse Blocks Network for Fast Inference
2018年,Uber團隊通過改進深度卷積神經網絡(CNN)得到稀疏卷積算法,驗證了稀疏CNN對基於LiDAR的3D物體檢測的有效性。
論文下載鏈接:
https://arxiv.org/abs/1801.02108
9.Fast and Furious: Real Time End-to-End 3D Detection, Tracking and Motion Forecasting with a Single Convolutional Net
Uber在一篇論文中提出了一種新的深度神經網絡,能夠在給定3D傳感器接受的數據下共同推理出3D檢測,跟蹤和運動預測。通過共同推理這些任務,對於遮擋以及範圍內的稀疏數據更加穩健。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Luo_Fast_and_Furious_CVPR_2018_paper.pdf
10. End-to-End Deep Structured Models for Drawing Crosswalks
在一篇發表於ECCV2018的論文中,Uber解決了從LiDAR和攝像機圖像中檢測人行橫道的問題。為了實現這一目標,給定了多個LiDAR掃描和相應的圖像,將兩個輸入投影到地面上以產生場景的俯視圖。然後,利用卷積神經網絡提取關於人行橫道位置的語義線索。將這些與來自免費可用地圖(例如,OpenStreetMaps)的道路中心線結合使用,以解決繪製最終人行橫道邊界的結構化優化問題。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
11.Deep Continuous Fusion for Multi-Sensor 3D Object Detection
camera圖像和雷達俯視圖分別用ResNet提取不通尺度特徵的,將camera圖像提取的多尺度特徵進行融合,經過本文設計的“連續融合層”以融合到BEV的不通尺度的特徵中,學到的特徵經個兩個固定尺度的anchor,每個尺度兩個方向(0,90°)NMS獲取最終的3D目標檢測。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
12.Efficient Convolutions for Real-Time Semantic Segmentation of 3D Point Clouds
Uber發明了一種新穎的方法,使用深度神經網絡實時處理點雲,採用簡單佔用網格的2D表示,並生成細粒度的3D分割。
論文下載鏈接:
http://www.cs.toronto.edu/~wenjie/papers/3dv18.pdf
13.Learning to Localize Using a LiDAR Intensity Map
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
這篇同樣發表在CVPR2018上的論文,解決了在自動駕駛環境中從點雲中進行實時3D物體檢測的問題。通過從鳥瞰圖(BEV)中表示場景,更有效地利用3D數據,Uber團隊提出了PIXOR,一種無提議的單級檢測器,輸出從像素方式神經網絡預測解碼的定向3D對象估計。輸入表示,網絡架構和模型優化專門用於平衡高精度和實時效率,並在兩個數據集上驗證了PIXOR:KITTI BEV物體檢測基準和大規模3D車輛檢測基準。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_PIXOR_Real-Time_3D_CVPR_2018_paper.pdf
6.Hierarchical Recurrent Attention Networks for Structured Online Maps
除此之外,Uber團隊也解決了從稀疏3D點雲提取在線道路網絡的問題。該方法受註釋器構建車道圖的啟發,首先確定有多少車道,然後依次繪製每個車道。他們開發了一個分級循環網絡,它通過輸出結構化折線來處理車道邊界的初始區域並完全跟蹤它們。在90公里長的高速公路上,證明了該方法的有效性。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Homayounfar_Hierarchical_Recurrent_Attention_CVPR_2018_paper.pdf
7.Deep Parametric Continuous Convolutional Neural Networks
一種對象實例的半自動註釋方法,Uber打破了將對象分割視為像素標註問題,而是將其轉換為多邊形預測任務,模仿大多數當前數據集的註釋方式。用該方法將圖像裁剪作為輸入,並順序生成對象的多邊形頂點。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Deep_Parametric_Continuous_CVPR_2018_paper.pdf
8.SBNet: Sparse Blocks Network for Fast Inference
2018年,Uber團隊通過改進深度卷積神經網絡(CNN)得到稀疏卷積算法,驗證了稀疏CNN對基於LiDAR的3D物體檢測的有效性。
論文下載鏈接:
https://arxiv.org/abs/1801.02108
9.Fast and Furious: Real Time End-to-End 3D Detection, Tracking and Motion Forecasting with a Single Convolutional Net
Uber在一篇論文中提出了一種新的深度神經網絡,能夠在給定3D傳感器接受的數據下共同推理出3D檢測,跟蹤和運動預測。通過共同推理這些任務,對於遮擋以及範圍內的稀疏數據更加穩健。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Luo_Fast_and_Furious_CVPR_2018_paper.pdf
10. End-to-End Deep Structured Models for Drawing Crosswalks
在一篇發表於ECCV2018的論文中,Uber解決了從LiDAR和攝像機圖像中檢測人行橫道的問題。為了實現這一目標,給定了多個LiDAR掃描和相應的圖像,將兩個輸入投影到地面上以產生場景的俯視圖。然後,利用卷積神經網絡提取關於人行橫道位置的語義線索。將這些與來自免費可用地圖(例如,OpenStreetMaps)的道路中心線結合使用,以解決繪製最終人行橫道邊界的結構化優化問題。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
11.Deep Continuous Fusion for Multi-Sensor 3D Object Detection
camera圖像和雷達俯視圖分別用ResNet提取不通尺度特徵的,將camera圖像提取的多尺度特徵進行融合,經過本文設計的“連續融合層”以融合到BEV的不通尺度的特徵中,學到的特徵經個兩個固定尺度的anchor,每個尺度兩個方向(0,90°)NMS獲取最終的3D目標檢測。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
12.Efficient Convolutions for Real-Time Semantic Segmentation of 3D Point Clouds
Uber發明了一種新穎的方法,使用深度神經網絡實時處理點雲,採用簡單佔用網格的2D表示,並生成細粒度的3D分割。
論文下載鏈接:
http://www.cs.toronto.edu/~wenjie/papers/3dv18.pdf
13.Learning to Localize Using a LiDAR Intensity Map
在本文中,Uber團隊為自動駕駛汽車提出了一種實時,與校準無關且有效的定位系統。該方法學習將在線LiDAR掃描和強度圖嵌入到聯合深度嵌入空間中。然後通過嵌入之間的有效卷積匹配來進行定位。該完整系統可以在15Hz下實時運行,同時在不同的LiDAR傳感器和環境中實現釐米級精度。
論文下載鏈接:
http://proceedings.mlr.press/v87/barsan18a/barsan18a.pdf
14.IntentNet: Learning to Predict Intention from Raw Sensor Data
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
這篇同樣發表在CVPR2018上的論文,解決了在自動駕駛環境中從點雲中進行實時3D物體檢測的問題。通過從鳥瞰圖(BEV)中表示場景,更有效地利用3D數據,Uber團隊提出了PIXOR,一種無提議的單級檢測器,輸出從像素方式神經網絡預測解碼的定向3D對象估計。輸入表示,網絡架構和模型優化專門用於平衡高精度和實時效率,並在兩個數據集上驗證了PIXOR:KITTI BEV物體檢測基準和大規模3D車輛檢測基準。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_PIXOR_Real-Time_3D_CVPR_2018_paper.pdf
6.Hierarchical Recurrent Attention Networks for Structured Online Maps
除此之外,Uber團隊也解決了從稀疏3D點雲提取在線道路網絡的問題。該方法受註釋器構建車道圖的啟發,首先確定有多少車道,然後依次繪製每個車道。他們開發了一個分級循環網絡,它通過輸出結構化折線來處理車道邊界的初始區域並完全跟蹤它們。在90公里長的高速公路上,證明了該方法的有效性。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Homayounfar_Hierarchical_Recurrent_Attention_CVPR_2018_paper.pdf
7.Deep Parametric Continuous Convolutional Neural Networks
一種對象實例的半自動註釋方法,Uber打破了將對象分割視為像素標註問題,而是將其轉換為多邊形預測任務,模仿大多數當前數據集的註釋方式。用該方法將圖像裁剪作為輸入,並順序生成對象的多邊形頂點。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Deep_Parametric_Continuous_CVPR_2018_paper.pdf
8.SBNet: Sparse Blocks Network for Fast Inference
2018年,Uber團隊通過改進深度卷積神經網絡(CNN)得到稀疏卷積算法,驗證了稀疏CNN對基於LiDAR的3D物體檢測的有效性。
論文下載鏈接:
https://arxiv.org/abs/1801.02108
9.Fast and Furious: Real Time End-to-End 3D Detection, Tracking and Motion Forecasting with a Single Convolutional Net
Uber在一篇論文中提出了一種新的深度神經網絡,能夠在給定3D傳感器接受的數據下共同推理出3D檢測,跟蹤和運動預測。通過共同推理這些任務,對於遮擋以及範圍內的稀疏數據更加穩健。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Luo_Fast_and_Furious_CVPR_2018_paper.pdf
10. End-to-End Deep Structured Models for Drawing Crosswalks
在一篇發表於ECCV2018的論文中,Uber解決了從LiDAR和攝像機圖像中檢測人行橫道的問題。為了實現這一目標,給定了多個LiDAR掃描和相應的圖像,將兩個輸入投影到地面上以產生場景的俯視圖。然後,利用卷積神經網絡提取關於人行橫道位置的語義線索。將這些與來自免費可用地圖(例如,OpenStreetMaps)的道路中心線結合使用,以解決繪製最終人行橫道邊界的結構化優化問題。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
11.Deep Continuous Fusion for Multi-Sensor 3D Object Detection
camera圖像和雷達俯視圖分別用ResNet提取不通尺度特徵的,將camera圖像提取的多尺度特徵進行融合,經過本文設計的“連續融合層”以融合到BEV的不通尺度的特徵中,學到的特徵經個兩個固定尺度的anchor,每個尺度兩個方向(0,90°)NMS獲取最終的3D目標檢測。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
12.Efficient Convolutions for Real-Time Semantic Segmentation of 3D Point Clouds
Uber發明了一種新穎的方法,使用深度神經網絡實時處理點雲,採用簡單佔用網格的2D表示,並生成細粒度的3D分割。
論文下載鏈接:
http://www.cs.toronto.edu/~wenjie/papers/3dv18.pdf
13.Learning to Localize Using a LiDAR Intensity Map
在本文中,Uber團隊為自動駕駛汽車提出了一種實時,與校準無關且有效的定位系統。該方法學習將在線LiDAR掃描和強度圖嵌入到聯合深度嵌入空間中。然後通過嵌入之間的有效卷積匹配來進行定位。該完整系統可以在15Hz下實時運行,同時在不同的LiDAR傳感器和環境中實現釐米級精度。
論文下載鏈接:
http://proceedings.mlr.press/v87/barsan18a/barsan18a.pdf
14.IntentNet: Learning to Predict Intention from Raw Sensor Data
在本文中,Uber團隊開發了一個單級探測器和預報器,它利用了LiDAR傳感器產生的3D點雲以及環境的動態圖。該多任務模型比單獨的模塊具有更高的精度,同時節省了計算,這對於減少自動駕駛應用中的反應時間至關重要。
論文下載鏈接:
http://proceedings.mlr.press/v87/casas18a/casas18a.pdf
15.HDNET: Exploiting HD Maps for 3D Object Detection
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
這篇同樣發表在CVPR2018上的論文,解決了在自動駕駛環境中從點雲中進行實時3D物體檢測的問題。通過從鳥瞰圖(BEV)中表示場景,更有效地利用3D數據,Uber團隊提出了PIXOR,一種無提議的單級檢測器,輸出從像素方式神經網絡預測解碼的定向3D對象估計。輸入表示,網絡架構和模型優化專門用於平衡高精度和實時效率,並在兩個數據集上驗證了PIXOR:KITTI BEV物體檢測基準和大規模3D車輛檢測基準。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_PIXOR_Real-Time_3D_CVPR_2018_paper.pdf
6.Hierarchical Recurrent Attention Networks for Structured Online Maps
除此之外,Uber團隊也解決了從稀疏3D點雲提取在線道路網絡的問題。該方法受註釋器構建車道圖的啟發,首先確定有多少車道,然後依次繪製每個車道。他們開發了一個分級循環網絡,它通過輸出結構化折線來處理車道邊界的初始區域並完全跟蹤它們。在90公里長的高速公路上,證明了該方法的有效性。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Homayounfar_Hierarchical_Recurrent_Attention_CVPR_2018_paper.pdf
7.Deep Parametric Continuous Convolutional Neural Networks
一種對象實例的半自動註釋方法,Uber打破了將對象分割視為像素標註問題,而是將其轉換為多邊形預測任務,模仿大多數當前數據集的註釋方式。用該方法將圖像裁剪作為輸入,並順序生成對象的多邊形頂點。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Deep_Parametric_Continuous_CVPR_2018_paper.pdf
8.SBNet: Sparse Blocks Network for Fast Inference
2018年,Uber團隊通過改進深度卷積神經網絡(CNN)得到稀疏卷積算法,驗證了稀疏CNN對基於LiDAR的3D物體檢測的有效性。
論文下載鏈接:
https://arxiv.org/abs/1801.02108
9.Fast and Furious: Real Time End-to-End 3D Detection, Tracking and Motion Forecasting with a Single Convolutional Net
Uber在一篇論文中提出了一種新的深度神經網絡,能夠在給定3D傳感器接受的數據下共同推理出3D檢測,跟蹤和運動預測。通過共同推理這些任務,對於遮擋以及範圍內的稀疏數據更加穩健。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Luo_Fast_and_Furious_CVPR_2018_paper.pdf
10. End-to-End Deep Structured Models for Drawing Crosswalks
在一篇發表於ECCV2018的論文中,Uber解決了從LiDAR和攝像機圖像中檢測人行橫道的問題。為了實現這一目標,給定了多個LiDAR掃描和相應的圖像,將兩個輸入投影到地面上以產生場景的俯視圖。然後,利用卷積神經網絡提取關於人行橫道位置的語義線索。將這些與來自免費可用地圖(例如,OpenStreetMaps)的道路中心線結合使用,以解決繪製最終人行橫道邊界的結構化優化問題。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
11.Deep Continuous Fusion for Multi-Sensor 3D Object Detection
camera圖像和雷達俯視圖分別用ResNet提取不通尺度特徵的,將camera圖像提取的多尺度特徵進行融合,經過本文設計的“連續融合層”以融合到BEV的不通尺度的特徵中,學到的特徵經個兩個固定尺度的anchor,每個尺度兩個方向(0,90°)NMS獲取最終的3D目標檢測。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
12.Efficient Convolutions for Real-Time Semantic Segmentation of 3D Point Clouds
Uber發明了一種新穎的方法,使用深度神經網絡實時處理點雲,採用簡單佔用網格的2D表示,並生成細粒度的3D分割。
論文下載鏈接:
http://www.cs.toronto.edu/~wenjie/papers/3dv18.pdf
13.Learning to Localize Using a LiDAR Intensity Map
在本文中,Uber團隊為自動駕駛汽車提出了一種實時,與校準無關且有效的定位系統。該方法學習將在線LiDAR掃描和強度圖嵌入到聯合深度嵌入空間中。然後通過嵌入之間的有效卷積匹配來進行定位。該完整系統可以在15Hz下實時運行,同時在不同的LiDAR傳感器和環境中實現釐米級精度。
論文下載鏈接:
http://proceedings.mlr.press/v87/barsan18a/barsan18a.pdf
14.IntentNet: Learning to Predict Intention from Raw Sensor Data
在本文中,Uber團隊開發了一個單級探測器和預報器,它利用了LiDAR傳感器產生的3D點雲以及環境的動態圖。該多任務模型比單獨的模塊具有更高的精度,同時節省了計算,這對於減少自動駕駛應用中的反應時間至關重要。
論文下載鏈接:
http://proceedings.mlr.press/v87/casas18a/casas18a.pdf
15.HDNET: Exploiting HD Maps for 3D Object Detection
論文下載鏈接:
http://proceedings.mlr.press/v87/yang18b/yang18b.pdf
16.Deep Multi-Sensor Lane Detection
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
這篇同樣發表在CVPR2018上的論文,解決了在自動駕駛環境中從點雲中進行實時3D物體檢測的問題。通過從鳥瞰圖(BEV)中表示場景,更有效地利用3D數據,Uber團隊提出了PIXOR,一種無提議的單級檢測器,輸出從像素方式神經網絡預測解碼的定向3D對象估計。輸入表示,網絡架構和模型優化專門用於平衡高精度和實時效率,並在兩個數據集上驗證了PIXOR:KITTI BEV物體檢測基準和大規模3D車輛檢測基準。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_PIXOR_Real-Time_3D_CVPR_2018_paper.pdf
6.Hierarchical Recurrent Attention Networks for Structured Online Maps
除此之外,Uber團隊也解決了從稀疏3D點雲提取在線道路網絡的問題。該方法受註釋器構建車道圖的啟發,首先確定有多少車道,然後依次繪製每個車道。他們開發了一個分級循環網絡,它通過輸出結構化折線來處理車道邊界的初始區域並完全跟蹤它們。在90公里長的高速公路上,證明了該方法的有效性。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Homayounfar_Hierarchical_Recurrent_Attention_CVPR_2018_paper.pdf
7.Deep Parametric Continuous Convolutional Neural Networks
一種對象實例的半自動註釋方法,Uber打破了將對象分割視為像素標註問題,而是將其轉換為多邊形預測任務,模仿大多數當前數據集的註釋方式。用該方法將圖像裁剪作為輸入,並順序生成對象的多邊形頂點。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Deep_Parametric_Continuous_CVPR_2018_paper.pdf
8.SBNet: Sparse Blocks Network for Fast Inference
2018年,Uber團隊通過改進深度卷積神經網絡(CNN)得到稀疏卷積算法,驗證了稀疏CNN對基於LiDAR的3D物體檢測的有效性。
論文下載鏈接:
https://arxiv.org/abs/1801.02108
9.Fast and Furious: Real Time End-to-End 3D Detection, Tracking and Motion Forecasting with a Single Convolutional Net
Uber在一篇論文中提出了一種新的深度神經網絡,能夠在給定3D傳感器接受的數據下共同推理出3D檢測,跟蹤和運動預測。通過共同推理這些任務,對於遮擋以及範圍內的稀疏數據更加穩健。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Luo_Fast_and_Furious_CVPR_2018_paper.pdf
10. End-to-End Deep Structured Models for Drawing Crosswalks
在一篇發表於ECCV2018的論文中,Uber解決了從LiDAR和攝像機圖像中檢測人行橫道的問題。為了實現這一目標,給定了多個LiDAR掃描和相應的圖像,將兩個輸入投影到地面上以產生場景的俯視圖。然後,利用卷積神經網絡提取關於人行橫道位置的語義線索。將這些與來自免費可用地圖(例如,OpenStreetMaps)的道路中心線結合使用,以解決繪製最終人行橫道邊界的結構化優化問題。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
11.Deep Continuous Fusion for Multi-Sensor 3D Object Detection
camera圖像和雷達俯視圖分別用ResNet提取不通尺度特徵的,將camera圖像提取的多尺度特徵進行融合,經過本文設計的“連續融合層”以融合到BEV的不通尺度的特徵中,學到的特徵經個兩個固定尺度的anchor,每個尺度兩個方向(0,90°)NMS獲取最終的3D目標檢測。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
12.Efficient Convolutions for Real-Time Semantic Segmentation of 3D Point Clouds
Uber發明了一種新穎的方法,使用深度神經網絡實時處理點雲,採用簡單佔用網格的2D表示,並生成細粒度的3D分割。
論文下載鏈接:
http://www.cs.toronto.edu/~wenjie/papers/3dv18.pdf
13.Learning to Localize Using a LiDAR Intensity Map
在本文中,Uber團隊為自動駕駛汽車提出了一種實時,與校準無關且有效的定位系統。該方法學習將在線LiDAR掃描和強度圖嵌入到聯合深度嵌入空間中。然後通過嵌入之間的有效卷積匹配來進行定位。該完整系統可以在15Hz下實時運行,同時在不同的LiDAR傳感器和環境中實現釐米級精度。
論文下載鏈接:
http://proceedings.mlr.press/v87/barsan18a/barsan18a.pdf
14.IntentNet: Learning to Predict Intention from Raw Sensor Data
在本文中,Uber團隊開發了一個單級探測器和預報器,它利用了LiDAR傳感器產生的3D點雲以及環境的動態圖。該多任務模型比單獨的模塊具有更高的精度,同時節省了計算,這對於減少自動駕駛應用中的反應時間至關重要。
論文下載鏈接:
http://proceedings.mlr.press/v87/casas18a/casas18a.pdf
15.HDNET: Exploiting HD Maps for 3D Object Detection
論文下載鏈接:
http://proceedings.mlr.press/v87/yang18b/yang18b.pdf
16.Deep Multi-Sensor Lane Detection
論文下載鏈接:
https://arxiv.org/abs/1905.01555
17.Graph HyperNetworks for Neural Architecture Search
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
這篇同樣發表在CVPR2018上的論文,解決了在自動駕駛環境中從點雲中進行實時3D物體檢測的問題。通過從鳥瞰圖(BEV)中表示場景,更有效地利用3D數據,Uber團隊提出了PIXOR,一種無提議的單級檢測器,輸出從像素方式神經網絡預測解碼的定向3D對象估計。輸入表示,網絡架構和模型優化專門用於平衡高精度和實時效率,並在兩個數據集上驗證了PIXOR:KITTI BEV物體檢測基準和大規模3D車輛檢測基準。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_PIXOR_Real-Time_3D_CVPR_2018_paper.pdf
6.Hierarchical Recurrent Attention Networks for Structured Online Maps
除此之外,Uber團隊也解決了從稀疏3D點雲提取在線道路網絡的問題。該方法受註釋器構建車道圖的啟發,首先確定有多少車道,然後依次繪製每個車道。他們開發了一個分級循環網絡,它通過輸出結構化折線來處理車道邊界的初始區域並完全跟蹤它們。在90公里長的高速公路上,證明了該方法的有效性。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Homayounfar_Hierarchical_Recurrent_Attention_CVPR_2018_paper.pdf
7.Deep Parametric Continuous Convolutional Neural Networks
一種對象實例的半自動註釋方法,Uber打破了將對象分割視為像素標註問題,而是將其轉換為多邊形預測任務,模仿大多數當前數據集的註釋方式。用該方法將圖像裁剪作為輸入,並順序生成對象的多邊形頂點。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Deep_Parametric_Continuous_CVPR_2018_paper.pdf
8.SBNet: Sparse Blocks Network for Fast Inference
2018年,Uber團隊通過改進深度卷積神經網絡(CNN)得到稀疏卷積算法,驗證了稀疏CNN對基於LiDAR的3D物體檢測的有效性。
論文下載鏈接:
https://arxiv.org/abs/1801.02108
9.Fast and Furious: Real Time End-to-End 3D Detection, Tracking and Motion Forecasting with a Single Convolutional Net
Uber在一篇論文中提出了一種新的深度神經網絡,能夠在給定3D傳感器接受的數據下共同推理出3D檢測,跟蹤和運動預測。通過共同推理這些任務,對於遮擋以及範圍內的稀疏數據更加穩健。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Luo_Fast_and_Furious_CVPR_2018_paper.pdf
10. End-to-End Deep Structured Models for Drawing Crosswalks
在一篇發表於ECCV2018的論文中,Uber解決了從LiDAR和攝像機圖像中檢測人行橫道的問題。為了實現這一目標,給定了多個LiDAR掃描和相應的圖像,將兩個輸入投影到地面上以產生場景的俯視圖。然後,利用卷積神經網絡提取關於人行橫道位置的語義線索。將這些與來自免費可用地圖(例如,OpenStreetMaps)的道路中心線結合使用,以解決繪製最終人行橫道邊界的結構化優化問題。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
11.Deep Continuous Fusion for Multi-Sensor 3D Object Detection
camera圖像和雷達俯視圖分別用ResNet提取不通尺度特徵的,將camera圖像提取的多尺度特徵進行融合,經過本文設計的“連續融合層”以融合到BEV的不通尺度的特徵中,學到的特徵經個兩個固定尺度的anchor,每個尺度兩個方向(0,90°)NMS獲取最終的3D目標檢測。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
12.Efficient Convolutions for Real-Time Semantic Segmentation of 3D Point Clouds
Uber發明了一種新穎的方法,使用深度神經網絡實時處理點雲,採用簡單佔用網格的2D表示,並生成細粒度的3D分割。
論文下載鏈接:
http://www.cs.toronto.edu/~wenjie/papers/3dv18.pdf
13.Learning to Localize Using a LiDAR Intensity Map
在本文中,Uber團隊為自動駕駛汽車提出了一種實時,與校準無關且有效的定位系統。該方法學習將在線LiDAR掃描和強度圖嵌入到聯合深度嵌入空間中。然後通過嵌入之間的有效卷積匹配來進行定位。該完整系統可以在15Hz下實時運行,同時在不同的LiDAR傳感器和環境中實現釐米級精度。
論文下載鏈接:
http://proceedings.mlr.press/v87/barsan18a/barsan18a.pdf
14.IntentNet: Learning to Predict Intention from Raw Sensor Data
在本文中,Uber團隊開發了一個單級探測器和預報器,它利用了LiDAR傳感器產生的3D點雲以及環境的動態圖。該多任務模型比單獨的模塊具有更高的精度,同時節省了計算,這對於減少自動駕駛應用中的反應時間至關重要。
論文下載鏈接:
http://proceedings.mlr.press/v87/casas18a/casas18a.pdf
15.HDNET: Exploiting HD Maps for 3D Object Detection
論文下載鏈接:
http://proceedings.mlr.press/v87/yang18b/yang18b.pdf
16.Deep Multi-Sensor Lane Detection
論文下載鏈接:
https://arxiv.org/abs/1905.01555
17.Graph HyperNetworks for Neural Architecture Search
論文下載鏈接:
https://openreview.net/forum?id=rkgW0oA9FX
18.DeepSignals: Predicting Intent of Drivers Through Visual Signals
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
這篇同樣發表在CVPR2018上的論文,解決了在自動駕駛環境中從點雲中進行實時3D物體檢測的問題。通過從鳥瞰圖(BEV)中表示場景,更有效地利用3D數據,Uber團隊提出了PIXOR,一種無提議的單級檢測器,輸出從像素方式神經網絡預測解碼的定向3D對象估計。輸入表示,網絡架構和模型優化專門用於平衡高精度和實時效率,並在兩個數據集上驗證了PIXOR:KITTI BEV物體檢測基準和大規模3D車輛檢測基準。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_PIXOR_Real-Time_3D_CVPR_2018_paper.pdf
6.Hierarchical Recurrent Attention Networks for Structured Online Maps
除此之外,Uber團隊也解決了從稀疏3D點雲提取在線道路網絡的問題。該方法受註釋器構建車道圖的啟發,首先確定有多少車道,然後依次繪製每個車道。他們開發了一個分級循環網絡,它通過輸出結構化折線來處理車道邊界的初始區域並完全跟蹤它們。在90公里長的高速公路上,證明了該方法的有效性。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Homayounfar_Hierarchical_Recurrent_Attention_CVPR_2018_paper.pdf
7.Deep Parametric Continuous Convolutional Neural Networks
一種對象實例的半自動註釋方法,Uber打破了將對象分割視為像素標註問題,而是將其轉換為多邊形預測任務,模仿大多數當前數據集的註釋方式。用該方法將圖像裁剪作為輸入,並順序生成對象的多邊形頂點。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Deep_Parametric_Continuous_CVPR_2018_paper.pdf
8.SBNet: Sparse Blocks Network for Fast Inference
2018年,Uber團隊通過改進深度卷積神經網絡(CNN)得到稀疏卷積算法,驗證了稀疏CNN對基於LiDAR的3D物體檢測的有效性。
論文下載鏈接:
https://arxiv.org/abs/1801.02108
9.Fast and Furious: Real Time End-to-End 3D Detection, Tracking and Motion Forecasting with a Single Convolutional Net
Uber在一篇論文中提出了一種新的深度神經網絡,能夠在給定3D傳感器接受的數據下共同推理出3D檢測,跟蹤和運動預測。通過共同推理這些任務,對於遮擋以及範圍內的稀疏數據更加穩健。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Luo_Fast_and_Furious_CVPR_2018_paper.pdf
10. End-to-End Deep Structured Models for Drawing Crosswalks
在一篇發表於ECCV2018的論文中,Uber解決了從LiDAR和攝像機圖像中檢測人行橫道的問題。為了實現這一目標,給定了多個LiDAR掃描和相應的圖像,將兩個輸入投影到地面上以產生場景的俯視圖。然後,利用卷積神經網絡提取關於人行橫道位置的語義線索。將這些與來自免費可用地圖(例如,OpenStreetMaps)的道路中心線結合使用,以解決繪製最終人行橫道邊界的結構化優化問題。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
11.Deep Continuous Fusion for Multi-Sensor 3D Object Detection
camera圖像和雷達俯視圖分別用ResNet提取不通尺度特徵的,將camera圖像提取的多尺度特徵進行融合,經過本文設計的“連續融合層”以融合到BEV的不通尺度的特徵中,學到的特徵經個兩個固定尺度的anchor,每個尺度兩個方向(0,90°)NMS獲取最終的3D目標檢測。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
12.Efficient Convolutions for Real-Time Semantic Segmentation of 3D Point Clouds
Uber發明了一種新穎的方法,使用深度神經網絡實時處理點雲,採用簡單佔用網格的2D表示,並生成細粒度的3D分割。
論文下載鏈接:
http://www.cs.toronto.edu/~wenjie/papers/3dv18.pdf
13.Learning to Localize Using a LiDAR Intensity Map
在本文中,Uber團隊為自動駕駛汽車提出了一種實時,與校準無關且有效的定位系統。該方法學習將在線LiDAR掃描和強度圖嵌入到聯合深度嵌入空間中。然後通過嵌入之間的有效卷積匹配來進行定位。該完整系統可以在15Hz下實時運行,同時在不同的LiDAR傳感器和環境中實現釐米級精度。
論文下載鏈接:
http://proceedings.mlr.press/v87/barsan18a/barsan18a.pdf
14.IntentNet: Learning to Predict Intention from Raw Sensor Data
在本文中,Uber團隊開發了一個單級探測器和預報器,它利用了LiDAR傳感器產生的3D點雲以及環境的動態圖。該多任務模型比單獨的模塊具有更高的精度,同時節省了計算,這對於減少自動駕駛應用中的反應時間至關重要。
論文下載鏈接:
http://proceedings.mlr.press/v87/casas18a/casas18a.pdf
15.HDNET: Exploiting HD Maps for 3D Object Detection
論文下載鏈接:
http://proceedings.mlr.press/v87/yang18b/yang18b.pdf
16.Deep Multi-Sensor Lane Detection
論文下載鏈接:
https://arxiv.org/abs/1905.01555
17.Graph HyperNetworks for Neural Architecture Search
論文下載鏈接:
https://openreview.net/forum?id=rkgW0oA9FX
18.DeepSignals: Predicting Intent of Drivers Through Visual Signals
論文下載鏈接:
https://www.cs.toronto.edu/~urtasun/publications/frossard_etal_icra19.pdf
19.Deep Rigid Instance Scene Flow
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
這篇同樣發表在CVPR2018上的論文,解決了在自動駕駛環境中從點雲中進行實時3D物體檢測的問題。通過從鳥瞰圖(BEV)中表示場景,更有效地利用3D數據,Uber團隊提出了PIXOR,一種無提議的單級檢測器,輸出從像素方式神經網絡預測解碼的定向3D對象估計。輸入表示,網絡架構和模型優化專門用於平衡高精度和實時效率,並在兩個數據集上驗證了PIXOR:KITTI BEV物體檢測基準和大規模3D車輛檢測基準。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_PIXOR_Real-Time_3D_CVPR_2018_paper.pdf
6.Hierarchical Recurrent Attention Networks for Structured Online Maps
除此之外,Uber團隊也解決了從稀疏3D點雲提取在線道路網絡的問題。該方法受註釋器構建車道圖的啟發,首先確定有多少車道,然後依次繪製每個車道。他們開發了一個分級循環網絡,它通過輸出結構化折線來處理車道邊界的初始區域並完全跟蹤它們。在90公里長的高速公路上,證明了該方法的有效性。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Homayounfar_Hierarchical_Recurrent_Attention_CVPR_2018_paper.pdf
7.Deep Parametric Continuous Convolutional Neural Networks
一種對象實例的半自動註釋方法,Uber打破了將對象分割視為像素標註問題,而是將其轉換為多邊形預測任務,模仿大多數當前數據集的註釋方式。用該方法將圖像裁剪作為輸入,並順序生成對象的多邊形頂點。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Deep_Parametric_Continuous_CVPR_2018_paper.pdf
8.SBNet: Sparse Blocks Network for Fast Inference
2018年,Uber團隊通過改進深度卷積神經網絡(CNN)得到稀疏卷積算法,驗證了稀疏CNN對基於LiDAR的3D物體檢測的有效性。
論文下載鏈接:
https://arxiv.org/abs/1801.02108
9.Fast and Furious: Real Time End-to-End 3D Detection, Tracking and Motion Forecasting with a Single Convolutional Net
Uber在一篇論文中提出了一種新的深度神經網絡,能夠在給定3D傳感器接受的數據下共同推理出3D檢測,跟蹤和運動預測。通過共同推理這些任務,對於遮擋以及範圍內的稀疏數據更加穩健。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Luo_Fast_and_Furious_CVPR_2018_paper.pdf
10. End-to-End Deep Structured Models for Drawing Crosswalks
在一篇發表於ECCV2018的論文中,Uber解決了從LiDAR和攝像機圖像中檢測人行橫道的問題。為了實現這一目標,給定了多個LiDAR掃描和相應的圖像,將兩個輸入投影到地面上以產生場景的俯視圖。然後,利用卷積神經網絡提取關於人行橫道位置的語義線索。將這些與來自免費可用地圖(例如,OpenStreetMaps)的道路中心線結合使用,以解決繪製最終人行橫道邊界的結構化優化問題。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
11.Deep Continuous Fusion for Multi-Sensor 3D Object Detection
camera圖像和雷達俯視圖分別用ResNet提取不通尺度特徵的,將camera圖像提取的多尺度特徵進行融合,經過本文設計的“連續融合層”以融合到BEV的不通尺度的特徵中,學到的特徵經個兩個固定尺度的anchor,每個尺度兩個方向(0,90°)NMS獲取最終的3D目標檢測。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
12.Efficient Convolutions for Real-Time Semantic Segmentation of 3D Point Clouds
Uber發明了一種新穎的方法,使用深度神經網絡實時處理點雲,採用簡單佔用網格的2D表示,並生成細粒度的3D分割。
論文下載鏈接:
http://www.cs.toronto.edu/~wenjie/papers/3dv18.pdf
13.Learning to Localize Using a LiDAR Intensity Map
在本文中,Uber團隊為自動駕駛汽車提出了一種實時,與校準無關且有效的定位系統。該方法學習將在線LiDAR掃描和強度圖嵌入到聯合深度嵌入空間中。然後通過嵌入之間的有效卷積匹配來進行定位。該完整系統可以在15Hz下實時運行,同時在不同的LiDAR傳感器和環境中實現釐米級精度。
論文下載鏈接:
http://proceedings.mlr.press/v87/barsan18a/barsan18a.pdf
14.IntentNet: Learning to Predict Intention from Raw Sensor Data
在本文中,Uber團隊開發了一個單級探測器和預報器,它利用了LiDAR傳感器產生的3D點雲以及環境的動態圖。該多任務模型比單獨的模塊具有更高的精度,同時節省了計算,這對於減少自動駕駛應用中的反應時間至關重要。
論文下載鏈接:
http://proceedings.mlr.press/v87/casas18a/casas18a.pdf
15.HDNET: Exploiting HD Maps for 3D Object Detection
論文下載鏈接:
http://proceedings.mlr.press/v87/yang18b/yang18b.pdf
16.Deep Multi-Sensor Lane Detection
論文下載鏈接:
https://arxiv.org/abs/1905.01555
17.Graph HyperNetworks for Neural Architecture Search
論文下載鏈接:
https://openreview.net/forum?id=rkgW0oA9FX
18.DeepSignals: Predicting Intent of Drivers Through Visual Signals
論文下載鏈接:
https://www.cs.toronto.edu/~urtasun/publications/frossard_etal_icra19.pdf
19.Deep Rigid Instance Scene Flow
20.Multi-Task Multi-Sensor Fusion for 3D Object Detection
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
這篇同樣發表在CVPR2018上的論文,解決了在自動駕駛環境中從點雲中進行實時3D物體檢測的問題。通過從鳥瞰圖(BEV)中表示場景,更有效地利用3D數據,Uber團隊提出了PIXOR,一種無提議的單級檢測器,輸出從像素方式神經網絡預測解碼的定向3D對象估計。輸入表示,網絡架構和模型優化專門用於平衡高精度和實時效率,並在兩個數據集上驗證了PIXOR:KITTI BEV物體檢測基準和大規模3D車輛檢測基準。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_PIXOR_Real-Time_3D_CVPR_2018_paper.pdf
6.Hierarchical Recurrent Attention Networks for Structured Online Maps
除此之外,Uber團隊也解決了從稀疏3D點雲提取在線道路網絡的問題。該方法受註釋器構建車道圖的啟發,首先確定有多少車道,然後依次繪製每個車道。他們開發了一個分級循環網絡,它通過輸出結構化折線來處理車道邊界的初始區域並完全跟蹤它們。在90公里長的高速公路上,證明了該方法的有效性。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Homayounfar_Hierarchical_Recurrent_Attention_CVPR_2018_paper.pdf
7.Deep Parametric Continuous Convolutional Neural Networks
一種對象實例的半自動註釋方法,Uber打破了將對象分割視為像素標註問題,而是將其轉換為多邊形預測任務,模仿大多數當前數據集的註釋方式。用該方法將圖像裁剪作為輸入,並順序生成對象的多邊形頂點。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Deep_Parametric_Continuous_CVPR_2018_paper.pdf
8.SBNet: Sparse Blocks Network for Fast Inference
2018年,Uber團隊通過改進深度卷積神經網絡(CNN)得到稀疏卷積算法,驗證了稀疏CNN對基於LiDAR的3D物體檢測的有效性。
論文下載鏈接:
https://arxiv.org/abs/1801.02108
9.Fast and Furious: Real Time End-to-End 3D Detection, Tracking and Motion Forecasting with a Single Convolutional Net
Uber在一篇論文中提出了一種新的深度神經網絡,能夠在給定3D傳感器接受的數據下共同推理出3D檢測,跟蹤和運動預測。通過共同推理這些任務,對於遮擋以及範圍內的稀疏數據更加穩健。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Luo_Fast_and_Furious_CVPR_2018_paper.pdf
10. End-to-End Deep Structured Models for Drawing Crosswalks
在一篇發表於ECCV2018的論文中,Uber解決了從LiDAR和攝像機圖像中檢測人行橫道的問題。為了實現這一目標,給定了多個LiDAR掃描和相應的圖像,將兩個輸入投影到地面上以產生場景的俯視圖。然後,利用卷積神經網絡提取關於人行橫道位置的語義線索。將這些與來自免費可用地圖(例如,OpenStreetMaps)的道路中心線結合使用,以解決繪製最終人行橫道邊界的結構化優化問題。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
11.Deep Continuous Fusion for Multi-Sensor 3D Object Detection
camera圖像和雷達俯視圖分別用ResNet提取不通尺度特徵的,將camera圖像提取的多尺度特徵進行融合,經過本文設計的“連續融合層”以融合到BEV的不通尺度的特徵中,學到的特徵經個兩個固定尺度的anchor,每個尺度兩個方向(0,90°)NMS獲取最終的3D目標檢測。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
12.Efficient Convolutions for Real-Time Semantic Segmentation of 3D Point Clouds
Uber發明了一種新穎的方法,使用深度神經網絡實時處理點雲,採用簡單佔用網格的2D表示,並生成細粒度的3D分割。
論文下載鏈接:
http://www.cs.toronto.edu/~wenjie/papers/3dv18.pdf
13.Learning to Localize Using a LiDAR Intensity Map
在本文中,Uber團隊為自動駕駛汽車提出了一種實時,與校準無關且有效的定位系統。該方法學習將在線LiDAR掃描和強度圖嵌入到聯合深度嵌入空間中。然後通過嵌入之間的有效卷積匹配來進行定位。該完整系統可以在15Hz下實時運行,同時在不同的LiDAR傳感器和環境中實現釐米級精度。
論文下載鏈接:
http://proceedings.mlr.press/v87/barsan18a/barsan18a.pdf
14.IntentNet: Learning to Predict Intention from Raw Sensor Data
在本文中,Uber團隊開發了一個單級探測器和預報器,它利用了LiDAR傳感器產生的3D點雲以及環境的動態圖。該多任務模型比單獨的模塊具有更高的精度,同時節省了計算,這對於減少自動駕駛應用中的反應時間至關重要。
論文下載鏈接:
http://proceedings.mlr.press/v87/casas18a/casas18a.pdf
15.HDNET: Exploiting HD Maps for 3D Object Detection
論文下載鏈接:
http://proceedings.mlr.press/v87/yang18b/yang18b.pdf
16.Deep Multi-Sensor Lane Detection
論文下載鏈接:
https://arxiv.org/abs/1905.01555
17.Graph HyperNetworks for Neural Architecture Search
論文下載鏈接:
https://openreview.net/forum?id=rkgW0oA9FX
18.DeepSignals: Predicting Intent of Drivers Through Visual Signals
論文下載鏈接:
https://www.cs.toronto.edu/~urtasun/publications/frossard_etal_icra19.pdf
19.Deep Rigid Instance Scene Flow
20.Multi-Task Multi-Sensor Fusion for 3D Object Detection
21.Learning to Localize Through Compressed Binary Maps
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
這篇同樣發表在CVPR2018上的論文,解決了在自動駕駛環境中從點雲中進行實時3D物體檢測的問題。通過從鳥瞰圖(BEV)中表示場景,更有效地利用3D數據,Uber團隊提出了PIXOR,一種無提議的單級檢測器,輸出從像素方式神經網絡預測解碼的定向3D對象估計。輸入表示,網絡架構和模型優化專門用於平衡高精度和實時效率,並在兩個數據集上驗證了PIXOR:KITTI BEV物體檢測基準和大規模3D車輛檢測基準。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_PIXOR_Real-Time_3D_CVPR_2018_paper.pdf
6.Hierarchical Recurrent Attention Networks for Structured Online Maps
除此之外,Uber團隊也解決了從稀疏3D點雲提取在線道路網絡的問題。該方法受註釋器構建車道圖的啟發,首先確定有多少車道,然後依次繪製每個車道。他們開發了一個分級循環網絡,它通過輸出結構化折線來處理車道邊界的初始區域並完全跟蹤它們。在90公里長的高速公路上,證明了該方法的有效性。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Homayounfar_Hierarchical_Recurrent_Attention_CVPR_2018_paper.pdf
7.Deep Parametric Continuous Convolutional Neural Networks
一種對象實例的半自動註釋方法,Uber打破了將對象分割視為像素標註問題,而是將其轉換為多邊形預測任務,模仿大多數當前數據集的註釋方式。用該方法將圖像裁剪作為輸入,並順序生成對象的多邊形頂點。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Deep_Parametric_Continuous_CVPR_2018_paper.pdf
8.SBNet: Sparse Blocks Network for Fast Inference
2018年,Uber團隊通過改進深度卷積神經網絡(CNN)得到稀疏卷積算法,驗證了稀疏CNN對基於LiDAR的3D物體檢測的有效性。
論文下載鏈接:
https://arxiv.org/abs/1801.02108
9.Fast and Furious: Real Time End-to-End 3D Detection, Tracking and Motion Forecasting with a Single Convolutional Net
Uber在一篇論文中提出了一種新的深度神經網絡,能夠在給定3D傳感器接受的數據下共同推理出3D檢測,跟蹤和運動預測。通過共同推理這些任務,對於遮擋以及範圍內的稀疏數據更加穩健。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Luo_Fast_and_Furious_CVPR_2018_paper.pdf
10. End-to-End Deep Structured Models for Drawing Crosswalks
在一篇發表於ECCV2018的論文中,Uber解決了從LiDAR和攝像機圖像中檢測人行橫道的問題。為了實現這一目標,給定了多個LiDAR掃描和相應的圖像,將兩個輸入投影到地面上以產生場景的俯視圖。然後,利用卷積神經網絡提取關於人行橫道位置的語義線索。將這些與來自免費可用地圖(例如,OpenStreetMaps)的道路中心線結合使用,以解決繪製最終人行橫道邊界的結構化優化問題。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
11.Deep Continuous Fusion for Multi-Sensor 3D Object Detection
camera圖像和雷達俯視圖分別用ResNet提取不通尺度特徵的,將camera圖像提取的多尺度特徵進行融合,經過本文設計的“連續融合層”以融合到BEV的不通尺度的特徵中,學到的特徵經個兩個固定尺度的anchor,每個尺度兩個方向(0,90°)NMS獲取最終的3D目標檢測。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
12.Efficient Convolutions for Real-Time Semantic Segmentation of 3D Point Clouds
Uber發明了一種新穎的方法,使用深度神經網絡實時處理點雲,採用簡單佔用網格的2D表示,並生成細粒度的3D分割。
論文下載鏈接:
http://www.cs.toronto.edu/~wenjie/papers/3dv18.pdf
13.Learning to Localize Using a LiDAR Intensity Map
在本文中,Uber團隊為自動駕駛汽車提出了一種實時,與校準無關且有效的定位系統。該方法學習將在線LiDAR掃描和強度圖嵌入到聯合深度嵌入空間中。然後通過嵌入之間的有效卷積匹配來進行定位。該完整系統可以在15Hz下實時運行,同時在不同的LiDAR傳感器和環境中實現釐米級精度。
論文下載鏈接:
http://proceedings.mlr.press/v87/barsan18a/barsan18a.pdf
14.IntentNet: Learning to Predict Intention from Raw Sensor Data
在本文中,Uber團隊開發了一個單級探測器和預報器,它利用了LiDAR傳感器產生的3D點雲以及環境的動態圖。該多任務模型比單獨的模塊具有更高的精度,同時節省了計算,這對於減少自動駕駛應用中的反應時間至關重要。
論文下載鏈接:
http://proceedings.mlr.press/v87/casas18a/casas18a.pdf
15.HDNET: Exploiting HD Maps for 3D Object Detection
論文下載鏈接:
http://proceedings.mlr.press/v87/yang18b/yang18b.pdf
16.Deep Multi-Sensor Lane Detection
論文下載鏈接:
https://arxiv.org/abs/1905.01555
17.Graph HyperNetworks for Neural Architecture Search
論文下載鏈接:
https://openreview.net/forum?id=rkgW0oA9FX
18.DeepSignals: Predicting Intent of Drivers Through Visual Signals
論文下載鏈接:
https://www.cs.toronto.edu/~urtasun/publications/frossard_etal_icra19.pdf
19.Deep Rigid Instance Scene Flow
20.Multi-Task Multi-Sensor Fusion for 3D Object Detection
21.Learning to Localize Through Compressed Binary Maps
22. Convolutional Recurrent Network for Road Boundary Extraction
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
這篇同樣發表在CVPR2018上的論文,解決了在自動駕駛環境中從點雲中進行實時3D物體檢測的問題。通過從鳥瞰圖(BEV)中表示場景,更有效地利用3D數據,Uber團隊提出了PIXOR,一種無提議的單級檢測器,輸出從像素方式神經網絡預測解碼的定向3D對象估計。輸入表示,網絡架構和模型優化專門用於平衡高精度和實時效率,並在兩個數據集上驗證了PIXOR:KITTI BEV物體檢測基準和大規模3D車輛檢測基準。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_PIXOR_Real-Time_3D_CVPR_2018_paper.pdf
6.Hierarchical Recurrent Attention Networks for Structured Online Maps
除此之外,Uber團隊也解決了從稀疏3D點雲提取在線道路網絡的問題。該方法受註釋器構建車道圖的啟發,首先確定有多少車道,然後依次繪製每個車道。他們開發了一個分級循環網絡,它通過輸出結構化折線來處理車道邊界的初始區域並完全跟蹤它們。在90公里長的高速公路上,證明了該方法的有效性。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Homayounfar_Hierarchical_Recurrent_Attention_CVPR_2018_paper.pdf
7.Deep Parametric Continuous Convolutional Neural Networks
一種對象實例的半自動註釋方法,Uber打破了將對象分割視為像素標註問題,而是將其轉換為多邊形預測任務,模仿大多數當前數據集的註釋方式。用該方法將圖像裁剪作為輸入,並順序生成對象的多邊形頂點。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Deep_Parametric_Continuous_CVPR_2018_paper.pdf
8.SBNet: Sparse Blocks Network for Fast Inference
2018年,Uber團隊通過改進深度卷積神經網絡(CNN)得到稀疏卷積算法,驗證了稀疏CNN對基於LiDAR的3D物體檢測的有效性。
論文下載鏈接:
https://arxiv.org/abs/1801.02108
9.Fast and Furious: Real Time End-to-End 3D Detection, Tracking and Motion Forecasting with a Single Convolutional Net
Uber在一篇論文中提出了一種新的深度神經網絡,能夠在給定3D傳感器接受的數據下共同推理出3D檢測,跟蹤和運動預測。通過共同推理這些任務,對於遮擋以及範圍內的稀疏數據更加穩健。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Luo_Fast_and_Furious_CVPR_2018_paper.pdf
10. End-to-End Deep Structured Models for Drawing Crosswalks
在一篇發表於ECCV2018的論文中,Uber解決了從LiDAR和攝像機圖像中檢測人行橫道的問題。為了實現這一目標,給定了多個LiDAR掃描和相應的圖像,將兩個輸入投影到地面上以產生場景的俯視圖。然後,利用卷積神經網絡提取關於人行橫道位置的語義線索。將這些與來自免費可用地圖(例如,OpenStreetMaps)的道路中心線結合使用,以解決繪製最終人行橫道邊界的結構化優化問題。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
11.Deep Continuous Fusion for Multi-Sensor 3D Object Detection
camera圖像和雷達俯視圖分別用ResNet提取不通尺度特徵的,將camera圖像提取的多尺度特徵進行融合,經過本文設計的“連續融合層”以融合到BEV的不通尺度的特徵中,學到的特徵經個兩個固定尺度的anchor,每個尺度兩個方向(0,90°)NMS獲取最終的3D目標檢測。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
12.Efficient Convolutions for Real-Time Semantic Segmentation of 3D Point Clouds
Uber發明了一種新穎的方法,使用深度神經網絡實時處理點雲,採用簡單佔用網格的2D表示,並生成細粒度的3D分割。
論文下載鏈接:
http://www.cs.toronto.edu/~wenjie/papers/3dv18.pdf
13.Learning to Localize Using a LiDAR Intensity Map
在本文中,Uber團隊為自動駕駛汽車提出了一種實時,與校準無關且有效的定位系統。該方法學習將在線LiDAR掃描和強度圖嵌入到聯合深度嵌入空間中。然後通過嵌入之間的有效卷積匹配來進行定位。該完整系統可以在15Hz下實時運行,同時在不同的LiDAR傳感器和環境中實現釐米級精度。
論文下載鏈接:
http://proceedings.mlr.press/v87/barsan18a/barsan18a.pdf
14.IntentNet: Learning to Predict Intention from Raw Sensor Data
在本文中,Uber團隊開發了一個單級探測器和預報器,它利用了LiDAR傳感器產生的3D點雲以及環境的動態圖。該多任務模型比單獨的模塊具有更高的精度,同時節省了計算,這對於減少自動駕駛應用中的反應時間至關重要。
論文下載鏈接:
http://proceedings.mlr.press/v87/casas18a/casas18a.pdf
15.HDNET: Exploiting HD Maps for 3D Object Detection
論文下載鏈接:
http://proceedings.mlr.press/v87/yang18b/yang18b.pdf
16.Deep Multi-Sensor Lane Detection
論文下載鏈接:
https://arxiv.org/abs/1905.01555
17.Graph HyperNetworks for Neural Architecture Search
論文下載鏈接:
https://openreview.net/forum?id=rkgW0oA9FX
18.DeepSignals: Predicting Intent of Drivers Through Visual Signals
論文下載鏈接:
https://www.cs.toronto.edu/~urtasun/publications/frossard_etal_icra19.pdf
19.Deep Rigid Instance Scene Flow
20.Multi-Task Multi-Sensor Fusion for 3D Object Detection
21.Learning to Localize Through Compressed Binary Maps
22. Convolutional Recurrent Network for Road Boundary Extraction
23. UPSNet: A Unified Panoptic Segmentation Network
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
這篇同樣發表在CVPR2018上的論文,解決了在自動駕駛環境中從點雲中進行實時3D物體檢測的問題。通過從鳥瞰圖(BEV)中表示場景,更有效地利用3D數據,Uber團隊提出了PIXOR,一種無提議的單級檢測器,輸出從像素方式神經網絡預測解碼的定向3D對象估計。輸入表示,網絡架構和模型優化專門用於平衡高精度和實時效率,並在兩個數據集上驗證了PIXOR:KITTI BEV物體檢測基準和大規模3D車輛檢測基準。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_PIXOR_Real-Time_3D_CVPR_2018_paper.pdf
6.Hierarchical Recurrent Attention Networks for Structured Online Maps
除此之外,Uber團隊也解決了從稀疏3D點雲提取在線道路網絡的問題。該方法受註釋器構建車道圖的啟發,首先確定有多少車道,然後依次繪製每個車道。他們開發了一個分級循環網絡,它通過輸出結構化折線來處理車道邊界的初始區域並完全跟蹤它們。在90公里長的高速公路上,證明了該方法的有效性。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Homayounfar_Hierarchical_Recurrent_Attention_CVPR_2018_paper.pdf
7.Deep Parametric Continuous Convolutional Neural Networks
一種對象實例的半自動註釋方法,Uber打破了將對象分割視為像素標註問題,而是將其轉換為多邊形預測任務,模仿大多數當前數據集的註釋方式。用該方法將圖像裁剪作為輸入,並順序生成對象的多邊形頂點。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Deep_Parametric_Continuous_CVPR_2018_paper.pdf
8.SBNet: Sparse Blocks Network for Fast Inference
2018年,Uber團隊通過改進深度卷積神經網絡(CNN)得到稀疏卷積算法,驗證了稀疏CNN對基於LiDAR的3D物體檢測的有效性。
論文下載鏈接:
https://arxiv.org/abs/1801.02108
9.Fast and Furious: Real Time End-to-End 3D Detection, Tracking and Motion Forecasting with a Single Convolutional Net
Uber在一篇論文中提出了一種新的深度神經網絡,能夠在給定3D傳感器接受的數據下共同推理出3D檢測,跟蹤和運動預測。通過共同推理這些任務,對於遮擋以及範圍內的稀疏數據更加穩健。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Luo_Fast_and_Furious_CVPR_2018_paper.pdf
10. End-to-End Deep Structured Models for Drawing Crosswalks
在一篇發表於ECCV2018的論文中,Uber解決了從LiDAR和攝像機圖像中檢測人行橫道的問題。為了實現這一目標,給定了多個LiDAR掃描和相應的圖像,將兩個輸入投影到地面上以產生場景的俯視圖。然後,利用卷積神經網絡提取關於人行橫道位置的語義線索。將這些與來自免費可用地圖(例如,OpenStreetMaps)的道路中心線結合使用,以解決繪製最終人行橫道邊界的結構化優化問題。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
11.Deep Continuous Fusion for Multi-Sensor 3D Object Detection
camera圖像和雷達俯視圖分別用ResNet提取不通尺度特徵的,將camera圖像提取的多尺度特徵進行融合,經過本文設計的“連續融合層”以融合到BEV的不通尺度的特徵中,學到的特徵經個兩個固定尺度的anchor,每個尺度兩個方向(0,90°)NMS獲取最終的3D目標檢測。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
12.Efficient Convolutions for Real-Time Semantic Segmentation of 3D Point Clouds
Uber發明了一種新穎的方法,使用深度神經網絡實時處理點雲,採用簡單佔用網格的2D表示,並生成細粒度的3D分割。
論文下載鏈接:
http://www.cs.toronto.edu/~wenjie/papers/3dv18.pdf
13.Learning to Localize Using a LiDAR Intensity Map
在本文中,Uber團隊為自動駕駛汽車提出了一種實時,與校準無關且有效的定位系統。該方法學習將在線LiDAR掃描和強度圖嵌入到聯合深度嵌入空間中。然後通過嵌入之間的有效卷積匹配來進行定位。該完整系統可以在15Hz下實時運行,同時在不同的LiDAR傳感器和環境中實現釐米級精度。
論文下載鏈接:
http://proceedings.mlr.press/v87/barsan18a/barsan18a.pdf
14.IntentNet: Learning to Predict Intention from Raw Sensor Data
在本文中,Uber團隊開發了一個單級探測器和預報器,它利用了LiDAR傳感器產生的3D點雲以及環境的動態圖。該多任務模型比單獨的模塊具有更高的精度,同時節省了計算,這對於減少自動駕駛應用中的反應時間至關重要。
論文下載鏈接:
http://proceedings.mlr.press/v87/casas18a/casas18a.pdf
15.HDNET: Exploiting HD Maps for 3D Object Detection
論文下載鏈接:
http://proceedings.mlr.press/v87/yang18b/yang18b.pdf
16.Deep Multi-Sensor Lane Detection
論文下載鏈接:
https://arxiv.org/abs/1905.01555
17.Graph HyperNetworks for Neural Architecture Search
論文下載鏈接:
https://openreview.net/forum?id=rkgW0oA9FX
18.DeepSignals: Predicting Intent of Drivers Through Visual Signals
論文下載鏈接:
https://www.cs.toronto.edu/~urtasun/publications/frossard_etal_icra19.pdf
19.Deep Rigid Instance Scene Flow
20.Multi-Task Multi-Sensor Fusion for 3D Object Detection
21.Learning to Localize Through Compressed Binary Maps
22. Convolutional Recurrent Network for Road Boundary Extraction
23. UPSNet: A Unified Panoptic Segmentation Network
24.End-to-End Interpretable Neural Motion Planner
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
這篇同樣發表在CVPR2018上的論文,解決了在自動駕駛環境中從點雲中進行實時3D物體檢測的問題。通過從鳥瞰圖(BEV)中表示場景,更有效地利用3D數據,Uber團隊提出了PIXOR,一種無提議的單級檢測器,輸出從像素方式神經網絡預測解碼的定向3D對象估計。輸入表示,網絡架構和模型優化專門用於平衡高精度和實時效率,並在兩個數據集上驗證了PIXOR:KITTI BEV物體檢測基準和大規模3D車輛檢測基準。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_PIXOR_Real-Time_3D_CVPR_2018_paper.pdf
6.Hierarchical Recurrent Attention Networks for Structured Online Maps
除此之外,Uber團隊也解決了從稀疏3D點雲提取在線道路網絡的問題。該方法受註釋器構建車道圖的啟發,首先確定有多少車道,然後依次繪製每個車道。他們開發了一個分級循環網絡,它通過輸出結構化折線來處理車道邊界的初始區域並完全跟蹤它們。在90公里長的高速公路上,證明了該方法的有效性。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Homayounfar_Hierarchical_Recurrent_Attention_CVPR_2018_paper.pdf
7.Deep Parametric Continuous Convolutional Neural Networks
一種對象實例的半自動註釋方法,Uber打破了將對象分割視為像素標註問題,而是將其轉換為多邊形預測任務,模仿大多數當前數據集的註釋方式。用該方法將圖像裁剪作為輸入,並順序生成對象的多邊形頂點。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Deep_Parametric_Continuous_CVPR_2018_paper.pdf
8.SBNet: Sparse Blocks Network for Fast Inference
2018年,Uber團隊通過改進深度卷積神經網絡(CNN)得到稀疏卷積算法,驗證了稀疏CNN對基於LiDAR的3D物體檢測的有效性。
論文下載鏈接:
https://arxiv.org/abs/1801.02108
9.Fast and Furious: Real Time End-to-End 3D Detection, Tracking and Motion Forecasting with a Single Convolutional Net
Uber在一篇論文中提出了一種新的深度神經網絡,能夠在給定3D傳感器接受的數據下共同推理出3D檢測,跟蹤和運動預測。通過共同推理這些任務,對於遮擋以及範圍內的稀疏數據更加穩健。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Luo_Fast_and_Furious_CVPR_2018_paper.pdf
10. End-to-End Deep Structured Models for Drawing Crosswalks
在一篇發表於ECCV2018的論文中,Uber解決了從LiDAR和攝像機圖像中檢測人行橫道的問題。為了實現這一目標,給定了多個LiDAR掃描和相應的圖像,將兩個輸入投影到地面上以產生場景的俯視圖。然後,利用卷積神經網絡提取關於人行橫道位置的語義線索。將這些與來自免費可用地圖(例如,OpenStreetMaps)的道路中心線結合使用,以解決繪製最終人行橫道邊界的結構化優化問題。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
11.Deep Continuous Fusion for Multi-Sensor 3D Object Detection
camera圖像和雷達俯視圖分別用ResNet提取不通尺度特徵的,將camera圖像提取的多尺度特徵進行融合,經過本文設計的“連續融合層”以融合到BEV的不通尺度的特徵中,學到的特徵經個兩個固定尺度的anchor,每個尺度兩個方向(0,90°)NMS獲取最終的3D目標檢測。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
12.Efficient Convolutions for Real-Time Semantic Segmentation of 3D Point Clouds
Uber發明了一種新穎的方法,使用深度神經網絡實時處理點雲,採用簡單佔用網格的2D表示,並生成細粒度的3D分割。
論文下載鏈接:
http://www.cs.toronto.edu/~wenjie/papers/3dv18.pdf
13.Learning to Localize Using a LiDAR Intensity Map
在本文中,Uber團隊為自動駕駛汽車提出了一種實時,與校準無關且有效的定位系統。該方法學習將在線LiDAR掃描和強度圖嵌入到聯合深度嵌入空間中。然後通過嵌入之間的有效卷積匹配來進行定位。該完整系統可以在15Hz下實時運行,同時在不同的LiDAR傳感器和環境中實現釐米級精度。
論文下載鏈接:
http://proceedings.mlr.press/v87/barsan18a/barsan18a.pdf
14.IntentNet: Learning to Predict Intention from Raw Sensor Data
在本文中,Uber團隊開發了一個單級探測器和預報器,它利用了LiDAR傳感器產生的3D點雲以及環境的動態圖。該多任務模型比單獨的模塊具有更高的精度,同時節省了計算,這對於減少自動駕駛應用中的反應時間至關重要。
論文下載鏈接:
http://proceedings.mlr.press/v87/casas18a/casas18a.pdf
15.HDNET: Exploiting HD Maps for 3D Object Detection
論文下載鏈接:
http://proceedings.mlr.press/v87/yang18b/yang18b.pdf
16.Deep Multi-Sensor Lane Detection
論文下載鏈接:
https://arxiv.org/abs/1905.01555
17.Graph HyperNetworks for Neural Architecture Search
論文下載鏈接:
https://openreview.net/forum?id=rkgW0oA9FX
18.DeepSignals: Predicting Intent of Drivers Through Visual Signals
論文下載鏈接:
https://www.cs.toronto.edu/~urtasun/publications/frossard_etal_icra19.pdf
19.Deep Rigid Instance Scene Flow
20.Multi-Task Multi-Sensor Fusion for 3D Object Detection
21.Learning to Localize Through Compressed Binary Maps
22. Convolutional Recurrent Network for Road Boundary Extraction
23. UPSNet: A Unified Panoptic Segmentation Network
24.End-to-End Interpretable Neural Motion Planner
本文提出了一種神經運動規劃器,用於學習在複雜的城市場景中自主駕駛,包括交通燈處理,屈服以及與多個道路使用者的交互。Uber利用該方法在北美幾個城市得到的實際駕駛數據中驗證了其有效性。
論文下載鏈接:
http://www.cs.toronto.edu/~byang/papers/nmp.pdf
25.Exploiting Sparse Semantic HD Maps for Self-Driving Vehicle Localization
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
這篇同樣發表在CVPR2018上的論文,解決了在自動駕駛環境中從點雲中進行實時3D物體檢測的問題。通過從鳥瞰圖(BEV)中表示場景,更有效地利用3D數據,Uber團隊提出了PIXOR,一種無提議的單級檢測器,輸出從像素方式神經網絡預測解碼的定向3D對象估計。輸入表示,網絡架構和模型優化專門用於平衡高精度和實時效率,並在兩個數據集上驗證了PIXOR:KITTI BEV物體檢測基準和大規模3D車輛檢測基準。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_PIXOR_Real-Time_3D_CVPR_2018_paper.pdf
6.Hierarchical Recurrent Attention Networks for Structured Online Maps
除此之外,Uber團隊也解決了從稀疏3D點雲提取在線道路網絡的問題。該方法受註釋器構建車道圖的啟發,首先確定有多少車道,然後依次繪製每個車道。他們開發了一個分級循環網絡,它通過輸出結構化折線來處理車道邊界的初始區域並完全跟蹤它們。在90公里長的高速公路上,證明了該方法的有效性。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Homayounfar_Hierarchical_Recurrent_Attention_CVPR_2018_paper.pdf
7.Deep Parametric Continuous Convolutional Neural Networks
一種對象實例的半自動註釋方法,Uber打破了將對象分割視為像素標註問題,而是將其轉換為多邊形預測任務,模仿大多數當前數據集的註釋方式。用該方法將圖像裁剪作為輸入,並順序生成對象的多邊形頂點。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Deep_Parametric_Continuous_CVPR_2018_paper.pdf
8.SBNet: Sparse Blocks Network for Fast Inference
2018年,Uber團隊通過改進深度卷積神經網絡(CNN)得到稀疏卷積算法,驗證了稀疏CNN對基於LiDAR的3D物體檢測的有效性。
論文下載鏈接:
https://arxiv.org/abs/1801.02108
9.Fast and Furious: Real Time End-to-End 3D Detection, Tracking and Motion Forecasting with a Single Convolutional Net
Uber在一篇論文中提出了一種新的深度神經網絡,能夠在給定3D傳感器接受的數據下共同推理出3D檢測,跟蹤和運動預測。通過共同推理這些任務,對於遮擋以及範圍內的稀疏數據更加穩健。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Luo_Fast_and_Furious_CVPR_2018_paper.pdf
10. End-to-End Deep Structured Models for Drawing Crosswalks
在一篇發表於ECCV2018的論文中,Uber解決了從LiDAR和攝像機圖像中檢測人行橫道的問題。為了實現這一目標,給定了多個LiDAR掃描和相應的圖像,將兩個輸入投影到地面上以產生場景的俯視圖。然後,利用卷積神經網絡提取關於人行橫道位置的語義線索。將這些與來自免費可用地圖(例如,OpenStreetMaps)的道路中心線結合使用,以解決繪製最終人行橫道邊界的結構化優化問題。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
11.Deep Continuous Fusion for Multi-Sensor 3D Object Detection
camera圖像和雷達俯視圖分別用ResNet提取不通尺度特徵的,將camera圖像提取的多尺度特徵進行融合,經過本文設計的“連續融合層”以融合到BEV的不通尺度的特徵中,學到的特徵經個兩個固定尺度的anchor,每個尺度兩個方向(0,90°)NMS獲取最終的3D目標檢測。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
12.Efficient Convolutions for Real-Time Semantic Segmentation of 3D Point Clouds
Uber發明了一種新穎的方法,使用深度神經網絡實時處理點雲,採用簡單佔用網格的2D表示,並生成細粒度的3D分割。
論文下載鏈接:
http://www.cs.toronto.edu/~wenjie/papers/3dv18.pdf
13.Learning to Localize Using a LiDAR Intensity Map
在本文中,Uber團隊為自動駕駛汽車提出了一種實時,與校準無關且有效的定位系統。該方法學習將在線LiDAR掃描和強度圖嵌入到聯合深度嵌入空間中。然後通過嵌入之間的有效卷積匹配來進行定位。該完整系統可以在15Hz下實時運行,同時在不同的LiDAR傳感器和環境中實現釐米級精度。
論文下載鏈接:
http://proceedings.mlr.press/v87/barsan18a/barsan18a.pdf
14.IntentNet: Learning to Predict Intention from Raw Sensor Data
在本文中,Uber團隊開發了一個單級探測器和預報器,它利用了LiDAR傳感器產生的3D點雲以及環境的動態圖。該多任務模型比單獨的模塊具有更高的精度,同時節省了計算,這對於減少自動駕駛應用中的反應時間至關重要。
論文下載鏈接:
http://proceedings.mlr.press/v87/casas18a/casas18a.pdf
15.HDNET: Exploiting HD Maps for 3D Object Detection
論文下載鏈接:
http://proceedings.mlr.press/v87/yang18b/yang18b.pdf
16.Deep Multi-Sensor Lane Detection
論文下載鏈接:
https://arxiv.org/abs/1905.01555
17.Graph HyperNetworks for Neural Architecture Search
論文下載鏈接:
https://openreview.net/forum?id=rkgW0oA9FX
18.DeepSignals: Predicting Intent of Drivers Through Visual Signals
論文下載鏈接:
https://www.cs.toronto.edu/~urtasun/publications/frossard_etal_icra19.pdf
19.Deep Rigid Instance Scene Flow
20.Multi-Task Multi-Sensor Fusion for 3D Object Detection
21.Learning to Localize Through Compressed Binary Maps
22. Convolutional Recurrent Network for Road Boundary Extraction
23. UPSNet: A Unified Panoptic Segmentation Network
24.End-to-End Interpretable Neural Motion Planner
本文提出了一種神經運動規劃器,用於學習在複雜的城市場景中自主駕駛,包括交通燈處理,屈服以及與多個道路使用者的交互。Uber利用該方法在北美幾個城市得到的實際駕駛數據中驗證了其有效性。
論文下載鏈接:
http://www.cs.toronto.edu/~byang/papers/nmp.pdf
25.Exploiting Sparse Semantic HD Maps for Self-Driving Vehicle Localization
本文提出了一種新的語義定位算法,該算法利用多個傳感器,精度可達幾釐米。該方法不需要對世界的外觀有詳細的瞭解,而且地圖存儲量比傳統幾何和基於激光雷達強度的定位器使用的地圖少很多。
論文下載鏈接:
https://arxiv.org/abs/1908.03274
【歡迎大家提供行業新聞熱點,商業合作請聯繫:18562613430】
本文整理了Uber的技術團隊“先進技術小組”(Advanced Technologies Group,ATG)在頂級會議和期刊上發表的關於計算機視覺,機器學習和機器人技術的自動駕駛車輛研究論文。
1.DeepRoad Mapper: Extracting Road Topology From Aerial Images
本篇文章發表於2017年,被ICCV 2017 收錄。本文提出了一種直接從俯視圖像中估計道路拓撲結構的方法,這種方法不需要用昂貴的傳感器,提供了一個覆蓋範圍廣、價格合理的解決方案。為了實現這一目標,利用深度學習對俯視圖像進行初步分割,通過算法將提取出的道路拓撲中的缺失部分連接起來,並作為一個可以有效解決的最短路徑問題。現在看來,這種方法可以粗略的進行路線規劃。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
2.End-to-end Learning of Multi-sensor 3D Tracking by Detection
2018年,Uber也嘗試了用端到端的方法,這篇論文提出了一種新的檢測跟蹤方法,可以同時利用攝像機和激光雷達的數據來產生非常精確的三維軌跡。針對這一目標,可以將問題表述為一個精確求解的線性規劃,端到端的檢測和匹配。在Kitti數據集中評估模型,並顯示出非常有競爭力的結果。
論文下載地址:
https://arxiv.org/pdf/1806.11534.pdf
3.Learning to Reweight Examples for Robust Deep Learning
為了處理數據集的偏差和標籤噪音問題,Uber團隊也提出了一種新穎的元學習算法,該算法學習基於其梯度方向為訓練樣本分配權重。該方法可以在任何類型的深度網絡上輕鬆實現,不需要任何額外的超參數調整,並且在類別不平衡和損壞的標籤問題上,實現了不錯的性能。
論文下載地址:
https://arxiv.org/pdf/1803.09050.pdf
4.Matching Adversarial Networks
在CVPR 2018上,Uber團隊也構建了匹配對抗網絡來解決CGAN應用於監督任務上的弊端。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Mattyus_Matching_Adversarial_Networks_CVPR_2018_paper.pdf
5.PIXOR: Real-time 3D Object Detection from Point Clouds
這篇同樣發表在CVPR2018上的論文,解決了在自動駕駛環境中從點雲中進行實時3D物體檢測的問題。通過從鳥瞰圖(BEV)中表示場景,更有效地利用3D數據,Uber團隊提出了PIXOR,一種無提議的單級檢測器,輸出從像素方式神經網絡預測解碼的定向3D對象估計。輸入表示,網絡架構和模型優化專門用於平衡高精度和實時效率,並在兩個數據集上驗證了PIXOR:KITTI BEV物體檢測基準和大規模3D車輛檢測基準。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_PIXOR_Real-Time_3D_CVPR_2018_paper.pdf
6.Hierarchical Recurrent Attention Networks for Structured Online Maps
除此之外,Uber團隊也解決了從稀疏3D點雲提取在線道路網絡的問題。該方法受註釋器構建車道圖的啟發,首先確定有多少車道,然後依次繪製每個車道。他們開發了一個分級循環網絡,它通過輸出結構化折線來處理車道邊界的初始區域並完全跟蹤它們。在90公里長的高速公路上,證明了該方法的有效性。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Homayounfar_Hierarchical_Recurrent_Attention_CVPR_2018_paper.pdf
7.Deep Parametric Continuous Convolutional Neural Networks
一種對象實例的半自動註釋方法,Uber打破了將對象分割視為像素標註問題,而是將其轉換為多邊形預測任務,模仿大多數當前數據集的註釋方式。用該方法將圖像裁剪作為輸入,並順序生成對象的多邊形頂點。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Deep_Parametric_Continuous_CVPR_2018_paper.pdf
8.SBNet: Sparse Blocks Network for Fast Inference
2018年,Uber團隊通過改進深度卷積神經網絡(CNN)得到稀疏卷積算法,驗證了稀疏CNN對基於LiDAR的3D物體檢測的有效性。
論文下載鏈接:
https://arxiv.org/abs/1801.02108
9.Fast and Furious: Real Time End-to-End 3D Detection, Tracking and Motion Forecasting with a Single Convolutional Net
Uber在一篇論文中提出了一種新的深度神經網絡,能夠在給定3D傳感器接受的數據下共同推理出3D檢測,跟蹤和運動預測。通過共同推理這些任務,對於遮擋以及範圍內的稀疏數據更加穩健。
論文下載鏈接:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Luo_Fast_and_Furious_CVPR_2018_paper.pdf
10. End-to-End Deep Structured Models for Drawing Crosswalks
在一篇發表於ECCV2018的論文中,Uber解決了從LiDAR和攝像機圖像中檢測人行橫道的問題。為了實現這一目標,給定了多個LiDAR掃描和相應的圖像,將兩個輸入投影到地面上以產生場景的俯視圖。然後,利用卷積神經網絡提取關於人行橫道位置的語義線索。將這些與來自免費可用地圖(例如,OpenStreetMaps)的道路中心線結合使用,以解決繪製最終人行橫道邊界的結構化優化問題。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
11.Deep Continuous Fusion for Multi-Sensor 3D Object Detection
camera圖像和雷達俯視圖分別用ResNet提取不通尺度特徵的,將camera圖像提取的多尺度特徵進行融合,經過本文設計的“連續融合層”以融合到BEV的不通尺度的特徵中,學到的特徵經個兩個固定尺度的anchor,每個尺度兩個方向(0,90°)NMS獲取最終的3D目標檢測。
論文下載鏈接:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Justin_Liang_End-to-End_Deep_Structured_ECCV_2018_paper.pdf
12.Efficient Convolutions for Real-Time Semantic Segmentation of 3D Point Clouds
Uber發明了一種新穎的方法,使用深度神經網絡實時處理點雲,採用簡單佔用網格的2D表示,並生成細粒度的3D分割。
論文下載鏈接:
http://www.cs.toronto.edu/~wenjie/papers/3dv18.pdf
13.Learning to Localize Using a LiDAR Intensity Map
在本文中,Uber團隊為自動駕駛汽車提出了一種實時,與校準無關且有效的定位系統。該方法學習將在線LiDAR掃描和強度圖嵌入到聯合深度嵌入空間中。然後通過嵌入之間的有效卷積匹配來進行定位。該完整系統可以在15Hz下實時運行,同時在不同的LiDAR傳感器和環境中實現釐米級精度。
論文下載鏈接:
http://proceedings.mlr.press/v87/barsan18a/barsan18a.pdf
14.IntentNet: Learning to Predict Intention from Raw Sensor Data
在本文中,Uber團隊開發了一個單級探測器和預報器,它利用了LiDAR傳感器產生的3D點雲以及環境的動態圖。該多任務模型比單獨的模塊具有更高的精度,同時節省了計算,這對於減少自動駕駛應用中的反應時間至關重要。
論文下載鏈接:
http://proceedings.mlr.press/v87/casas18a/casas18a.pdf
15.HDNET: Exploiting HD Maps for 3D Object Detection
論文下載鏈接:
http://proceedings.mlr.press/v87/yang18b/yang18b.pdf
16.Deep Multi-Sensor Lane Detection
論文下載鏈接:
https://arxiv.org/abs/1905.01555
17.Graph HyperNetworks for Neural Architecture Search
論文下載鏈接:
https://openreview.net/forum?id=rkgW0oA9FX
18.DeepSignals: Predicting Intent of Drivers Through Visual Signals
論文下載鏈接:
https://www.cs.toronto.edu/~urtasun/publications/frossard_etal_icra19.pdf
19.Deep Rigid Instance Scene Flow
20.Multi-Task Multi-Sensor Fusion for 3D Object Detection
21.Learning to Localize Through Compressed Binary Maps
22. Convolutional Recurrent Network for Road Boundary Extraction
23. UPSNet: A Unified Panoptic Segmentation Network
24.End-to-End Interpretable Neural Motion Planner
本文提出了一種神經運動規劃器,用於學習在複雜的城市場景中自主駕駛,包括交通燈處理,屈服以及與多個道路使用者的交互。Uber利用該方法在北美幾個城市得到的實際駕駛數據中驗證了其有效性。
論文下載鏈接:
http://www.cs.toronto.edu/~byang/papers/nmp.pdf
25.Exploiting Sparse Semantic HD Maps for Self-Driving Vehicle Localization
本文提出了一種新的語義定位算法,該算法利用多個傳感器,精度可達幾釐米。該方法不需要對世界的外觀有詳細的瞭解,而且地圖存儲量比傳統幾何和基於激光雷達強度的定位器使用的地圖少很多。
論文下載鏈接:
https://arxiv.org/abs/1908.03274
【歡迎大家提供行業新聞熱點,商業合作請聯繫:18562613430】