Data_study/Paper_Review 5

[논문 리뷰]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis

Neural Radiance Fields 희소한 이미지 뷰를 통해, 연속적인 Volumetic scence 함수를 최적화 하여 새로운 뷰를 합성하고 영상을 만들어냄. Algorithm 1) Fully connected deep network (non - convolutional) 2) input : a single continuous 5D coordinate (x,y,z,θ,φ) 3) output : volume density and view - dependent RGB color , 4D 4) volume rendering techniques => 복잡한 외관을 가진 장면을 사실적으로 렌더링하기 위해, NeRF를 효과적으로 최적화하는 방법을 설명하고 Neural Randering 및 뷰 합성에 대한 우..

[논문 리뷰] V2X 통신과 연계된 Lanelet 지도 기반의 자율주행 시스템

자율주행의 4가지 기술: 인지, 측위, 판단, 제어 1.인지 기술 : 카메라, 라이다 등 의 센서 데이터로부터 차량, 보행자, 표지판, 신호등, 차선 등의 정보들을 추출 2.측위 기술: GNSS, IMU 등의 측위 센서와 인지 센서의 정보를 융합하여 차량의 위치와 자세를 추정 3.판단 기술: 주변 상황에 대한 인식 정보를 바탕으로 목적지까지 이동하기 위하여 필요한 경로, 속도, 행동 등을 계획 제어 기술: 계획한 경로와 속도를 최대한 따르도록 종횡방향 제어 값을 계산 서론 •연구 배경 및 필요성 – 현황 Ø현재 대부분의 양산차의 운전자 보조 시스템은 2단계에 해당 ØIT/ 서비스 업체들은 4단계 달성을 목표로 연구를 진행하고 있음 Ø최근에는 일본의 혼다모터스에서 3단계 자율주행차 모델을 판매하기 시작 •..

[논문 리뷰] Search-based Local Path Planning for Connected Autonomous Vehicles in Urban Environments

Introduction 자율 주행의 증가로 복잡한 다양한 환경을 다룰 수 있는 알고리즘이 필요해졌다. 고속도로와 같은 환경이 아닌, 혼잡이 많은 시내 주행은 고려되는 다양한 과제가 필요하다. 타이트한 교통 구정을 무조건 따라야한다. (속도 제한, 신호, 차선) 자동차, 보행자, 물체 등등이 포함된 주변 다이나믹한 곡선을 예측해야한다. LiDAR, 카메라, 라이다와 같은 센서 기반 vision은 불확실한 환경요소를 다룰 필요가 있다. (불확실한 환경요소 : 객체의 일부만 보이거나 가려진 상황) 본 논문에는 5가지의 시나리오를 소개한다. 상대 차량이 본 차량의 기준 경로를 막고 있는 경우 이 경우는 보통 우회전 차선에 추월 차량이 정지할 때 발생한다. (이 상황에서 추월하는 것은 교통 규정을 위반하는 것이지..

[논문 리뷰] Multimodal Transformer for Unaligned Multimodal Language Sequences

과연 Multimodal 없이 하나의 분야 모델로 개발을 하여 성과를 높인다는게 옳은 것인가의 고민이 생겼다. 이미지 분석으로만 감성을 판단하고 자연어처리로만 우리 일상 생활의 의사소통을 주고 받는다는 것은 무조건 한계가 있을 것이다. 이런 한계를 깰 수 있는 것이 바로 multi modal이다. multi modal은 다양한 modality를 각 모델에 넣어서 학습시킨 후, 결과값을 concat시켜 학습하는 과정을 말한다. Transformer 모델을 활용하여 multi modal을 진행하는 논문을 리뷰해 보겠다. Multimodal Transformer for Unaligned Multimodal Language Sequences Yao-Hung Hubert Tsai, Shaojie Bai, Paul..

[논문리뷰]transformer:Attention Is All You Need

최근 핫한 chatgpt, Bert의 모든 것은 이 transformer에서부터 시작된 것이다. gpt계열을 transformer의 decoder부분을 Bert부분은 encoder부분만 사용하여 적합한 task를 해결하는데 사용한다. 보통 gpt계열은 decoder의 특성으로 generative model로 사용되고 bert는 보통 summarization이나 classification model로 활용된다. 이 transformer는 nlp분야에서 한 차원의 변화를 준 모델로 그 전에 있었던 RNN기반의 모델들의 단점을 보완하였다. https://arxiv.org/pdf/1706.03762.pdf Transformer : Attention is all you need Abstract 여기서 The do..