본문 바로가기

Paper Review50

[ICCV 2019] ViSiL Fine-grained Spatio Temporal Video Similarity Learning Before Review 이번 리뷰는 Temporal Localization은 아니고 , Video Retreival에 관련한 논문을 가져왔습니다. Video Retreival을 간단하게 서술하면 Query 비디오를 던졌을 때 이와 유사한 비디오를 searching 하는 Task를 의미합니다. 사실 저도 Video Retrieval 논문은 이게 처음이라 내용을 서술할 때 부족한 부분이 있을 수 있습니다. 이 점 감안해서 읽어주시면 감사하겠습니다. Introduction 대부분의 Video 관련 논문의 Introduction은 비슷한 거 같습니다. 미디어 콘텐츠 시장의 발달로 인해 content-based video retrieval의 중요성이 날로 점점 증가하고 있다고 합니다. 현재 저희가 자주 애용하는.. 2021. 8. 6.
[CVPR 2018] Rethinking the Faster R-CNN Architecture for Temporal Action Localization Before Review 이번에도 Temporal Action Localization 논문 리뷰입니다. 18년도 CVPR에 나온 논문이며 , 저번에 리뷰한 R-C3D보다 발전된 네트워크라는 생각이 들었습니다. [CVPR 2016] Temporal Action Localizations in Untrimmed Videos via Multi-stage CNNs [CVPR 2016] Temporal Action Localization in Untrimmed Videos via Multi-stage CNNs Before Review 이번 리뷰는 Video 분야에서 Object Detection과 유사한 , Temporal Localization problem을 multi-stage CNN을 처음 도입해서 문제에 .. 2021. 7. 24.
[ICCV 2017] R-C3D Region Convolutional 3D Network for Temporal Activity Detection Before Review 이번 리뷰도 Temporal Action Localization 관련 논문으로 준비를 했고 , 저번 리뷰(S-CNN)의 후속 연구로 볼 수 있는 논문을 가져왔습니다. [CVPR 2016] Temporal Action Localization in Untrimmed Videos via Multi-stage CNNs [CVPR 2016] Temporal Action Localization in Untrimmed Videos via Multi-stage CNNs Before Review 이번 리뷰는 Video 분야에서 Object Detection과 유사한 , Temporal Localization problem을 multi-stage CNN을 처음 도입해서 문제에 접근한 Paper를 .. 2021. 7. 16.
[CVPR 2016] Temporal Action Localization in Untrimmed Videos via Multi-stage CNNs Before Review 이번 리뷰는 Video 분야에서 Object Detection과 유사한 , Temporal Localization problem을 multi-stage CNN을 처음 도입해서 문제에 접근한 Paper를 가져왔습니다. 논문에 이렇게 적혀 있었습니다.(To the best of our knowledge , our work is the first to exploit 3D ConvNets with multi-stage processes for temporal action localization in untrimmed long videos in the wild.) 제목에서 느낄 수 있는데 , Multi-stage의 구조를 제안하며 , 이는 Two-stage 기반의 Object Detect.. 2021. 7. 16.
[ICCV 2021] TSP : Temporally-Sensitive Pretraining of Video Encoders for Localization Tasks Before Review 본 Review를 본격적으로 진행하기 전에 trimmed Video , untrimmed Video가 무엇인지 잠깐 알아보고 가도록 하겠습니다. trimmed Video : Video에 ForeGround 영상만 존재하는 Video를 의미합니다. 즉 , action 부분을 담당하는 영상만 존재하게 되고 , action recognition 이런 곳에서 사용이 된다고 합니다. Untrimmed Video : Video에 ForeGround 영상과 BackGround 영상이 동시에 존재하는 Video를 의미합니다. 따라서 영상 속에 action 부분이 어디인지 판별하게 되는 Temporal Localization Task에 사용이 된다고 합니다. Introduction 비디오는 이미.. 2021. 7. 5.
[ICCV 2017] Focal Loss for Dense Object Detection Before Review object detection 관련 주제로 Review를 다루게 됐습니다. Focal Loss 같은 경우는 제가 학부 연구생 인턴을 진행할 때 Pedestrian Detection 개선 방법론으로 간단하게 알아만 봤던 주제인데, 이번 Review를 통해서 기존의 One-Stage Detector가 가지고 있던 문제점들이 어떤 식으로 개선이 됐는지 파악할 수 있게 되었습니다. Review 시작하도록 하겠습니다. Introduction 이 논문이 발표되는 시기에는 R-CNN 계열의 two-stage detector가 정확도 측면에서는 좋은 성능들을 보여주고 있었습니다. 이와 대비해서 one-stage detector는 two stage detector와 비교했을 때는 더 빠르고 간단.. 2021. 6. 28.