본문 바로가기

전체 글59

[ICCV 2021] Boundary-sensitive Pre-training for Temporal Localization in Videos Before Review 이번 리뷰는 Temporal Localization 논문으로 준비했습니다. 이전에 리뷰했던 TSP : Temporally-Sensitive Pretraining of Video Encoders for Localization Tasks 논문과 컨셉은 비슷하지만 접근 방식이 다른 방법론을 읽게 됐습니다. 문제 정의는 이전에 리뷰했던 논문과 동일합니다. 리뷰 시작하도록 하겠습니다. Introduction Untrimmed Video를 이해하기 위해서 비디오 분야에서는 Temporal Localization 연구가 활발히 이루어지고 있습니다. 이러한 상황에서 저자는 다음의 문제를 주장합니다. "Temporal Localization" Task는 시간의 흐름에 따른 Boundary에 민감.. 2022. 1. 26.
[CS231n] 02. Loss Functions and Optimization 지난 포스팅에서 다뤘던 Linear Classifier에 대해서 다시 한번 간단하게 얘기하면서 본 포스팅을 시작하도록 하겠습니다. Linear Classifier의 핵심은 어떤 복잡한 고차원의 특징 공간 내에서 서로 다른 클래스 간의 구분을 위한 선형의 결정 경계를 만들어주는 방법론이라 다루었습니다. 대충 수식으로 $w_{11}x_{1}+w_{12}x_{2}+w_{13}x_{3}+w_{14}x_{4}+b_{1}$ 이렇게 정의할 수 있었습니다.(특징 벡터가 4차원으로 정의되었을 때의 경우입니다.) 그렇다면 저 $w_{11},w_{12},w_{13},w_{14},b_{1}$ 이 녀석들은 어떻게 찾아야 할까요? $w_{11},w_{12},w_{13},w_{14},b_{1}$ 여기에 아무런 값이나 들어가면 우리.. 2022. 1. 26.
[CS231n] 01. Image Classification Pipeline CS231n의 시작은 컴퓨터 비전 분야에서 가장 흔하면서도 중요하게 여겨지는 Image Classification에 대한 내용으로 시작합니다. 컴퓨터에게 있어서 이미지 분류는 왜 어려운 걸까요? 인간이 사진을 보고 받아들이는 정보와 컴퓨터가 받아들이는 정보는 의미론적 차이(Semantic Gap)가 존재합니다. 우리가 고양이 사진을 보면 우리의 뇌는 어떠한 복잡한 처리를 거쳐서 판단을 내립니다. 이건 고양이다!! 하지만 컴퓨터가 보는 고양이 사진은 단순한 픽셀 정보만 담긴 행렬만을 받아들이게 됩니다. 더군다나 이미지 분류에 있어 컴퓨터가 다양한 변화에 강인하도록 설계하는 것은 더더욱 어려운 일입니다. 위의 사진을 보면 다양한 변화에 대해 인간은 쉽게 쉽게 구별을 할 수 있지만 이 작업은 컴퓨터에게 쉽지 .. 2022. 1. 25.
[ICCV 2019] BMN : Boundary-Matching Network for Temporal Action Proposal Generation Before Review 이번 리뷰는 Temporal Action Proposal로 비디오 내에 어느 구간에 action이 발생하는지 , event가 발생하는지를 예측하는 Task입니다. 이 Temporal Action Proposal Task는 [CVPR 2021] Self Supervised Learning for Semi-Supervised Temporal Action Proposal 지난번 Review에서 다룬 적이 있습니다. 이번에 준비한 논문은 Supervised기반으로 진행이 되며 , 당시에는 SOTA를 달성했고 여전히 Temporal Action Proposal 진영에서 Baseline으로 활용되는 논문입니다. 리뷰 시작하도록 하겠습니다. Introduction Video 진영에서 Obje.. 2022. 1. 6.
[AAAI 2018] Deep Reinforcement Learning for Unsupervised Video Summarization with Diversity-Representativeness Reward Before Review 이번에는 Video Summarization 관련 논문을 리뷰 해도 록 하겠습니다. 저번에 리뷰했던 [IEEE 2015] Adaptive key-frame Selection for video Summarization 논문은 Neural Network 기반은 아니고 Submodular-Optimization 방법으로 Video Summarization을 진행했습니다. 오늘 가져온 논문은 Learning 기반으로 Video Summarization을 진행하며 Unsupervised 방식으로 진행이 됩니다. 평소에 리뷰했던 논문과 조금 다른 점은 Reinforment Learning과 LSTM이 적용된다는 점입니다. 전체적인 맥락은 저번에 리뷰했던 논문과 비슷하지만 다른 점은 강화 학.. 2021. 10. 2.
[CVPR 2021] Exponential Moving Average Normalization for Self-Supervised and Semi-supervised Learning Before Review 오늘 준비한 논문은 비디오 논문이 아닌 다른 논문을 가져왔습니다. Student-Teacher 기반의 semi 혹은 self supervised 방법론에 적용할 수 있는 새로운 Normalization을 다룬 논문입니다. Simple is Best라고, 방법론 자체는 굉장히 간단합니다. 간단한 만큼 적용하기 쉬우며 좋은 성능과 범용성을 보여주기 때문에 CVPR에 accept 된 것 같습니다. 혹시 본인이 지금 연구하거나, 연구할 방향이 Student-Teacher 기반의 Semi, Self Supervised 방법론이라면 본 논문에서 제안되는 Normalization 기법을 사용해보는 것도 나쁘지 않을 것 같습니다. 리뷰 시작하도록 하겠습니다. Preliminaries 논문의 얘.. 2021. 10. 2.