Computer Vision
-
[openCV] Object height 알아내기(python)Computer Vision 2022. 7. 25. 15:57
카메라의 focal length, principal points, height이 주어졌다는 가정하에, 객체의 지면과의 contact point와 head point를 알고있다면 객체의 높이를 알 수 있다. 수식은 다음과 같다. 카메라의 외부, 내부 파라미터는 calibration을 수행해서 알아낼 수 있다. calibration을 통해 알아낸 카메라 파라미터를 통해 객체의 높이를 알아내는 파이썬 코드는 다음과 같다. p_x, p_y = pt[0] p_x1, p_y1 = pt[1] point_p = [p_x, p_y] point_p1 = [p_x1, p_y1] point_n = cv.undistortPoints(np.array([point_p], dtype=np.float64), K, distort).sq..
-
MonoDTR: Monocular 3D Object Detection with Depth-Aware Transformer 논문 공부Computer Vision 2022. 7. 12. 11:28
시작하기 전에 1. Transformer란? Transformer는 구글이 2017년에 발표한 논문인 “Attention is all you need"에서 나온 모델로 기존의 seq2seq의 구조를 따르지만 내부적으로 RNN 레이어 없이 어텐션으로만 구현한 모델이다. 2. seq2seq와 Attention이란? sequence-to-sequence 모델은 말 그대로, 아이템(예를 들어 사진) 시퀀스를 인풋으로 받고 또다른 아이템 시퀀스를 아웃풋으로 출력하는 모델이다. seq2seq 모델은 내부적으로 인코더와 디코더로 이루어져있다. 인코더는 input sequence를 받아 각각의 아이템을 처리하고 알아낸 정보를 벡터(context)로 바꾼다. 모든 아이템에 대해 처리를 마친 후에 이를 디코더에 보낸다. ..