Replacing convolution block
2. Overview
Single context에 적용되는 self-attention을 처음으로 vision task에 적용한 논문이다. Target network는 ResNet으로 택했으며 ResNet의 blttleneck block 중 3x3 conv layer만 attention layer로 대체한다. 1x1 conv layer의 경우 실질적으로 conv 연산과는 거리가 있다는 언급과 함께 attention layer로의 변환 없이 그대로 사용한다. 이러한 단순한 변형을 통하여 모델의 파라미터 수를 크게 줄임과 동시에 acc.가 소폭 상승하는 효과를 볼 수 있었다.
3. 발표자료 및 영상
[1] 발표자료
[2] 발표영상
4. 참고문헌
[1] Parmar, Niki, et al. "Stand-Alone Self-Attention in Vision Models." Advances in Neural Information Processing Systems. 2019.
| 번호 | 제목 | 작성자 | 작성일 | 추천 | 조회 |
| 공지사항 |
Paper Reviews 2019 Q3
관리자
|
2020.03.12
|
추천 0
|
조회 13412
|
관리자 | 2020.03.12 | 0 | 13412 |
| 공지사항 |
Paper Reviews 2019 Q2
관리자
|
2020.03.12
|
추천 0
|
조회 12169
|
관리자 | 2020.03.12 | 0 | 12169 |
| 공지사항 |
Paper Reviews 2019 Q1
관리자
|
2020.03.12
|
추천 0
|
조회 13130
|
관리자 | 2020.03.12 | 0 | 13130 |
| 536 |
[Paper Review] Safety Layers in Aligned Large Language Models: The Key to LLM Security (8)
Sunmin Kim
|
2025.11.25
|
추천 0
|
조회 116
|
Sunmin Kim | 2025.11.25 | 0 | 116 |
| 535 |
관리자
|
2025.11.18
|
추천 0
|
조회 35
|
관리자 | 2025.11.18 | 0 | 35 |
| 534 |
Junyeong Son
|
2025.11.18
|
추천 0
|
조회 39
|
Junyeong Son | 2025.11.18 | 0 | 39 |
| 533 |
Siyul Sung
|
2025.11.18
|
추천 0
|
조회 43
|
Siyul Sung | 2025.11.18 | 0 | 43 |
| 532 |
Jihun Nam
|
2025.11.18
|
추천 0
|
조회 28
|
Jihun Nam | 2025.11.18 | 0 | 28 |
| 531 |
Jaewon Cheon
|
2025.11.18
|
추천 0
|
조회 40
|
Jaewon Cheon | 2025.11.18 | 0 | 40 |
| 530 |
[Paper Review] Fully-Connected Spatial-Temporal Graph for Multivariate Time-Series Data (13)
Suyeon Shin
|
2025.11.18
|
추천 0
|
조회 192
|
Suyeon Shin | 2025.11.18 | 0 | 192 |
| 529 |
[Paper Review] Fusionformer: A Novel Adversarial Transformer Utilizing Fusion Attention for Multivariate Anomaly Detection (13)
Sunghun Lim
|
2025.11.07
|
추천 0
|
조회 244
|
Sunghun Lim | 2025.11.07 | 0 | 244 |
| 528 |
[Paper Review] AXIS: EXPLAINABLE TIME SERIES ANOMALY DETECTION WITH LARGE LANGUAGE MODELS (13)
Hyeongwon Kang
|
2025.10.29
|
추천 0
|
조회 436
|
Hyeongwon Kang | 2025.10.29 | 0 | 436 |
| 527 |
Introduction to Discrete Diffusion Language Models. (14)
Jaehee Kim
|
2025.10.24
|
추천 0
|
조회 440
|
Jaehee Kim | 2025.10.24 | 0 | 440 |