Introduction

pre-trained 모델을 사용하는 방법은 2가지가 있다.

Key points

Preliminares: Probing Methods

fixed feature extractor를 사용하는 경우 classifier만 재 학습하여 성능을 비교함을 통해 contextualized representation이 linguistic property를 잘 잡고 있는지 판단.

다만 위의 경우 black box 모델이라서 성능만 보기에 더 이상 해석가능한 부분이 없기에 DIRECTPROBE라는 방식으로 embedding의 geometry를 보도록 한다.

Experimental Setup

pre-train은 Devlin 2019 BERT 사용