title만 보았을 때 페이퍼에 대한 예상
각 단어의 빈도가 학습에 끼치는 영향을 다룸
실제로 예상과 내용이 어떻게 달랐는가?
생각보다 평가하기 위한 task가 subject-verb agreement로 한정되어 있다. 특히 이러한 경향을 분석하기 위해 두가지의 error 원인을 제시하게 되고, frequency를 absolute와 relative를 나누어서 비교하고 있다.
BERT와 같은 모델들이 좋은 성능을 낸다는 것이 정말 그러한 모델들이 symbolic rule을 배우고 적용하고 있는지 의문을 품게 되는 계기였다.
그래서 symbolic rule 중 subject-verb number aggrement를 선정해서 비교하게 된다.(주어와 동사의 단수형 복수형을 정확하게 맞추는지 평가하는 것)
그리고 unseen data에 대해서도 적용하는 것을 보였지만, 동시에 absolute freq와 relative freq에 영향을 받는 것도 확인했다.