title만 보았을 때 페이퍼에 대한 예상
effective하다는 것이 어떤 점에서 주장하는지 확인해야 할 것 CoT와 어떤 점이 다른지
실제로 예상과 내용이 어떻게 달랐는가?
CoT와 차이점은 sequential하다는것은linear한 reasoning으로 보고, 인간의 reasoning은 nonlinear하다고 지적하며 novelty를 주장. 특히 성능 향상과 더불어 baseline으로 사용된 Multimodal CoT_large는700M param에 비해250M으로 성능을 내서 effective하다고 주장. 단 CoT와 비교해서 latency 문제는 없는 것인지, FLOPs는 많아졌을텐데 effective하다고 할 수 있는 것인지
여기서 기본 가정은 인간의 reasoning은 non-sequential이며 graph fashion.
여기서 제시한 GoT는 2단계로 구성
rationales generation
즉 GoT는 hypothesis를 구축하는 것이고 RLHF는 confirmation을 하기 때문인건가?
answer generation
앞서 만든 rationale들로 답을 다시 뽑아내는 과정
즉 deduction 과정 중 observation을 만드는 과정.