Cross Entropy

cross entropy: P를 Q로 근사하여 인코딩했을때 얼마만큼의 추가 정보량이 필요한지를 나타내는 것이다.

Hp(q)=H(P,Q)=xXp(x)logq(x)

쉽게 말해서,

H(p,q)=H(p)+DKL(pq)

이고, D_KL는 “내 모델 q 때문에 추가로 낭비하는 비트 수"