많은 분들이 오픈AI의 영상 생성AI ‘소라(Sora)’를 보고 충격을 받았습니다. 텍스트만 집어 넣으면 마치 실제 카메라로 촬영한 것과 같은 영상을 만들어줍니다. 소라가 기존의 ‘text to video’와 다른 점은 무엇일까요?
바로 물리법칙을 이해하고 있다는 것입니다. 3D로 세계를 이해한 뒤 2D로 시각화한다는 것이죠. 다음에 올 프레임을 확률적으로 예측하는 기존의 영상 생성 툴과는 근본적으로 다른다는 것이죠. 강정수 박사의 설명을 들어보시죠.