지난 13일, Open AI가 새로운 GPT 모델, ‘GPT-4o’를 공개했다. ‘Omni- (모든 것)’라는 접두사에서 따온 이름처럼, 이번 모델은 AI의 새로운 지평을 열었다는 평가를 받고 있다. 발표 이후, Open AI의 CEO인 샘 올트먼(Sam Altman)은 자신의 SNS 계정에 “her”라는 글을 올리기도 했다.
![](https://visla.kr/wp/wp-content/uploads/2024/05/240515_01.jpg)
이는 AI와 사랑에 빠진 남자를 그린 영화 “Her(그녀)”를 연상시킨다. 영화에 등장하는 AI 사만다는 인간처럼 자연스럽고 따뜻한 감정을 가졌다. AI 사만다처럼, Open AI의 시연 영상 속 GPT-4o는 상대의 감정, 표정, 맥락을 빠르게 인식하며 ‘인간다움’을 보여줬다.
Open AI의 CTO인 미라 무라티(Mira Murati)는 “GPT-4o는 응답 속도를 빠르게 하는 데 초점을 맞췄다”고 밝혔다. GPT-4o의 평균 응답 시간은 0.32초로, 3초가량 지연이 있었던 기존 모델보다 눈에 띄게 빨라졌다. 실제 인간처럼 물 흐르듯 대화를 주고받을 수 있는 것이다. 또한, 말을 더듬거나 한숨을 쉬고 소리내 웃는 등 감정적인 반응이 더해졌다. 속삭이듯 자장가를 부르기도 하고, 극적인 목소리로 동화를 읽어주며 목소리 톤을 자유롭게 바꾼다.
GPT-4o는 음성뿐만 아니라 시각 데이터를 인식하는 능력도 뛰어나다. 카메라로 수식을 보여주면 바로 인식하고 문제 풀이를 도울 수 있다. 강아지를 보여주면 마치 인간처럼 다정한 말투로 강아지의 이름을 묻고 대화를 나눈다. 시각 장애인을 위한 ‘Be my eyes’ 서비스 또한 주목할 만하다. GPT-4o가 카메라로 주변을 인식하고 장애물이나 풍경을 음성으로 알려준다. 시각 장애인이 택시를 잡는 것을 도와주는 친절한 가이드 역할을 하기도 한다. 시각적인 맥락을 파악하는 능력이 훨씬 발전된 것이다.
![](https://visla.kr/wp/wp-content/uploads/2024/05/240515_02.jpg)
GPT-4o는 총 50개의 언어로 출시되었다. 단, 음성 AI 모드는 몇 주 안에 공개될 예정이다. 영화 “Her”처럼 AI와 사랑에 빠지고 싶다면, 지금 바로 GPT-4o를 사용해 보는 것은 어떨까.
이미지 출처 | IMDb, Open AI