지난 5월 14일, OpenAI가 새로운 AI 모델인 GPT-4o를 발표했습니다.
‘o’는 ‘어디에서나’를 뜻하는 ‘Omni’의 줄임말입니다. 시공간의 제약 없이, 어디에서나 소통할 수 있는 AI라는 뜻을 담고 있는 것인데요. 그간의 생성형 AI는 검색과 텍스트 위주의 비교적 단순한 소통만 가능했다면, GPT-4o는 텍스트는 물론이고 시각과 음성을 통합한 실시간 소통이 가능해졌습니다. GPT-4o라는 이름은 바로 이 점을 잘 드러냈다고 할 수 있죠.
몇 가지 눈에 띄는 변화가 있는데요, 하나씩 살펴보겠습니다.
먼저, 기존 GPT-3.6 버전의 음성 모드에서는 평균 2.8초~4.5초가 걸렸던 데 비해, GPT-4o에서는 평균 0.32초, 빠를 때는 0.23초가 걸렸습니다. 이는 사람의 응답 시간과 유사한 속도라고 하죠. 이뿐 아니라 상대방의 음성을 인식해 감정을 인지하거나, 대화의 맥락을 파악해 반응을 하기도 합니다. 또, 마치 사람처럼 음성의 톤과 속도 등을 달리하며 감정을 표현하기도 합니다.
또, 카메라 인식도 가능합니다. 예를 들어, 종이에 수학 문제를 적은 다음, 카메라를 이용해 GPT-4o에게 보여주면 이를 인식하고 문제를 풀어줍니다. 마치 개인 과외 선생님처럼 말이죠.
외국어 음성을 실시간으로 통역하는 기능도 추가되었습니다. 예를 들어, 한국어만 구사할 수 있는 사람이 영어만 구사할 수 있는 사람과 대화를 한다고 가정했을 때, GPT-4o가 한국어는 영어로, 영어는 한국어로 실시간 통역을 해줍니다. 이제 외국어를 잘하지 못하더라도 해외여행은 문제 없을 것 같네요.
이 밖에도 프로그래밍 코드 작성을 돕거나 그래프 및 도표를 해석하고, 이미지를 더 고퀄리티로 생성하는 등 기존 모델보다 더 완성도가 높아진 모습을 확인할 수 있습니다.
기본적으로 유료 버전에서만 GPT-4o의 전 기능을 사용할 수 있으나, 실망하긴 이릅니다. 무료 버전에서도 GPT-4o의 기능을 제한적으로 사용할 수 있기 때문입니다. 특히 기존 유료 버전에서만 제공하던 파일 업로드나 최신 데이터 검색 기능 등을 사용할 수 있다는 점이 눈에 띄네요. 단, 사용량에 제한이 있습니다. 정해진 사용량을 초과하면 다시 GPT-3.5 버전의 기능만 사용할 수 있어요.
무료 사용자의 경우, 아래와 같은 화면이 보일 텐데요. GPT-4o가 자동으로 적용되어 있는 것이므로 별도로 설정해야 하는 것은 없습니다.
유료 사용자의 경우, 홈페이지 상단에서 GPT-4o를 선택한 다음 사용하면 됩니다.
우리의 생활을 한층 편하고 윤택하게 만들어준 ChatGPT! 앞으로 얼마나 더 눈부신 변화를 가져올지 기대가 되네요.
▼ GPT-4o 시연 영상 감상하기
▼ 함께 보면 좋은 글
'책 소개 > 진짜 하루만에 끝내는 AI 활용' 카테고리의 다른 글
아직도 어렵게 프롬프트 써? 스토리만 입력하면 3분 만에 웹툰 뚝딱! (0) | 2024.05.24 |
---|---|
무료 AI 음악 생성 플랫폼, 유디오(Udio)를 소개합니다! (0) | 2024.05.24 |
대본 No! 녹음 No! 5분 안에 유튜브 쇼츠 만들어주는 AI, 플리키 (0) | 2024.05.10 |
무료 AI 보이스로 쉽고 간편하게 유튜브 쇼츠 만들자! 타입캐스트 (0) | 2024.05.10 |
미드저니에서 생성한 작업물을 다른 사람에게 공개하고 싶지 않다면? - 스텔스(Stealth) 모드 (0) | 2024.03.05 |