GPT-4o 사용방법 총정리 및 최신뉴스
먼저 GPT-4o의 o는 “omni” : “모든 것을 아우른다” 라는 뜻입니다.
음성인식 스피치 투 텍스트 이미지인식기능 등이 통합되어 아우르는 기술입니다.
더 자연스럽고 다양한 인간의 활동을 명령으로 줄 수 있습니다.
속도가 느려질까 두렵다구요? 아닙니다. 굉장히 빠르고 정확합니다. (GPT-4터보보다 2배 빠른 속도)
대화영 인터페이스 형태는 평균 320ms라고 합니다. 이 반응 속도는 사람의 속도와 같죠
심지어 사람의 감정과 얼굴 표정도 인식한다고 합니다. 사람과 비슷한 수준으로 이해하고 대화합니다.
3줄 요약
- 영화 HER의 현실화, 아이언맨 자비스의 완성형!!
- 이제는 텍스트 대신 음성으로?!
- 대부분의 기능을 무료로 제공한다고?!

🎈 GPT-4o (“o” for “omni”, 모든 것을 아우른다)
🎈 음성 인식 + 스피치-투-텍스트 (Speech to text) + 이미지 인식 기능 등이 통합
🎈 다중 모드로 설계. 이미지, 텍스트 및 음 성을 동시에 분석
🎈 그레이드된 멀티모달 (Multimodal) 모델
🎈 자연스럽고 다양한 인간의 활동
🎈 대화형 인터페이스 형태 (최소 232ms, 평균 320ms)
- 심지어 사람의 감정과 얼굴 표정도 인식
– 빠른 처리 속도로 AI가 추론하고 그 결과를 거의 실시간으로 출력
– GPT-4o는 새로운 데스크톱 앱 출시 (맥OS 사용가능, 윈도우 연말)
– GPT4 터보에 비해 2배 빠르고 50% 저렴하며 글자 제한도 5배나 크다.
– 무료 챗GPT 사용자에게도 텍스트 및 이미지 기능 제공
– 향후 몇 주에 걸쳐 점진적으로 배포
🎁 무료에게 더 많은 기능을?
– 기본적으로 GPT-4 지능을 모든 사용자에게 제공하는 것이 사명
– 무료로 사용가능한 기능 (예상)
1) GPT-4o (업그레이드된 멀티모달)
2) GPTs
3) 데이터분석 (Advanced Data Analysis)
4) 실시간 데이터 검색
5) 메모리 기능 (대화의 연속성)
6) 데스크탑용 앱
🎉 유료 사용자의 혜택은?
– 무료 사용자와 기능은 동일
– 더 많은 한도를 제공
1) Plus 사용자들은 최대 5배 더 높은 메시지 한도를 제공
2) 24년 5월 13일부터 플러스 사용자는
GPT–4o에서 3시간마다 최대 80개의 메시지
GPT–4에서는 3시간마다 최대 40개의 메시지
🎁 경쟁 AI 서비스 죽이기?
– 성능은 더욱 향상되고 비용은 50% 저렴
– GPT–4o의 영어와 코드에 대한 성능은 GPT–4 Turbo 와 비슷
– 비 영어권 언어의 텍스트에 대한 성능이 크게 향상
– GPT–4o는 기존 GPT–4 대비 2배 빠른 속도에 절반 가격
– 토크나이저도 개선되어 한글의 경우 토큰이 1.7배 감소
🥇 총정리?
– HER, 자비스
– 새로운 기능 점차 반영, 지금은 안됨
– 챗GPT데스크탑 버전 필수 앱
– 텍스트에서 음성으로
– 유료기능 대부분 무료로 (사용량 제한)
– 망해가는 스타트업
