챗GPT에는 다양한 모델이 있다. 크게 추론 모델과 일반 모델로 나뉜다.
모델마다 특성도 있고, 프롬프트를 입력 받을 수 있는 한계와 출력에도 한계가 있다.
오픈AI에서 자세히 설명한 내용을 한국어로 번역해서 정리했다.
토큰(Token)이란 개념이 자주 나오는데, 쉽게 설명하자면 AI가 이해하는 말의 단위라고 생각하면 된다.
컨텍스트 윈도우란 챗GPT가 답변을 하기 위해 수용하는 용량이다. 프롬프트와 제공된 데이터, 이전의 답변 등이 포함된다.
OpenAI API를 구동하는 다양한 모델에 대해 알아보세요.
o1 고지능 추론 모델 | gpt-4o 빠르고, 지능적이며, 유연한 GPT 모델 |
o3-mini 빠르고 유연한 추론 모델 | gpt-4o-mini 가장 빠른 응답, 비용 효율적, 사용자 정의 가능 |
OpenAI API는 다양한 기능과 가격대를 가진 다양한 모델로 구동됩니다. 미세 조정을 통해 특정 사용 사례에 맞게 모델을 사용자 정의할 수도 있습니다.
GPT 모델 | 빠르고 다재다능하며 높은 지능을 가진 주요 모델 |
추론 모델 | 복잡하고 다단계 작업에 뛰어난 o-시리즈 추론 모델 |
GPT-4o Realtime | 실시간 텍스트 및 오디오 입출력이 가능한 GPT-4o 모델 |
GPT-4o Audio | REST API를 통해 오디오 입출력이 가능한 GPT-4o 모델 |
DALL·E | 자연어 프롬프트를 기반으로 이미지를 생성하고 편집할 수 있는 모델 |
TTS | 텍스트를 자연스러운 음성의 오디오로 변환할 수 있는 모델 세트 |
Whisper | 오디오를 텍스트로 변환할 수 있는 모델 |
Embeddings | 텍스트를 숫자 형태로 변환할 수 있는 모델 세트 |
Moderation | 텍스트가 민감하거나 안전하지 않은지 감지할 수 있도록 미세 조정된 모델 |
Deprecated (더 이상 사용되지 않음) | 더 이상 사용되지 않는 모델의 전체 목록과 권장되는 대체 모델 |
Point-E, Whisper, Jukebox 및 CLIP을 포함한 오픈 소스 모델도 게시했습니다.
아래 표에는 출력을 생성하기 위해 채팅 완료와 같은 REST API에서 사용할 수 있는 모델 ID가 나와 있습니다. 이러한 모델 ID 중 일부는 특정 날짜 스냅샷을 가리키는 별칭입니다.
예를 들어 gpt-4o 모델 ID는 GPT-4o의 특정 날짜 스냅샷을 가리키는 별칭입니다. 이러한 별칭이 가리키는 날짜 스냅샷은 새로운 스냅샷이 제공된 후 몇 달 후에 최신 스냅샷으로 주기적으로 업데이트됩니다. 별칭인 모델 ID는 아래 표에 현재 가리키는 모델 ID를 명시합니다.
import OpenAI from "openai";
const openai = new OpenAI();
const completion = await openai.chat.completions.create({
model: "gpt-4o",
messages: [
{ role: "developer", content: "You are a helpful assistant." },
{
role: "user",
content: "Write a haiku about recursion in programming.",
},
],
store: true,
});
console.log(completion.choices[0].message);
from openai import OpenAI
client = OpenAI()
completion = client.chat.completions.create(
model="gpt-4o",
messages=[
{"role": "developer", "content": "You are a helpful assistant."},
{
"role": "user",
"content": "Write a haiku about recursion in programming."
}
]
)
print(completion.choices[0].message)
"https://api.openai.com/v1/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
"model": "gpt-4o",
"messages": [
{
"role": "developer",
"content": "You are a helpful assistant."
},
{
"role": "user",
"content": "Write a haiku about recursion in programming."
}
]
}'
{
"id": "chatcmpl-Af6LFgbOPpqu2fhGsVktc9xFaYUVh",
"object": "chat.completion",
"created": 1734359189,
"model": "gpt-4o-2024-08-06",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "Code within a loop, \nFunction calls itself again, \nInfinite echoes.",
"refusal": null
},
"logprobs": null,
"finish_reason": "stop"
}
],
"usage": {}
}
아래에서 현재 모델 별칭과 새 버전으로 업데이트될 시기에 대한 지침(사용 가능한 경우)을 확인하십시오.
별칭(Alias) | 모델(Points to) |
gpt-4o | gpt-4o-2024-08-06 |
chatgpt-4o-latest | ChatGPT에 사용된 최신 버전 |
gpt-4o-mini | gpt-4o-mini-2024-07-18 |
o1 | o1-2024-12-17 |
o1-mini | o1-mini-2024-09-12 |
o3-mini | o3-mini-2025-01-31 |
o1-preview | o1-preview-2024-09-12 |
gpt-4o-realtime-preview | gpt-4o-realtime-preview-2024-12-17 |
gpt-4o-mini-realtime-preview | gpt-4o-mini-realtime-preview-2024-12-17 |
gpt-4o-audio-preview | gpt-4o-audio-preview-2024-12-17 |
프로덕션 애플리케이션에서는 주기적으로 변경될 수 있는 별칭 대신 날짜가 지정된 모델 스냅샷 ID를 사용하는 것이 가장 좋습니다.
GPT-4o("o"는 "옴니"를 의미)는 다재다능하고 지능이 높은 주요 모델입니다. 텍스트와 이미지 입력을 모두 허용하고 텍스트 출력( 구조화된 출력 포함)을 생성합니다. 텍스트 생성 가이드에서 GPT-4o를 사용하는 방법을 알아보십시오.
아래의 chatgpt-4o-latest 모델 ID는 ChatGPT에서 사용되는 GPT-4o 버전을 지속적으로 가리킵니다. ChatGPT의 GPT-4o 모델에 중요한 변경 사항이 있을 때마다 자주 업데이트됩니다.
GPT-4o 모델의 지식 컷오프는 2023년 10월입니다.
모델 | 컨텍스트 윈도우 | 최대 출력 토큰 |
gpt-4o ↳ gpt-4o-2024-08-06 |
128,000 토큰 | 16,384 토큰 |
gpt-4o-2024-11-20 | 128,000 토큰 | 16,384 토큰 |
gpt-4o-2024-08-06 | 128,000 토큰 | 16,384 토큰 |
gpt-4o-2024-05-13 | 128,000 토큰 | 4,096 토큰 |
chatgpt-4o-latest ↳ ChatGPT에 사용된 GPT-4o |
128,000 토큰 | 16,384 토큰 |
GPT-4o mini("o"는 "옴니"를 의미)는 집중적인 작업을 위한 빠르고 저렴한 소형 모델입니다. 텍스트와 이미지 입력을 모두 허용하고 텍스트 출력( 구조화된 출력 포함)을 생성합니다. 미세 조정에 이상적이며 GPT-4o와 같은 더 큰 모델의 모델 출력을 GPT-4o-mini로 증류하여 더 낮은 비용과 지연 시간으로 유사한 결과를 생성할 수 있습니다.
GPT-4o-mini 모델의 지식 컷오프는 2023년 10월입니다.
모델 | 컨텍스트 윈도우 | 최대 출력 토큰 |
gpt-4o-mini↳ gpt-4o-mini-2024-07-18 | 128,000 토큰 | 16,384 토큰 |
gpt-4o-mini-2024-07-18 | 128,000 토큰 | 16,384 토큰 |
o1 시리즈 모델은 강화 학습을 통해 복잡한 추론을 수행하도록 훈련되었습니다. o1 모델은 사용자에게 응답하기 전에 긴 내부 사고 과정을 생성하여 먼저 생각합니다. 추론 가이드에서 o1 모델의 기능에 대해 알아보십시오.
o1 추론 모델은 여러 도메인에서 어려운 문제를 해결하도록 설계되었습니다. o1-mini는 더 빠르고 저렴한 추론 모델이지만 o1-mini와 동일한 지연 시간과 가격으로 더 높은 지능을 제공하는 최신 o3-mini 모델을 사용하는 것이 좋습니다. 최신 o1 모델은 텍스트와 이미지 입력을 모두 지원하고 텍스트 출력( 구조화된 출력 포함)을 생성합니다. o1-mini는 현재 텍스트 입출력만 지원합니다.
o1 및 o1-mini 모델의 지식 컷오프는 2023년 10월입니다.
모델 | 컨텍스트 윈도우 | 최대 출력 토큰 |
o1 ↳ o1-2024-12-17 |
200,000 토큰 | 100,000 토큰 |
o1-2024-12-17 | 200,000 토큰 | 100,000 토큰 |
o1-mini ↳ o1-mini-2024-09-12 |
128,000 토큰 | 65,536 토큰 |
o1-mini-2024-09-12 | 128,000 토큰 | 65,536 토큰 |
o1-preview↳ o1-preview-2024-09-12 | 128,000 토큰 | 32,768 토큰 |
o1-preview-2024-09-12 | 128,000 토큰 | 32,768 토큰 |
o3-mini는 가장 최근의 소형 추론 모델로, o1-mini와 동일한 비용 및 지연 시간 목표로 높은 지능을 제공합니다. o3-mini는 또한 구조화된 출력, 함수 호출, 일괄 API 등과 같은 주요 개발자 기능을 지원합니다. o-시리즈의 다른 모델과 마찬가지로 과학, 수학 및 코딩 작업에 탁월하도록 설계되었습니다.
o3-mini 모델의 지식 컷오프는 2023년 10월입니다.
모델 | 컨텍스트 윈도우 | 최대 출력 토큰 |
o3-mini
↳ o3-mini-2025-01-31
|
200,000 tokens | 100,000 tokens |
o3-mini-2025-01-31 | 200,000 tokens | 100,000 tokens |
이것은 GPT-4o 및 GPT-4o-mini Realtime 모델의 미리보기 릴리스입니다. 이러한 모델은 WebRTC 또는 WebSocket 인터페이스를 통해 실시간으로 오디오 및 텍스트 입력에 응답할 수 있습니다. 실시간 API 가이드에서 자세히 알아보십시오.
GPT-4o Realtime 모델의 지식 컷오프는 2023년 10월입니다.
모델 | 컨텍스트 윈도우 | 최대 출력 토큰 |
gpt-4o-realtime-preview↳ gpt-4o-realtime-preview-2024-12-17 | 128,000 토큰 | 4,096 토큰 |
gpt-4o-realtime-preview-2024-12-17 | 128,000 토큰 | 4,096 토큰 |
gpt-4o-realtime-preview-2024-10-01 | 128,000 토큰 | 4,096 토큰 |
gpt-4o-mini-realtime-preview↳ gpt-4o-mini-realtime-preview-2024-12-17 | 128,000 토큰 | 4,096 토큰 |
gpt-4o-mini-realtime-preview-2024-12-17 | 128,000 토큰 | 4,096 토큰 |
이것은 GPT-4o Audio 모델의 미리보기 릴리스입니다. 이러한 모델은 오디오 입출력을 허용하며 채팅 완료 REST API에서 사용할 수 있습니다. 자세히 알아보십시오.
GPT-4o Audio 모델의 지식 컷오프는 2023년 10월입니다.
모델 | 컨텍스트 윈도우 | 최대 출력 토큰 |
gpt-4o-audio-preview↳ gpt-4o-audio-preview-2024-12-17 | 128,000 토큰 | 16,384 토큰 |
gpt-4o-audio-preview-2024-12-17 | 128,000 토큰 | 16,384 토큰 |
gpt-4o-audio-preview-2024-10-01 | 128,000 토큰 | 16,384 토큰 |
gpt-4o-mini-audio-preview↳ gpt-4o-mini-audio-preview-2024-12-17 | 128,000 토큰 | 16,384 토큰 |
gpt-4o-mini-audio-preview-2024-12-17 | 128,000 토큰 | 16,384 토큰 |
GPT-4는 채팅 완료에서 사용할 수 있는 이전 버전의 고지능 GPT 모델입니다. 텍스트 생성 가이드에서 자세히 알아보십시오.
최신 GPT-4 Turbo 버전의 지식 컷오프는 2023년 12월입니다.
모델 | 컨텍스트 윈도우 | 최대 출력 토큰 |
gpt-4-turbo↳ gpt-4-turbo-2024-04-09 | 128,000 토큰 | 4,096 토큰 |
gpt-4-turbo-2024-04-09 | 128,000 토큰 | 4,096 토큰 |
gpt-4-turbo-preview↳ gpt-4-0125-preview | 128,000 토큰 | 4,096 토큰 |
gpt-4-0125-preview | 128,000 토큰 | 4,096 토큰 |
gpt-4-1106-preview | 128,000 토큰 | 4,096 토큰 |
gpt-4↳ gpt-4-0613 | 8,192 토큰 | 8,192 토큰 |
gpt-4-0613 | 8,192 토큰 | 8,192 토큰 |
gpt-4-0314 | 8,192 토큰 | 8,192 토큰 |
GPT-3.5 Turbo 모델은 자연어 또는 코드를 이해하고 생성할 수 있으며 채팅 완료 API를 사용하여 채팅에 최적화되었지만 비 채팅 작업에도 잘 작동합니다.
2024년 7월 현재 gpt-4o-mini는 더 저렴하고, 더 유능하며, 다중 모드이며, 빠르기 때문에 gpt-3.5-turbo 대신 사용해야 합니다. gpt-3.5-turbo는 여전히 API에서 사용할 수 있습니다.
모델 | 컨텍스트 윈도우 | 최대 출력 토큰 | 지식 컷오프 |
gpt-3.5-turbo-0125 요청된 형식으로 응답하는 정확도가 더 높고 비영어 함수 호출에 대한 텍스트 인코딩 문제를 일으키는 버그에 대한 수정이 포함된 최신 GPT-3.5 Turbo 모델입니다. |
16,385 토큰 | 4,096 토큰 | 2021년 9월 |
gpt-3.5-turbo 현재 gpt-3.5-turbo-0125를 가리킵니다. |
16,385 토큰 | 4,096 토큰 | 2021년 9월 |
gpt-3.5-turbo-1106 개선된 명령 따르기, JSON 모드, 재현 가능한 출력, 병렬 함수 호출 등을 갖춘 GPT-3.5 Turbo 모델입니다. |
16,385 토큰 | 4,096 토큰 | 2021년 9월 |
gpt-3.5-turbo-instruct GPT-3 시대 모델과 유사한 기능을 제공합니다. 레거시 완료 엔드포인트와 호환되며 채팅 완료와 호환되지 않습니다. |
4,096 토큰 | 4,096 토큰 | 2021년 9월 |
DALL·E는 자연어로 된 설명을 기반으로 현실적인 이미지와 아트를 만들 수 있는 AI 시스템입니다. DALL·E 3는 현재 프롬프트가 주어지면 특정 크기의 새 이미지를 만들 수 있는 기능을 지원합니다. DALL·E 2는 기존 이미지를 편집하거나 사용자가 제공한 이미지의 변형을 만들 수 있는 기능도 지원합니다.
DALL·E 3는 Images API를 통해 DALL·E 2와 함께 사용할 수 있습니다. ChatGPT Plus를 통해 DALL·E 3를 사용해 볼 수 있습니다.
모델 | 설명 |
dall-e-3 | 2023년 11월에 릴리스된 최신 DALL·E 모델입니다. 자세히 알아보십시오. |
dall-e-2 | 2022년 11월에 릴리스된 이전 DALL·E 모델입니다. 원래 모델보다 더 현실적이고 정확하며 4배 더 큰 해상도 이미지를 제공하는 DALL·E의 2번째 반복입니다. |
TTS는 텍스트를 자연스러운 음성 텍스트로 변환하는 AI 모델입니다. tts-1은 실시간 텍스트 음성 변환 사용 사례에 최적화되어 있고 tts-1-hd는 품질에 최적화되어 있는 두 가지 다른 모델 변형을 제공합니다. 이러한 모델은 Audio API의 Speech 엔드포인트에서 사용할 수 있습니다.
tts-1 | 속도에 최적화된 최신 텍스트 음성 변환 모델입니다. |
tts-1-hd | 품질에 최적화된 최신 텍스트 음성 변환 모델입니다. |
Whisper는 범용 음성 인식 모델입니다. 다양한 오디오의 대규모 데이터 세트에 대해 훈련되었으며 다국어 음성 인식과 음성 번역 및 언어 식별을 수행할 수 있는 다중 작업 모델이기도 합니다. Whisper v2-large 모델은 현재 whisper-1 모델 이름을 통해 API에서 사용할 수 있습니다. 현재 Whisper의 오픈 소스 버전과 API를 통해 사용할 수 있는 버전 간에는 차이가 없습니다. 그러나 API를 통해 최적화된 추론 프로세스를 제공하여 API를 통해 Whisper를 실행하는 것이 다른 방법으로 실행하는 것보다 훨씬 빠릅니다. Whisper에 대한 자세한 기술 정보는 논문을 읽어보십시오.
Embeddings는 두 텍스트 조각 간의 관련성을 측정하는 데 사용할 수 있는 텍스트의 숫자 표현입니다. Embeddings는 검색, 클러스터링, 추천, 이상 감지 및 분류 작업에 유용합니다. 발표 블로그 게시물에서 최신 임베딩 모델에 대해 자세히 읽어보십시오.
모델 | OUTPUT DIMENSION |
text-embedding-3-large 영어 및 비영어 작업 모두에 가장 적합한 임베딩 모델 |
3,072 |
text-embedding-3-small 2세대 ada 임베딩 모델보다 성능 향상 |
1,536 |
text-embedding-ada-002 16개의 1세대 모델을 대체하는 가장 적합한 2세대 임베딩 모델 |
1,536 |
Moderation 모델은 콘텐츠가 OpenAI의 사용 정책을 준수하는지 확인하도록 설계되었습니다. 이 모델은 혐오, 자해, 성적인 콘텐츠, 폭력 등과 같은 범주에서 콘텐츠를 찾는 분류 기능을 제공합니다. Moderation 가이드에서 텍스트와 이미지 Moderation에 대해 자세히 알아보십시오.
모델 | 최대 토큰 |
omni-moderation-latest
현재의 omni-moderation-2024-09-26.
|
32,768 |
omni-moderation-2024-09-26 새로운 멀티 모달 모더레이션 모델의 최신 고정 버전. 텍스트와 이미지를 모두 분석할 수 있다.
|
32,768 |
text-moderation-latest
현재의 text-moderation-007.
|
32,768 |
text-moderation-stable
현재의 text-moderation-007.
|
32,768 |
text-moderation-007
이전 세대의 범용 텍스트 전용 모더레이션. omni-moderation-* 모델로 전환하는 것이 최상이다.
|
32,768 |
GPT 기본 모델은 자연어 또는 코드를 이해하고 생성할 수 있지만 지침 준수를 위해 훈련되지 않았습니다. 이러한 모델은 원래 GPT-3 기본 모델을 대체하도록 만들어졌으며 레거시 완료 API를 사용합니다. 대부분의 고객은 GPT-3.5 또는 GPT-4를 사용해야 합니다.
모델 | 최대 토큰 | 지식 컷오프 |
babbage-002
GPT-3 ada 및 babbage 기본 모델 대체
|
16,384 tokens | Sep 2021년 9월 |
davinci-002
GPT-3 curie 및 davinci 기본 모델 대체
|
16,384 tokens | Sep 2021년 9월 |
귀하의 데이터는 귀하의 것입니다.
2023년 3월 1일부터 OpenAI API로 전송된 데이터는 OpenAI 모델을 훈련하거나 개선하는 데 사용되지 않습니다 (데이터 공유에 명시적으로 동의하지 않는 한).
오용을 식별하기 위해 API 데이터는 최대 30일 동안 보관될 수 있으며, 이후 삭제됩니다 (법률에 의해 달리 요구되지 않는 한). 민감한 애플리케이션을 사용하는 신뢰할 수 있는 고객에게는 데이터 보관을 전혀 하지 않는 것이 가능할 수 있습니다. 데이터 보관을 전혀 하지 않으면 요청 및 응답 본문이 로깅 메커니즘에 유지되지 않고 요청을 처리하기 위해서만 메모리에 존재합니다.
이러한 데이터 정책은 ChatGPT 또는 DALL·E Labs와 같은 OpenAI의 API가 아닌 소비자 서비스에는 적용되지 않습니다.
엔드포인트 | 학습 여부 | 보존 기간 | 보존하지 않는 기능 |
/v1/chat/completions* | 아니요 | 30일 | 예, (a) 이미지 입력, (b) 구조화된 출력에 제공된 스키마 또는 (c) 오디오 출력 제외 * |
/v1/assistants | 아니요 | 30일 ** | 아니요 |
/v1/threads | 아니요 | 30일 ** | 아니요 |
/v1/threads/messages | 아니요 | 30일 ** | 아니요 |
/v1/threads/runs | 아니요 | 30일 ** | 아니요 |
/v1/vector_stores | 아니요 | 30일 ** | 아니요 |
/v1/threads/runs/steps | 아니요 | 30일 ** | 아니요 |
/v1/images/generations | 아니요 | 30일 | 아니요 |
/v1/images/edits | 아니요 | 30일 | 아니요 |
/v1/images/variations | 아니요 | 30일 | 아니요 |
/v1/embeddings | 아니요 | 30일 | 예 |
/v1/audio/transcriptions | 아니요 | 데이터 보존 없음 | - |
/v1/audio/translations | 아니요 | 데이터 보존 없음 | - |
/v1/audio/speech | 아니요 | 30일 | 예 |
/v1/files | 아니요 | 고객이 삭제할 때까지 | 아니요 |
/v1/fine_tuning/jobs | 아니요 | 고객이 삭제할 때까지 | 아니요 |
/v1/batches | 아니요 | 고객이 삭제할 때까지 | 아니요 |
/v1/moderations | 아니요 | 데이터 보존 없음 | - |
/v1/completions | 아니요 | 30일 | 예 |
/v1/realtime (beta) | 아니요 | 30일 | 예 |
평가:
* 평가 데이터: 평가를 생성하면 해당 평가와 관련된 데이터는 대시보드를 통해 삭제한 후 30일 후에 서버에서 삭제됩니다. 대시보드를 통해 삭제되지 않은 평가 데이터는 무기한 보존됩니다.
자세한 내용은 API 데이터 사용 정책을 참조하십시오. 데이터 보존 없음에 대한 자세한 내용은 영업 팀에 문의하십시오.
엔드포인트 | 최신 모델 |
/v1/assistants | 모든 o-series, 모든 GPT-4o (chatgpt-4o-latest 제외), GPT-4o-mini, GPT-4 및 GPT-3.5 Turbo 모델. 검색 도구에는 gpt-4-turbo-preview(및 후속 날짜 지정 모델 릴리스) 또는 gpt-3.5-turbo-1106(및 후속 버전)이 필요합니다. |
/v1/audio/transcriptions | whisper-1 |
/v1/audio/translations | whisper-1 |
/v1/audio/speech | tts-1, tts-1-hd |
/v1/chat/completions | 모든 o-series, GPT-4o (Realtime preview 제외), GPT-4o-mini, GPT-4 및 GPT-3.5 Turbo 모델 및 날짜별 릴리스. chatgpt-4o-latest 동적 모델. gpt-4o, gpt-4o-mini, gpt-4 및 gpt-3.5-turbo의 미세 조정된 버전. |
/v1/completions (Legacy) | gpt-3.5-turbo-instruct, babbage-002, davinci-002 |
/v1/embeddings | text-embedding-3-small, text-embedding-3-large, text-embedding-ada-002 |
/v1/fine_tuning/jobs | gpt-4o, gpt-4o-mini, gpt-4, gpt-3.5-turbo |
/v1/moderations | text-moderation-stable, text-moderation-latest |
/v1/images/generations | dall-e-2, dall-e-3 |
/v1/realtime (beta) | gpt-4o-realtime-preview, gpt-4o-realtime-preview-2024-10-01 |
이 목록에는 더 이상 사용되지 않는 모든 모델이 제외됩니다.
카스트에 맞선 달리트 기자의 투쟁 (5) | 2025.03.07 |
---|---|
성심당 경제학 - 어떤 빵이 가장 많이 팔렸을까? (3) | 2025.03.04 |
챗GPT 오피셜 가이드 ① 추론 모델, 언제 어떻게 사용할까? (0) | 2025.02.26 |
SNS 알고리즘은 극우를 좋아하나 - 독일 AfD 지지 콘텐츠를 쏟아낸 소셜미디어 실험 (니먼랩) (0) | 2025.02.24 |
여자 사무라이, 일본 페미니즘의 원형 (1) | 2025.02.20 |