Control Reasoning Model Effort Level

Given a prompt, the model will return one or more predicted completions, and can also return the probabilities of alternative tokens at each position. Create a completion for the provided prompt and parameters Official Documentation: https://platform.openai.com/docs/guides/reasoning?api-mode=responses

Endpoint

POST http://v98store.com/v1/chat/completions

cURL Command

curl -X POST 'http://v98store.com/v1/chat/completions' \ -H 'Content-Type: application/json' \ -H 'Authorization: Bearer YOUR_TOKEN' \ -d '{ "model": "o4-mini", "max_tokens": 500, "messages": [ { "role": "user", "content": "Hello" } ], "temperature": 1, "stream": true, "reasoning_effort": "medium" }'

Parameters

Name	In	Required
Content-Type	header	Yes
Accept	header	Yes
Authorization	header	No
X-Forwarded-Host	header	No

Request Body

Example

{
  "model": "o4-mini",
  "max_tokens": 500,
  "messages": [
    {
      "role": "user",
      "content": "Hello"
    }
  ],
  "temperature": 1,
  "stream": true,
  "reasoning_effort": "medium"
}

Responses

200 -

Example

{
  "id": "chatcmpl-123",
  "object": "chat.completion",
  "created": 1677652288,
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "\n\nHello there, how may I assist you today?"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 9,
    "completion_tokens": 12,
    "total_tokens": 21
  }
}