NeneAI 模型一览

Powered by NeneCloud
🚀 OpenAI 系列 官方文档
gpt-4.1 非推理模型多模态首选
上下文: 1,047,576 视觉 工具调用
gpt-4.1-mini 高并发,多模态
上下文: 1,047,576 视觉 工具调用 翻译推荐
gpt-4.1-nano 超小多模态模型
上下文: 1,047,576 视觉 工具调用
o4-mini 高并发,速度快,多模态的推理模型。强烈建议使用官方response API 格式调用来获取COT和其他功能。
上下文: 200,000 视觉 工具调用 性能推荐
o4-mini-high 同o4-mini 高强度推理
上下文: 200,000 视觉 工具调用
o4-mini-low 同o4-mini 低强度推理
上下文: 200,000 视觉 工具调用
o3 更强的推理模型,速度更慢,多模态。强烈建议使用官方response API 格式调用来获取COT和其他功能。
上下文: 200,000 视觉 工具调用 质量推荐
openai/gpt-oss-120b OpenAI 最新推出的 open-weight 模型 (120B版本)
上下文: 131,072 新模型 工具调用
openai/gpt-oss-20b OpenAI 最新推出的 open-weight 模型 (20B版本)
上下文: 131,072 新模型 工具调用
gpt-5 数据截止至2024/10。速度非常慢。
上下文: 400,000 视觉 工具调用 推荐
gpt-5-minimal minimal 模式,低思考量。
上下文: 400,000 视觉 工具调用
gpt-5-low 低推理强度
上下文: 400,000 视觉 工具调用
gpt-5-high 高推理强度
上下文: 400,000 视觉 工具调用
gpt-5-mini 数据截止至2024/05/31
上下文: 400,000 视觉 工具调用 推荐
gpt-5-mini-minimal
上下文: 400,000 视觉 工具调用
gpt-5-mini-low
上下文: 400,000 视觉 工具调用
gpt-5-mini-high
上下文: 400,000 视觉 工具调用
gpt-5-nano 数据截止至2024/05/31
上下文: 400,000 视觉 工具调用 推荐
gpt-5-nano-minimal
上下文: 400,000 视觉 工具调用
gpt-5-nano-low
上下文: 400,000 视觉 工具调用
gpt-5-nano-high
上下文: 400,000 视觉 工具调用
gpt-5-chat-latest 非推理模型。数据截止至2024/09/30
上下文: 400,000 视觉 工具调用 推荐
gpt-5-codex openai codex 专用模型
上下文: 400,000 代码 & 工具调用 Codex 专用
🌐 Google Gemini 系列 官方文档
gemini-2.5-pro 谷歌最新的多模态模型 知识截止2025一月 已支持推理摘要,思维预算
上下文: 1,048,576 视觉 工具调用 质量推荐
gemini-2.5-flash 更快速 可手动开启联网 已支持推理摘要。可以使用 gemini-flash-latest 自动更新最新版。
上下文: 1,048,576 视觉 工具调用 性能推荐
gemini-2.5-flash-thinking 同上 思考模式 已支持推理摘要
上下文: 1,048,576 视觉 工具调用
gemini-2.5-flash-nothinking 同上 非思考
上下文: 1,048,576 视觉 工具调用
gemini-2.5-flash-lite 更快速的小模型 可手动开启联网。可以使用 gemini-flash-lite-latest 自动更新最新版。
上下文: 1,048,576 视觉 工具调用 速度推荐
gemini-2.5-flash-lite-thinking 同上 强制开启思考模式
上下文: 1,048,576 视觉 工具调用 速度推荐
gemini-2.5-flash-lite-nothinking 同上 非思考模式,以降低延迟
上下文: 1,048,576 视觉 工具调用 速度推荐
gemini-2.5-flash-image-preview 图像预览模型(上下文: 40,960),代替旧的 gemini-2.0-flash-exp
上下文: 40,960 视觉 工具调用
𝕏 XAI 系列 目前不对XAI 模型提供高可用性
x-ai/grok-4-fast:free * free 版本为官方活动,持续到活动结束,尚未通知时间。
上下文: 256,000 工具调用
grok-4-fast 支持推理,高速版本
上下文: 256,000 工具调用
grok-4-fast-non-reasoning 非思考模式以降低延迟
上下文: 256,000 工具调用
🐋 Deepseek 系列
deepseek-chat 官方 DS V3.2 版本。不思考。
上下文: 64,000 工具调用
deepseek-reasoner 官方 DS V3.2 版本。思考。
上下文: 64,000 工具调用
deepseek/deepseek-r1-0528:free 第三方R1 0528 中速
上下文: 163,840
deepseek/deepseek-r1:free 第三方慢速
上下文: 163,840
deepseek/deepseek-chat-v3.1:free 第三方中速
上下文: 163,840
deepseek-ai/DeepSeek-R1-fast 第三方快速
上下文: 128,000
⚙️ QWEN / QWEN3 系列
Qwen/Qwen3-30B-A3B-fast 量化版本 第三方(保留)
上下文: 41,000 工具调用
Qwen/Qwen3-32B-fast 量化版本 第三方(保留)
上下文: 41,000
qwen/qwen3-coder:free 免费 coder 版
上下文: 32,000
qwen/qwen3-coder coder 专业版
上下文: 262,144
qwen/qwen3-235b-a22b-2507 235B 版本 2507 发布
上下文: 262,144
qwen/qwen3-30b-a3b-instruct-2507 30B 指令版 2507 发布
上下文: 131,072
📜 Claude 系列 暂时不对 CLAUDE 模型提供高可用性 官方文档
claude-neptune-v5 官方 Neptune V5 系列 (上下文: 32,000)
上下文: 32,000 视觉 工具调用 质量推荐
claude-neptune-v5-thinking 官方 Neptune V5 强制思考模式 (上下文: 32,000)
上下文: 32,000 视觉 工具调用