文字推理、長上下文理解、圖像與影片生成。為複雜工作流和視覺創作而生。
1.6兆 MoE 架構,登頂 SWE-Bench。以極低成本匹配頂級模型的複雜邏輯推理和程式設計能力。
百萬 token 上下文,完美 MCP 整合。2026 年智慧體工作流和工具執行的終極引擎。




首個支援聯網搜尋生成的模型,精準的中英文本渲染。每張圖片僅需 $0.034 — 僅為 GPT-Image-2 成本的 1/5。




首個支援聯網搜尋生成的模型,精準的中英文本渲染。每張圖片僅需 $0.034 — 僅為 GPT-Image-2 成本的 1/5。
支援原生音訊口型同步的15秒多鏡頭敘事,端到端的圖生影片管線。視覺品質和運動連貫性媲美 VEO3。
支援關鍵影格控制的文/圖生影片,3-15秒多畫幅輸出與原生音訊合成。物理模擬與運動連貫性媲美 VEO3。
為智慧體時代而生。純文字提示定義獨特聲音。自然注入笑聲、嘆氣和動態情感。
登頂 Hugging Face TTS 排行榜。3 秒樣本即可完美複製任何聲音,支援 32 種語言。
完全相容標準 OpenAI SDK,支援文字、影片、視覺和 TTS。