
Ideogram 正式推出 4.0 版本文生图大模型,本次以开放权重形式开源。
据官方介绍,新版核心特性包含原生 2K 高清出图、透明背景生成、依托边框选区精准控制画面布局,同时优化图内文字渲染效果,十分适配 LOGO、海报类设计需求。厂商透露,可编辑文字与图层功能将于后续上线。
该模型支持本地硬件部署,使用者可基于自有数据集开展微调。模型权重与源码已在 GitHub 开放下载,商用场景则需要另行购买授权。
DesignArena 榜单数据显示,Ideogram 4.0 在全部开源权重模型中位列榜首,仅有 OpenAI、谷歌的闭源模型综合得分优于它;在文生图赛道的画质专项排名第一,综合总榜位列第九。根据 Ideogram 官网信息,官方托管 API 提供三档不同画质规格的调用方案。

Ideogram 4.0 现已上线官网网页端,同时入驻多家合作平台:Hugging Face、ComfyUI、fal、Runware、Magnific、Krea AI、Leonardo AI、Picsart、Cloudflare、Replicate、Gamma、Flora AI、Kittl。在本次基准提示词实测中,该模型表现优于 Midjourney v8,整体水准和 Flux 基本持平,但不及 GPT-Image-2、Nano Banana Pro 以及 Luma Uni-1.1。注:本次测试仅采用单组提示词,重点考核模型遵循指令、绘制训练数据中少见抽象内容(例如骑马宇航员)的能力,实际选型仍建议自行多轮测试验证。
