1月28日凌晨,国产大模型研发公司DeepSeek在GitHub平台上正式推出了Janus-Pro多模态大模型,标志着其在文本生成图像领域的进一步拓展。
据DeepSeek官方介绍,Janus-Pro是此前于2024年11月13日发布的JanusFlow大模型的高级版本。与前一代模型相比,Janus-Pro在多个方面进行了显著优化。训练策略得到了改进,训练数据集也得到了扩展,同时模型规模也有所增加。这些改进措施共同促使Janus-Pro在多模态理解和文本到图像的指令跟踪功能方面取得了重要进展。此外,该模型在文本到图像生成的稳定性方面也有所增强。
在性能测试方面,DeepSeek发布的测试结果显示,Janus-Pro在GenEval和DPG-Bench这两项基准测试中,表现优于Stable Diffusion和OpenAI的DALL-E 3。这一结果展示了Janus-Pro在文本生成图像领域的竞争力。
值得注意的是,目前Janus系列的四款模型均已实现开源,供开发者和研究人员使用。这一举措有助于推动文本生成图像技术的进一步发展,并促进相关领域的创新和应用。
DeepSeek此次发布的Janus-Pro多模态大模型,无疑为文本生成图像领域带来了新的选择和可能性。未来,该模型有望在多个应用场景中发挥重要作用,推动相关技术的不断进步。