DeepSeek深夜发布全新多模态大模型 性能碾压OpenAI

DeepSeek深夜发布全新多模态大模型 性能碾压OpenAI

文章图片

DeepSeek深夜发布全新多模态大模型 性能碾压OpenAI

快科技1月28日消息 , 爆火的国产大模型DeepSeek又放大招 , 今天凌晨突然发布Janus-Pro多模态大模型 , 进军文生图领域 。
在GenEval和DPG-Bench基准测试中 , Janus-Pro-7B不仅击败了OpenAI的DALL-E 3 , 还击败了Stable Diffusion、Emu3-Gen等热门模型 。
Janus-Pro采用MIT开源协议 , 这意味着可无限制用于商业场景 。
【DeepSeek深夜发布全新多模态大模型 性能碾压OpenAI】DeepSeek方面表示 , 该大模型是2024年11月13日发布的JanusFlow大模型的高级版本 。
相比前代模型 , Janus-Pro优化训练策略、扩展了训练数据 , 模型也更大 。
得益于此 , Janus-Pro在多模态理解和文本到图像的指令跟踪功能方面取得重大进步 , 同时还增强了文本到图像生成稳定性 。
虽然Janus-Pro暂时只能处理384x384分辨率的图像 , 但考虑到模型如此“紧凑”却能达到如此水准 , 足以令人惊艳 。
作为多模态模型 , Janus-Pro不仅能文生图 , 还能对图片进行描述 , 识别地标景点 , 识别图像中的文字 , 并能对图片中的知识进行介绍 。

    推荐阅读