基石智算CoresHub 率先上线 20B 参数的 MMDiT 模型 Qwen-Image,该模型由阿里通义千问团队开源。
作为 Qwen 系列的首个文生图基础模型,它在复杂文本渲染、精确图像编辑、多行布局、段落级生成以及细节刻画方面表现亮眼;不论是通用图像生成还是多种艺术风格、高级编辑操作,它都能轻松驾驭,在海报设计场景中尤其出色。现在,借助基石智算强大的算力支持与便捷的平台服务,用户能够快速体验到 Qwen-Image 的魅力,将创意高效转化为现实。
模型亮点
超强文本渲染能力:Qwen-Image 在复杂文本生成与渲染方面表现出众,支持多行排版、段落级布局及细粒度细节呈现,无论是英文还是中文,都能实现高度保真的视觉输出。
图像编辑一致性:依托强化的多任务训练范式,Qwen-Image 在图像编辑过程中能够精准修改目标区域,同时保持整体画面的视觉一致性与语义连贯性。
行业SOTA 性能:多项公开基准测试结果显示,Qwen-Image 在多种图像生成与编辑任务中均取得了业内顶尖(SOTA)的成绩,充分验证了其卓越的综合实力。
使用步骤
1.登录 coreshub.cn,进入模型广场,选择 Qwen-Image 模型,点击模型部署。
2.开始部署模型,资源类型选择单卡 4090D 即可,立即部署模型,待模型部署成功后,复制外网链接到浏览器打开。


3.等待 ComfyUI 页面加载成功后,选择 Qwen-Image 模板,在框中输入你的提示词,点击运行,即可开始生成图片。


效果展示
一起来感受下 Qwen-Image 的魅力吧。
提示词:一只戴着牛仔帽的柴犬站在西部酒吧门口,嘴里叼着的木牌上用歪歪扭扭的手写体写着 “今天不营业,去追羊啦”,背景的酒桶上还有褪色的英文标语 “Best Whiskey”。

提示词:漂浮在云端的棉花糖城堡,城堡大门是用曲奇饼干做的,上面用融化的巧克力写着 “甜梦入口处”,城门两侧的棒棒糖立柱上缠着彩色糖纸,上面印着迷你英文字母 “Welcome”。

提示词:复古街机厅里,一台像素风格的游戏机屏幕亮着,游戏画面里的主角举着一块霓虹灯牌,牌上是闪着蓝光的中文 “通关秘籍:点赞收藏”,机器侧面的贴纸还有模糊的日文 “最高のゲーム”。

欣赏了 Qwen-Image 惊艳的文生图效果,你是不是也想试一试?那就快来基石智算(coreshub.cn),开始你的 AI 创作吧。