腾讯混元图像2.0模型来了,AI生图毫秒级响应,新添实施绘画板功能
创始人
2025-05-16 14:04:01
0

智东西

作者 | ZeR0

编辑 | 漠影

智东西5月16日报道,今日,腾讯发布最新混元图像2.0模型(Hunyuan Image2.0),基于模型架构创新,在行业内率先实现实时生图,并具有画面质感超写实的特点。该模型于即日起在腾讯混元官方网站上线,并对外开放注册体验。

体验地址:https://hunyuan.tencent.com/

相比前代模型,腾讯混元图像2.0模型参数量提升了一个数量级,得益于超高压缩倍率的图像编解码器以及全新扩散架构,其生图速度显著快于行业领先模型。

在同类商业产品每张图推理速度需要5到10秒的情况下,腾讯混元可实现毫秒级响应,支持用户可以一边打字或者一边说话一边出图,改变了传统“抽卡—等待—抽卡”的方式。

其图像生成质量也提升明显,通过强化学习等算法以及引入大量人类美学知识对齐,生成的图像可有效避免AIGC图像中的”AI味“ ,真实感强、细节丰富、可用性高。

在图像生成领域专门测试模型复杂文本指令理解与生成能力的评估基准GenEval(Geneval Bench)上,腾讯混元图像2.0模型准确率超过95%,远超其他同类模型。

在发布直播中,腾讯混元演示了多个不同风格的图片生成效果,除了速度快以外,生成的图片在人物特写、动物特写、复古摄影等领域都有不错表现,体现出电影级别质感画面水准。

▲人像摄影风格

▲动物特写

▲复古摄影

▲动漫风格

▲真实人物风格

腾讯混元图像2.0模型还发布了实时绘画板功能,基于模型的实时生图能力,用户在绘制线稿或调整参数时,预览区同步生成上色效果,突破了传统“绘制-等待-修改”的线性流程,可助力专业设计师的创作。

实时绘画板支持多图融合。用户上传多图后,可将多个草图叠加至同一画布自由创作,经过AI 自动协调透视与光影,按照提示词内容生成融合图像,进一步丰富了AI生图的交互体验。

▲图源自创作者一只小娜娜

混元图像生成2.0模型的发布,是腾讯混元在多模态领域的又一里程碑事件。

腾讯混元在图像、视频等模态上持续投入,在2014年率先推出并开源了业内首个中文原生的DiT架构文生图开源模型以及参数量达130亿的腾讯混元视频生成大模型。

会上,腾讯混元还剧透了即将发布的原生多模态图像生成大模型。新模型在多轮图像生成、实时交互体验等方面有突出表现。

相关内容

热门资讯

原创 偷... 谈婚论嫁对每个人来说都是人生中的一件大事,但在一些农村地区,适婚的年轻人想要找到合适的结婚对象已经变...
沙龙|跨学科视野下的近现代图景 当代经济社会领域的一系列革命性变迁正深刻重构了人类社会秩序,在世界百年未有之大变局中回顾全球近现代历...
湖南益阳桃花江竹海风景区建设竹... 资讯文章标题:湖南益阳桃花江竹海风景区打造竹艺创意园区,国际竹编艺术家驻村创作 正文: 湖南益阳桃花...
2025木工开料机变频真空泵优... 2025木工开料机变频真空泵优质厂家推荐榜 - 聚焦响应及时与行业适配 据《2025中国木工机械行...
上海佑有金珠宝贸易有限公司成立... 天眼查App显示,近日,上海佑有金珠宝贸易有限公司成立,法定代表人为李杰,注册资本300万人民币,经...
原创 宋... 宋希濂是国民党中脾气最倔强的将军之一,外号湖南骡子十分贴切。1949年末,他和胡宗南一起策划撤退,打...
景泰蓝艺术展亮相国家大剧院 观众在欣赏景泰蓝艺术品。 本报讯(记者 袁云儿)景泰流芳,蓝韵新生。12月15日,“景泰蓝传承与创新...
原创 抗... 血沃山河:抗日战争中牺牲的国民党高级将领事迹录 在中华民族抗日战争的壮阔史诗中,无数国民党爱国将领挺...
米香酒的历史起源于哪个朝代?核... 米香型白酒作为中国白酒的重要分支,其历史可追溯至千年之前,其独特的酿造工艺和风味承载着中华酒文化的深...