腾讯混元图像2.0模型来了,AI生图毫秒级响应,新添实施绘画板功能
创始人
2025-05-16 14:04:01
0

智东西

作者 | ZeR0

编辑 | 漠影

智东西5月16日报道,今日,腾讯发布最新混元图像2.0模型(Hunyuan Image2.0),基于模型架构创新,在行业内率先实现实时生图,并具有画面质感超写实的特点。该模型于即日起在腾讯混元官方网站上线,并对外开放注册体验。

体验地址:https://hunyuan.tencent.com/

相比前代模型,腾讯混元图像2.0模型参数量提升了一个数量级,得益于超高压缩倍率的图像编解码器以及全新扩散架构,其生图速度显著快于行业领先模型。

在同类商业产品每张图推理速度需要5到10秒的情况下,腾讯混元可实现毫秒级响应,支持用户可以一边打字或者一边说话一边出图,改变了传统“抽卡—等待—抽卡”的方式。

其图像生成质量也提升明显,通过强化学习等算法以及引入大量人类美学知识对齐,生成的图像可有效避免AIGC图像中的”AI味“ ,真实感强、细节丰富、可用性高。

在图像生成领域专门测试模型复杂文本指令理解与生成能力的评估基准GenEval(Geneval Bench)上,腾讯混元图像2.0模型准确率超过95%,远超其他同类模型。

在发布直播中,腾讯混元演示了多个不同风格的图片生成效果,除了速度快以外,生成的图片在人物特写、动物特写、复古摄影等领域都有不错表现,体现出电影级别质感画面水准。

▲人像摄影风格

▲动物特写

▲复古摄影

▲动漫风格

▲真实人物风格

腾讯混元图像2.0模型还发布了实时绘画板功能,基于模型的实时生图能力,用户在绘制线稿或调整参数时,预览区同步生成上色效果,突破了传统“绘制-等待-修改”的线性流程,可助力专业设计师的创作。

实时绘画板支持多图融合。用户上传多图后,可将多个草图叠加至同一画布自由创作,经过AI 自动协调透视与光影,按照提示词内容生成融合图像,进一步丰富了AI生图的交互体验。

▲图源自创作者一只小娜娜

混元图像生成2.0模型的发布,是腾讯混元在多模态领域的又一里程碑事件。

腾讯混元在图像、视频等模态上持续投入,在2014年率先推出并开源了业内首个中文原生的DiT架构文生图开源模型以及参数量达130亿的腾讯混元视频生成大模型。

会上,腾讯混元还剧透了即将发布的原生多模态图像生成大模型。新模型在多轮图像生成、实时交互体验等方面有突出表现。

相关内容

热门资讯

广西贺州:云雾轻笼古村落 昭平...   近日,广西贺州市富川瑶族自治县岔山村雨后初霁,青山间云雾未散。晨雾织就的轻纱与远山黛色交相辉映,...
出国学纯艺术的人,毕业后能做哪... 艺术留学专业千千万, 但最让家长头疼的,无疑是纯艺术专业: 尽管家长们对像“服装、平面、室内”等专业...
法国兰斯美术馆馆藏油画亮相湖北... 5月16日,湖北武汉,“流动的调色板:从柯罗到印象派”展览在湖北省博物馆开展。本次展览展出了法国兰斯...
活动 | 初赛结果公布!“20... 01 对于无法脱离情感的我们来说,世界的价值和意义,总是存在于感知之中。千千万万的感知如同层层架设的...
免票、半价!许昌多家景区明确→... “5·19”中国旅游日即将到来许昌文旅为大家准备了超多惊喜优惠从文化体验到自然风光从亲子互动到美食享...
“2025敦煌艺术大典”四大奖... 封面新闻记者 张杰 在中国,乃至在全世界,敦煌都不只是一个地名,也不只是“敦煌学”,它像一个斑斓壁画...
意大利驻中国大使馆主办意大利裁... 源自意大利比耶拉地区的纺织企业DRAGO迪拉戈,近日正式宣布以合资公司形式进入中国市场,并于意大利大...
“高原妈妈”品牌助力庆阳绣娘走... 原标题:“高原妈妈”品牌助力庆阳绣娘走上国际艺术舞台 庆阳融媒记者 路娜 文/图 5月14日,“高原...
宁夏石嘴山市首届残疾人文化艺术... 5月15日,第三十五次“全国助残日”宁夏系列活动,全区残疾人文化周暨石嘴山市首届残疾人文化艺术节启动...
“淡季价格”玩转端午,云南两古... 5月16日,端午前日(5月30日)火车票开售。开屏新闻记者从12306客户端查询获悉,5月30日下午...