腾讯混元图像2.0模型来了,AI生图毫秒级响应,新添实施绘画板功能
创始人
2025-05-16 14:04:01
0

智东西

作者 | ZeR0

编辑 | 漠影

智东西5月16日报道,今日,腾讯发布最新混元图像2.0模型(Hunyuan Image2.0),基于模型架构创新,在行业内率先实现实时生图,并具有画面质感超写实的特点。该模型于即日起在腾讯混元官方网站上线,并对外开放注册体验。

体验地址:https://hunyuan.tencent.com/

相比前代模型,腾讯混元图像2.0模型参数量提升了一个数量级,得益于超高压缩倍率的图像编解码器以及全新扩散架构,其生图速度显著快于行业领先模型。

在同类商业产品每张图推理速度需要5到10秒的情况下,腾讯混元可实现毫秒级响应,支持用户可以一边打字或者一边说话一边出图,改变了传统“抽卡—等待—抽卡”的方式。

其图像生成质量也提升明显,通过强化学习等算法以及引入大量人类美学知识对齐,生成的图像可有效避免AIGC图像中的”AI味“ ,真实感强、细节丰富、可用性高。

在图像生成领域专门测试模型复杂文本指令理解与生成能力的评估基准GenEval(Geneval Bench)上,腾讯混元图像2.0模型准确率超过95%,远超其他同类模型。

在发布直播中,腾讯混元演示了多个不同风格的图片生成效果,除了速度快以外,生成的图片在人物特写、动物特写、复古摄影等领域都有不错表现,体现出电影级别质感画面水准。

▲人像摄影风格

▲动物特写

▲复古摄影

▲动漫风格

▲真实人物风格

腾讯混元图像2.0模型还发布了实时绘画板功能,基于模型的实时生图能力,用户在绘制线稿或调整参数时,预览区同步生成上色效果,突破了传统“绘制-等待-修改”的线性流程,可助力专业设计师的创作。

实时绘画板支持多图融合。用户上传多图后,可将多个草图叠加至同一画布自由创作,经过AI 自动协调透视与光影,按照提示词内容生成融合图像,进一步丰富了AI生图的交互体验。

▲图源自创作者一只小娜娜

混元图像生成2.0模型的发布,是腾讯混元在多模态领域的又一里程碑事件。

腾讯混元在图像、视频等模态上持续投入,在2014年率先推出并开源了业内首个中文原生的DiT架构文生图开源模型以及参数量达130亿的腾讯混元视频生成大模型。

会上,腾讯混元还剧透了即将发布的原生多模态图像生成大模型。新模型在多轮图像生成、实时交互体验等方面有突出表现。

相关内容

热门资讯

原创 历... 古代史上,出现了无数的经商奇才,比如说人们熟悉的胡雪岩,作为晚清时期的首富,胡雪岩的一生充满了传奇色...
原创 这... 安徽省,属于我国中部的一个省份,在历史上,更是名人辈出,比如曹操、华佗、李鸿章、包拯、胡雪岩等,都是...
原创 吕... 吕不韦真的是被秦始皇逼杀而死的吗?去看《谏客逐书》就明白了 吕不韦经过''奇货可居'',把羸异人推上...
原创 刘... 汉末的时候社会非常混乱,有实力的诸侯纷纷起来占据领地,刘表也是群雄中的一位。他是王族之后,一开始被朝...
【中央媒体看甘肃】礼县四角坪遗... 9月11日,航拍甘肃省陇南市礼县四角坪遗址。(无人机照片)中新社记者 李亚龙 摄 四角坪遗址是首次发...
原创 知... 《知否知否应是绿肥红瘦》的人物解读第一百一十一期:顶着主角光环盛的明兰,她高嫁给顾廷烨后,办了一场开...
原创 回... 文/马明深马明潜口述张东生整理 马克勤,山东省新泰市人,1919年出生,1938年参加革命并入党,...
原创 刘... 身为大汉皇帝的刘邦,表面看着风光,但手里没啥资源。就这么点儿钱,怎么分怎么都有道理、怎么分又怎么都没...
昆明市晋宁区博物馆入选国家二级... 近日,中国博物馆协会公布了已经评定的第五批国家二级博物馆,昆明市晋宁区博物馆入选其中,荣获国家二级博...
原创 东... 原因有很多,外部环境(北方混战)、内部环境(势力平衡)、运气(桓温早死)等等。这里着重讲讲内部原因。...