始智AI wisemodel.cn社区是源自中国的中立开放的AI开源社区。正在,欢迎加入共同成长。wisemodel社区上线等资源上线,价格实惠,灵活方便,支持在线微调训练模型,及和,并。
CogView3-Plus是由智谱技术团队推出的图像生成模型,它是 CogView3 的 DiT 版本。在CogView3(ECCV24)的基础上引入了最新的 DiT 框架,以实现整体性能的进一步提升。目前CogView3-Plus模型已经发布到始智AI wisemodel开源社区,同时提供算力服务,欢迎大家到社区进行部署和使用,很快wisemodel也会提供部署和使用教程。
此前,CogView3 是一个基于级联扩散的 text2img 模型,一共包含三个阶段:
第二阶段利用中继扩散过程,执行 2 倍的超分辨率生成,从 512x512 输入生成 1024x1024 的图像。
第三阶段将生成结果再次基于中继扩散迭代,生成 2048×2048 高分辨率的图像。
在实际效果公海赌赌船官网上,CogView3 在人工评估中比目前最先进的开源文本到图像扩散模型 SDXL 高出 77.0%,同时只需要 SDXL 大约 1/10 的推理时间。
CogView-3-Plus采用了Zero-SNR 扩散噪声调度,并引入了文本-图像联合注意力机制。与常用的 MMDiT 结构相比,它在保持模型基本能力的同时,有效降低了训练和推理成本。CogView-3Plus 使用潜在维度为 16 的 VAE。
借由混合分辨率训练,CogView-3Plus 模型支持 512 ~ 2048 像素区间内分辨率的灵活生成。
在广告与营销领域,一方面可用于广告创意设计,依据营销文案迅速生成高质量广告图片,为广告公司提供丰富创意源泉。另一方面,在营销活动策划中,能为线上线下活动提供视觉支撑,根据活动主题生成相关场景图和互动素材,提升活动趣味性与参与度。
媒体与出版行业中,新闻媒体可借助该模型快速生成与新闻内容相关的图片,提高新闻可视化程度与吸引力。同时,它还能为书籍、杂志等出版物创作插画,在漫画创作方面,可为创作者提供灵感和素材,助力快速构建漫画场景和角色形象,提高创作效率。
影视与娱乐领域,在电影、电视剧前期制作中,可用于生成场景概念图和角色设计图等,帮助导演、美术指导等主创人员更好地呈现创意和构思,降作成本和时间。在游戏开发方面,能为开发者提供角色、场景、道具等设计支持,快速生成游戏所需美术资源,加快游戏开发进程。还可用于创作娱乐性图片内容,满足用户在社交媒体等平台上的娱乐需求。
教育与培训领域,教师可以利用该模型生成与教学内容相关的图片,帮助学生更好地理解和掌握知识。在在线教育平台上,能为课程内容提供丰富视觉素材,增强课程趣味性和吸引力,提高学生学习积极性和参与度。
设计与艺术方面,为平面设计师提供创意灵感和设计素材,助力他们快速完成标志设计、包装设计、海报设计等各种平面设计项目。艺术家也可以将该模型作为创作工具,与自己的艺术理念和技巧相结合,创作出独特的艺术作品,拓展艺术创作的边界。
开源社区建设需要长期坚持和投入,更需要广大用户的积极参与、贡献和维护,欢迎大家加入wisemodel开源社区的志愿者计划和开源共创计划。期待更多开发者将开源成果,包括模型、数据集和代码等发布到 wisemodel.cn 社区,共建中立、开放的AI开源社区生态。欢迎扫码添加wisemodel微信,申请加入wisemodel社群,持续关注wisemodel.cn开源社区动态,
始智AI wisemodel社区自2023年9月上线以来,逐渐成为影响力日益扩大的中立开放的AI开源社区,为了加快公司发展,我们长期需要技术、运营等人才加盟,技术侧重在AI infra、后端开发,熟悉K8S、模型训练和推理等技术, 以及熟悉开发者生态运营的成员,欢迎感兴趣的朋友加盟,可以通过添加wisemodel微信,或者将简历投递到邮箱:
欢迎投稿分享人工智能领域相关的优秀研究成果,鼓励高校实验室、大企业研究团队、个人等,在wisemodel平台上分享各类优质内容,可以是AI领域最新论文解读、最新开源成果介绍,也可以是关于AI技术实践、应用和总结等。投稿可以发邮件到,也可以扫码添加wisemodel微信。
始智AI wisemodel.cn开源社区由清华校友总会AI大数据专委会副秘书长刘道全创立,旨在打造和建设中立开放的AI开源创新社区,将打造成“HuggingFace”之外最活跃的AI开源社区,汇聚主要AI开源模型、数据集和代码等,欢迎高校科研院所、大型互联网公司、创新创业企业、广大个人开发者,以及政府部门、学会协会、联盟、基金会等,还有投资机构、科技媒体等,共同参与建设AI开源创新生态。