国家知识产权局信息显示,淘宝(中国)软件有限公司申请一项名为“图像生成方法、目标文生图生成式模型的生成方法及装置”的专利,公开号 CN 118840447 A,申请日期为 2024 年 9 月。
专利摘要显示,本申请公开了一种图像生成方法、目标文生图生成式模型的生成方法及装置。涉及人工智能领域,该方法包括:接收包含目标物体的前景图片和目标物体对应的文本信息;通过目标多模态视觉语言模型依据前景图片和文本信息,确定目标物体对应的目标场景的描述信息和布局信息;通过目标文生图生成式模型依据前景图片、描述信息以及布局信息生成目标物体的场景图,其中,目标文生图生成式模型是依据训练样本集对初始文生图生成式模型进行训练得到的。本申请解决了相关技术中依据人工输入的文本描述信息生成物体的场景图,存在文本描述信息的准确性较低,导致生成场景图的视觉效果较差的技术问题。