Meta开发出文本生成图像模型CM3Leon,号称业界最佳

编辑:许一诺     来源:IT之家    阅读量:7184    时间:2023-07-17 12:10:20    阅读量:12106   

,Meta 公司宣布开发出一款名为 CM3Leon 的人工智能模型,该模型可以根据文本生成高质量的图像,也可以为图像生成文本描述,甚至可以根据文本指令编辑图像。

IT之家注:CM3Leon 生成结果对比 DALL-E 2 生成结果(下)

Meta 公司称,这款模型在文本到图像生成方面达到了业界最高水平,超过了谷歌、微软等公司的产品。CM3Leon 是一种基于 Transformer 的模型,Transformer 是一种利用注意力机制来处理输入数据的神经网络结构。相比于其他基于扩散的模型,Transformer 模型更加高效,训练速度更快,计算成本更低。

Meta 公司展示了 CM3Leon 在不同任务上的优异表现,包括根据复杂的文本提示生成图像,根据文本指令编辑图像,以及生成图像描述和回答。Meta 公司表示,CM3Leon 是图像生成和理解领域的一大进步,但也承认该模型可能存在数据偏见的问题,并呼吁行业加强透明度和监管。

Meta 公司没有透露是否会公开发布 CM3Leon 模型。

广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

精彩阅读