2024-10-30
一夜之间,名为“red_panda”(小熊猫)的神秘文本生成图像模型在AI圈爆红,迅速攀上排行榜巅峰,将顶尖模型如Flux和Midjourney等远远甩在身后。
“red_panda”的ELO评分比Flux 1.1 Pro高出100多,胜率达79%,平均每7秒即可生成一张高质量图像。用户对其生成效果赞不绝口。具体表现上,它的生成效果和质量如同从Flux 1.0升级至Flux 1.1 Pro般惊艳。
然而更为引人注目的是,这一强大模型尚无人认领,引发了众多猜测:
- Midjourney V7:由于效果优异且生成质量高,一部分人认为这可能是传闻中的Midjourney V7版本。
- DALL-E 4:有猜测指出该模型或为OpenAI的DALL-E 4,因为图片文件后缀中曾出现OpenAI的痕迹。
- Mistral AI或Recraft:也有人认为可能是Mistral AI或Recraft的模型,因为此前在未公开的测试版中,曾发现与“小熊猫”相关的名称和提示。
- 中国厂商:部分网友猜测,red_panda可能来自中国。名字带有显著的“中国风”色彩,加之国内公司在视频生成领域的快速进步,使得此类高水平的AI模型产生于中国厂商之手并非不可能。
red_panda目前只能在匿名竞技场上进行测试。竞技场规则为随机匹配两个匿名模型,用户从生成图像中选择符合提示词的作品。以下为red_panda与各模型的实测对比结果:
1. VS SD 3 Medium:胜出,3D文物渲染图,细节复杂且质感真实。
2. VS SD 3.5 Large:负于SD 3.5 Large,复杂哥特式建筑渲染。
3. VS Flux 1(开发版):胜出,办公室场景中的金融顾问咨询场景。
4. VS neptune_next:胜出,南极游轮海报设计。
5. VS Flux 1(schnell):胜出,复古香水瓶3D渲染。
尽管red_panda未能在所有对比中取胜,但整体表现相当出色,展现了强大的生成能力。对其生成效果感兴趣的用户可在竞技场测试自己的运气。
目前,red_panda的出处仍无定论。多数用户倾向于中国公司出品,认为其名称和生成风格极具“中国味”,尤其是近年国内厂商在生成式AI上的表现已跻身国际前列。字节跳动、快手等公司被点名推测。此外,也有一部分人倾向于其为Midjourney V7或Stable Diffusion 3.5,甚至是OpenAI DALL-E系列的一部分。
无论red_panda最终来自何方,其出色表现已经成功引起了业内的关注和期待。
「上海染新信息技术有限公司」