在 Stable Diffusion 以“免费开源”爆火 AI 画画圈后,背后公司的估值快速攀升到了 10 亿美元(约合人民币 69 亿)。知情人士透露,Stability AI 正在筹备一轮融资,金额为 1 亿美元(约合人民币 6.9 亿元)。在此之前,它们才以 1 亿美元估值,通过 SAFE 票据至少融资了 1000 万美元。
如今,随着多方投资机构透露出对 Stability AI 的兴趣,其估值也从 1 亿美元、5 亿美元、最终飙升到了 10 亿美元。而现在距离 Stable Diffusion 对外发布,才过去了一个月。
而且,Stability AI 连明确的商业模式都还没有形成 ——Stable Diffusion 仅是一个在 GitHub 上对外开源的免费项目。创始人向外界表示,对此不用担心,因为他们已经和政府等机构达成了合作。
开放?营利?
Stable Diffusion 的爆火,主要靠的是足够开放。和 Dall・E、Midjourney 不同,它是完全免费、不限次数、任何人都可用的。对硬件的要求也不高,普通显卡上就能跑,显存不到 10GB,也能在几秒钟内生成高清图像。
生成效果上,可以说完全不亚于 Dall・E、Midjourney,因此在社交平台上风靡一时。
目前在 GitHub 上已经揽星超过 2 万。
但争议也随之而来。前段时间,由于 Stable Diffusion 使用过于泛滥,牵涉到艺术版权的问题,一群艺术家们还吵了起来,并把一个非官方账号举报到封号。
它对外开源的特性,对生成图像的监管程度更低,不少人拿它来生成虚假名人照片等违禁图片。Reddit 已经禁掉了 4 个专门用 Stable Diffusion 生成敏感图片的社区。
显然,开源这件事给 Stable Diffusion 带来超高关注度的同时,也带来了一些麻烦。加之它的代码就放在 GitHub 上,这使得别人可以轻而易举高仿一个 Stable Diffusion 出来。
前不久,一家公司照着 Stable Diffusion 做了个盗版,名叫 Photosonic AI,结果在产品社区 Product Hunt 上直接排到了第二名。
Stable Diffusion 的项目基础是由慕尼黑大学机器视觉与学习研究小组和 Runway 的研究人员,基于 CVPR2022 的一篇论文《High-Resolution Image Synthesis with Latent Diffusion Models》,并与其他社区团队合作开发的一款开源模型。
以及关键问题 ——开源项目如何赚钱?Stability AI 还没有给出明确的商业模式。目前,该公司的大部分资金直接来自创始人兼 CEO 伊马德・莫斯塔克。
他现在 39 岁,2005 年硕士毕业于牛津大学数学和计算机科学专业。之前在英国做过对冲基金工作。2019 年,和其他人一起创立了一个项目 Symmitree,旨在为人们降低使用智能手机、上网的成本(不过现在似乎已经关闭了)。
2020 年,他正式联合创立 Stability AI。公司的使命被定为“构建开源 AI 项目”,除了 Stable Diffusion 外,该公司还支持其他开源小组正在研发的工具。
在一次油管上的采访中,莫斯塔克透露,他们已经和政府等机构达成了合作,谈成了很多订单来售卖他们的技术。并且他还表示,模型第一阶段的训练成本仅为 600 万美元,“这只是公司资金的一小部分”。
据了解,该模型训练是在 4000 个 A100 Ezra-1 AI 超大集群上完成的。莫斯塔克表示,公司之前是完全独立的,除了 75 位员工外,没有其他任何控股方。
现在,他们要以 10 亿美元的估值,把 10% 的股份拿出来吸引投资者注资。Lightspeed、Coatue 等知名风投公司,都将是这一席位的有力竞争者。
One More Thing
值得一提的是,Stability AI 因为提倡开源项目,不免会让人联想起 OpenAI。在接受微软的投资后,OpenAI 转为了营利性组织,开始专注于将技术商业化,由此也引发了一些批评。
不过,Stability AI 似乎从一开始就是以营利为目的的公司,创始人莫斯塔克表示,“这样开源项目可以惠及到更多人。”