“啊哒”~嘤嘤怪+硬妹，一个经不起批评的人。科幻文学硕士，星球大战中文网副站长。关注科技、游戏、艺术、美食、历史等领域。曾服务于多家主流媒体，主持过文化、科技、游戏等栏目。创作，是要发现和体现属于自己的趣味。此博客登载本人原创文字和编译内容，未经授权严禁转载。 “伏枥骅骝千里志，经霜乔木百年心。”

莫慌，AI绘画杀不死艺术

2022 年 12 月 1 日（编辑过）

AI绘画一日，人间一年。

上半年走红的Dall-E 2、Midjourney，下半年风头完全被Stable Diffusion盖过。

近期火热的绘图产品，名字里都有“diffusion”，它们均得益于人工智能“扩散”算法。该算法突破了AI绘画的应用临界点，更易上手，效果更好。

机器作画已经有半个世纪的历史，而两年之内，AI绘画忽然成了“进击的巨人”，不仅质量肉眼可见的提升，生成图片的速度也从年初的几个小时缩短到十几秒钟。

AI绘画技术的大幅度进步，激发了人们对“创意AI”的兴趣——从美术到诗歌，一系列AI工具正在模仿人类的创造力。但没有什么人真正觉得惶恐。

前一阵子，有不少人猜测生物学家颜宁离美归国，是因为AlphaFold人工智能系统能够预测蛋白质结构，被抢了饭碗。

实际上，能写新闻资讯的软件早就存在，并没有记者为此失业。AI连写豆腐块的人都无法替代，更不用说能替代顶尖科学家了。

扩散算法是什么

当下的人工智能模型，使用的都是深度学习神经网络。自学习模型，比如GPT-3是其中最著名的模型，它会在大约45TB文本数据的神经网络上“学习”，生成和人类产出相差无几的作品。

Stable Diffusion是深度学习家族的一部分。具体来说，Stable Diffusion通过潜在的扩散模型，学习图像和文本之间的联系。它的工作原理是，获取图像数据，并对其添加“噪点”。噪点，也叫噪声，是指数码摄影器材拍摄的图像中，存在的粗糙点，一般受电子干扰产生。

一幅画面被逐步加入噪点，一直到整个画面都变成白噪点。该模型记录这一过程，进行逆转，给AI学习。

从AI的角度，先看到的是一幅布满噪点的画面，再看到画面一点点变清晰，最后成为画作。AI学的是整个去噪点的过程，特别是如何处理高斯噪声，最后生成画作。

高斯噪声指的是概率密度函数服从高斯分布（即正态分布）的一类噪声，扩散算法添加高斯噪声，一是为了验证“实际”图像的有效性，因为使用环境里的图像都是带噪点的；一是为了方便学习，只要噪点不符合标准正态分布，就算失效。

Stable Diffusion的基础数据库叫LAION-Aesthetics，包含了带图说的图像，还根据“审美风格”进行过滤。其他经训练的人工智能模型也对数据库进行“修正”，来预测人们如何回答“你有多喜欢这幅画”时的打分评级，以便消除一些黄暴内容。

和“前辈”有何差别

Stable Diffusion和Dall-E 2、Midjourney类似，都要靠“文字描述”生成图像。

不过，Stable Diffusion是开源的，其基础代码也是公开的。而Open AI和Google都没有开放自己的人工智能模型。

Stability AI由4000多个英伟达A100 GPU组成，在亚马逊云（AWS）中运行。据报道，Stability AI公司的运营和云支出成本，超过5000万美元。

该公司声称可以提供“速度和质量的突破”，内存低于10G的GPU也能跑。他们还会提供运行在AMD、苹果M1/M2芯片的版本。

目前，Stable Diffusion的功能是，可以在几秒内将文本转换为512x512像素的图像；图像可以转换、放大、修改和替换；使用GFP-GAN建模，允许用户上传模糊的面部图像，进行放大或恢复原貌。

上个月，Stability AI公司融资1.01亿美元。首席执行官Emad Mostaque毕业于牛津大学，获数学和计算机科学硕士学位，此前曾在多家对冲基金担任分析师。目前，该公司估值10亿美元，除了Stable Diffusion，还有Dance Diffusion——可以进行音乐剪辑。

Stability AI的赚钱计划是，为客户训练“私有”模型和通用基础设施平台。它有一个平台DreamStudio，个人用户也能访问。现在DreamStudio拥有超过150万用户，创建了2亿张左右的图像。算上所有渠道，Stable Diffusion用户超过1000万。

该公司还高调聘请了Google科学家、未来学家Daniel Jeffries。

这算艺术吗？

随着各种各样的人工智能公布，相关的道德法律问题也在增多。Stable Diffusion允许生成真人图像，问题就愈发显得“严重”。

Stable Diffusion已经被用户拿来创作了不少敏感内容，伪造的名人照片满天飞。Getty Images已经禁止上传Stable Diffusion生成的图片，原因是担心知识产权纠纷。

美国众议院众议员Anna G. Eshooo最近公开发信，敦促美国国家安全顾问和科学技术政策办公室解决这些“不安全的模型”。

Stability AI在发布公告中，公布了一份“允许商业和非商业用途的宽松许可证”，实际上就是和用户之间的协议。它指望用户自我规范行为，做“正确的事”，也没什么效力处罚不遵守规则的用户。

除了法律问题，人工智能生成的作品，也饱受怀疑。

反正美国版权局认为这些图像“不是艺术”。今年2月，版权局的审查委员会就驳回了由人工智能生成的图片的索赔申请。

审查委员会强调，“人类作者身份是版权保护的先决条件”，并且需要“人类思想与创造性表达之间的关系”。美国联邦法院也在近期的判决中认为人工智能不能算专利“发明人”。

人工智能艺术吸引力很大，虽然法律上不被承认，但市场承认。2018年，佳士得就以43.5万美元的价格出售人工智能绘画作品。而且，绝大多数消费者，都分辨不出AI绘画和人类画家的作品。

最具争议的是今年9月的科罗拉多州博览会（Colorado State Fair）的美术比赛，人工智能的作品《空间歌剧院（Théâtre D'opéra Spatial）》获得头奖，由Midjourney制作，操作者Jason Allen说“艺术已经死了，人工智能赢了，人类输了”。

其实倒不用一概而论，对人工智能的创作，既无需乐观过头，也不用夸大悲观。

人工智能的艺术创作，是按人类的“逻辑”产生的，自然比不上人类精英，但超过其中的庸才，当然是绰绰有余了。

喜欢我的文章吗？
别忘了给点支持与赞赏，让我知道创作的路上有你陪伴。

硬周刊

超载叽

Bring insistence to life. “历史奔跑，逃离人类，导致生命的连续性与一致性四分五裂。” 我们的生命横跨好几个时代，要面对或重建“一致性”，心里得有点“硬”东西。物质享受和精神追求，两手抓两手都要硬。硬骨头-美食栏目；硬着陆-政治栏目；硬通货-经济栏目；硬吹死挺-文化/科技/游戏栏目；周末夜狂热-随想栏目

加载中…

莫慌，AI绘画杀不死艺术

硬周刊

推荐阅读

Perceptron 的改良版 : 了解什麼是 Sigmoid Neuron

使用機器學習解決問題 : 人臉辨識

一起学投資｜今日潛力幣 2023.10.27

機器學習基本知識：維度 (Dimension) 的兩種意義

盜版歲月——寫在Z-Library被封之後