“啊哒”~嘤嘤怪+硬妹，一个经不起批评的人。科幻文学硕士，星球大战中文网副站长。关注科技、游戏、艺术、美食、历史等领域。曾服务于多家主流媒体，主持过文化、科技、游戏等栏目。创作，是要发现和体现属于自己的趣味。此博客登载本人原创文字和编译内容，未经授权严禁转载。 “伏枥骅骝千里志，经霜乔木百年心。”

马斯克打造TruthGpt，人工智能创造者们的怕与爱

2023 年 3 月 6 日

搞深度学习的人，信奉马基雅维利的一句话：“要犯野心的错误，而不是懒惰的错误。”

埃隆·马斯克决定亲自下场。聊天机器人ChatGPT家喻户晓，马斯克大骂其公司OpenAI“只想着赚钱”“忘却初心”。刚刚买下的推特上，ChatGPT给他加了个“争议人物”的标签，更是令马斯克恼火。

马斯克要自己打造一个“真相GPT”（TruthGPT），也是聊天机器人，和ChatGPT最“根本”的区别是，只说真话。毕竟，世界各地的好奇网友都已经发现ChatGPT很容易“说谎”，经不起什么“诱惑”。

硅谷有很多奇形怪状的人，马斯克得算心口不一的那种。OpenAI旨在创造通用型人工智能，作为创始人之一，马斯克坚决反对通用型人工智能，说会毁灭人类。

然而他挖过深度思考（DeepMind）的人，给特斯拉做“自动驾驶”；也造了内嵌神经网络的人形机器人擎天柱（Optimus），现在还在鼓捣聊天机器人。

如果真的能杀掉所有人，为什么地球上的天才都在争先恐后地打造这玩意？

乌托邦的建立

给人工智能唱反调，马斯克一以贯之。

2014年，他说谷歌创始人拉里·佩奇正在建造人工智能机器人大军，搞不好就会毁灭人类。那时谷歌还没有和美国国防部合作的“马文计划”，首页上还挂着“不作恶”的信条，关键是，佩奇是马斯克最好的朋友之一，马斯克没事就睡在人家沙发上。

不够“义气”的事情还在后面。马斯克整天在旧金山教会区一家小巧克力工厂附近转悠，建立了一个实验室，目标崇高：完全没有营收压力，开源所有研究成果。开门要干好两件事给大伙瞧瞧：一是打造一个能在网络游戏《魔兽争霸》中打败顶尖玩家的机器团队；一是做一只还原魔方的五指机械手。

心仪的十大入伙人，都是地球上最顶尖的深度学习高手，没一个人说来，除非其他九个人都答应。为了打破僵局，创始人之一格雷格·布罗克曼在一个秋日的下午，邀请他们来旧金山北部纳帕谷的葡萄酒厂作客。酒酣耳热之后，高手们决定考虑一下。

三个星期后，九个人同意加入，有五人曾在“深度思考”的伦敦实验室待过一段时间。2015年，这间小实验室得名OpenAI，大目标是打造通用型人工智能，“小”目标是和已经走在人工智能前列的公司谷歌、脸书一较高下。

最先公布的两个项目，都噱头十足，带有鲜明的马斯克风格，而且都成功了。随着萨姆·阿尔特曼接管OpenAI，这间毫无功利心的实验室重组成一家营利公司，寻找新的投资者。

阿尔特曼跟马斯克一样，是创业者，不是科学家——虽然他有时会提起自己在大二辍学之前在斯坦福大学学过人工智能。他最大的天赋是融资。硅谷的时髦词叫“规模化”，只要认为一个想法可以规模化，阿尔特曼会毫不犹豫押下重注。

“我认识的最成功的人对自己的信任几乎到了妄想的地步。”回忆起马斯克带他参观SpaceX工厂，当时阿尔特曼对飞向火星的火箭不是很感兴趣，但对马斯克脸上确定的表情感到震惊。这种态度可以用意大利哲学家马基雅维利的一句话概括：“要犯野心的错误，而不是懒惰的错误。”

OpenAI的“技术高手”是首席科学家伊利亚·萨特斯基弗（Ilya Sutskever），他就是打造火爆全球的ChatGPT的背后功臣。

2012年，“深度学习之父”杰弗里·辛顿（Geoffrey Hinton）带着两个学生，将整个团队打造成一个初创公司DNNresearch，待价而沽。三名员工，没有产品，没有任何经营纪录，百度、谷歌、微软、“深度思考”四家公司展开轮番竞价，最后以4400万美元的价格被谷歌收入麾下。其中的一位学生，就是27岁的萨特斯基弗。

辛顿的另外一位学生杨立昆（Yann LeCun），掌管巨头脸书的人工智能领域。可以说，十年前，就这么一小批科学家，以极其戏剧性的方式，加速了人工智能的进步，改变了科技巨头看待技术的方式：可对话式数字助理、自动驾驶汽车、机器人、自动化医疗健康以及自动化战争和监控一股脑出现。

萨特斯基弗在多伦多大学读研究生时，采访过“深度思考”的两位创始人戴密斯·哈萨比斯（Demis Hassabis）和谢恩·莱格（Shane Legg），他们正在打造通用型人工智能，萨特斯基弗还略带鄙视，认为俩人简直与现实脱节。

在谷歌工作了几个星期之后，他很快接受了两位前辈的想法。

人工智能路线之争

发展人工智能有路线之争：通用型，专业型。

辛顿不相信强化学习背后的通用型人工智能之路，它需要太多的数据和太多的处理能力，在可预见的未来没法实现。他也怀疑通用型人工智能存在的意义，“如果我有一位机器人外科医生，它必须得了解很多关于医学和操纵手术工具的知识。我不明白为什么它还得需要知道棒球赛比分。”

和“深度学习之父”相反，“深度思考”和OpenAI都追逐通用型人工智能。

“深度思考”是人工智能行业的先行者，商业计划书的第一行就写着“打造通用型人工智能”。三位创始人戴密斯·哈萨比斯、谢恩·莱格和穆斯塔法·苏莱曼（Mustafa Suleyman）于2010年秋天成立“深度思考”，名字同时融合了深度学习和神经科学领域，也对英国科幻小说《银河系搭车客指南》中计算生命终极问题的超级计算机“沉思”（DeepThought）进行了致敬。

通过重金收购杰弗里·辛顿的公司，谷歌一马当先，介入深度学习领域。脸书的扎克伯格坐不住了，他不在乎除了定向广告和图像识别之外，深度学习没有特别适合脸书的东西，也不在乎公司缺乏长期的研究调查——目标只有一个，买下“深度思考”。

哈萨比斯觉得自己跟扎克伯格没有“化学反应”，他不太明白脸书能拿“深度思考”做什么，一个小实验室和痴迷用户增长的企业，实在攒不到一起。最大的问题是，扎克伯格没有认同他们对人工智能崛起的伦理焦虑，还拒绝了“建立独立道德委员会”的合同条款。

虽然谷歌出价没有脸书高，“深度思考”还是选择加入谷歌。

“深度思考”的命运预示着OpenAI的命运。搞人工智能训练，花的钱比贾府给元妃省亲还要多得多，跟“淌海水似的”。

首先，工资高。这一领域的人才非常稀少，谷歌先后收购DNNresearch和“深度思考”，四五年的时间里向研究人员支付了数千万美元，包括工资、奖金和公司股票。根据“深度思考”英国的年度财务账目，有一年的员工成本总计为2.6亿美元，而该公司当时只有700名员工，平均每名员工37.1万美元。

其次，大模型烧钱。2017年，模型Transformer横空出世，AI进入大模型阶段——大算力，大数据以及大算法，等于烧大钱。以OpenAI的GPT-3模型为例，训练GPT-3，需要至少1024张A100显卡持续运转一个月，而A100显卡最便宜的版本也要8769美元。还没开始算，先要花900万美元买显卡，还不算搭建机房的成本和后续的电费。而ChatGPT（GPT-3.5），训练一次的成本高达1千万美元。

小实验室只能“学成文武艺，货与帝王家”，没有其他选择。阿尔特曼修改了OpenAI“乌托邦”的使命，很快，既无科研成果、又无高手坐镇的微软，进入了他的视野。作为老牌“列强”，微软屡下决心搞人工智能，却长期被谷歌按在地上摩擦。

2019年，“携民渡江”的微软遇见“隆中对”的OpenAI，“金风玉露一相逢，便胜却人间无数”。当时比尔·盖茨也不是很看好Transformer大语言模型，过去五年里没有明显进展，看不出有什么作用，也只能试试看。

2011年，吴恩达创建“谷歌大脑”，通过分布式集群计算机开发超大规模的人工神经网络。他向高层反映，深度学习可以改善搜索引擎，利用分析数百万次的搜索行为，寻找人们点击和不点击的模式，神经网络将学会给出更接近用户实际需要的东西。“用户可以直接问问题，而不仅仅是输入关键词。”吴恩达说。

谷歌搜索业务负责人阿密特·辛格哈尔（Amit Singhal）不感兴趣。“用户不想问问题，他们想输入关键词。”他还担心神经网络的“暗箱”特征，当它自己做出决策时，人们没有办法确切地知道为什么。

两巨头的命运埋下转折。

2023年，微软将ChatGPT加入必应搜索，此时ChatGPT用户已经超过一亿，距离其上线只有两个多月。

谷歌手忙脚乱，把“退隐江湖”的两位创始人拉里·佩奇、谢尔盖·布林都拉回来“检查代码”，赶紧推出聊天机器人“巴德”——由于出现事实性错误，当天谷歌股价大幅下跌，饱受嘲笑。

机器也能学习？！

微软和谷歌的人工智能差异，本质是模型GPT和BERT的差异。

二者都是建立在Transformer架构上的语言模型，通过“预训练加精密调校”的模式完成下游任务的搭建。不同的是， GPT是单向模型，无法利用上下文信息，只能利用上文；而BERT是双向模型。GPT采用基于自回归模型，可以应用在自然语言理解和自然语言生成两个层面；而原生的BERT采用的基于自编码模型，只能完成自然语言理解任务，无法直接应用于文本生成。

二者各有优势，适用于不同场景。如果需要高精度长文本，GPT更合适。如果是问答或情感分析，侧重于给定文本中理解上下文的BERT更胜一筹。

或者说，无需“神化”大模型及其人工智能应用，它们相差不大，都好用，也没那么神秘。

人工智能热潮里的核心人物亚历克斯·克里泽夫斯基（Alex Krizhevsky），就从来不觉得自己的角色有多重要。他是杰弗里·辛顿拍卖DNNresearch时带的另一位学生。

在他眼里，深度学习只是数学、模式识别以及“非线性回归”，这些方法存在了几十年，只是像他这样的人在“恰当”的时间出现，正好有足够的数据和足够算力的芯片让一切发挥作用。“深度学习不应该被称为人工智能，”克里哲夫斯基说，“我读研究生是为了研究数学，而不是人工智能。”

相较于理性的科学家，思想家就没那么冷静了。“先天论者”盖瑞·马库斯是神经网络的主力批判者，他认为，人类知识的很大一部分，是大脑自带的，而不是从经验中学到的。

他的背后是一场跨越了几个世纪的哲学和心理学争论，从柏拉图到康德，再到诺姆·乔姆斯基，再到史蒂芬·平克。先天论者反对经验主义者，后者认为人类的知识主要来自学习。现在更进一步，连机器也能“学习”了！他曾给《纽约客》写专栏批评辛顿——“他做了一架好梯子，但再好也不能让人上月球”。

“深度思考”的“阿尔法狗”面世，加重了反对者的担忧。有人说，哈萨比斯推动阿尔法狗，就像奥本海默执行曼哈顿计划一样可怕。人工智能“阿尔法狗”先后战胜棋手李世石和柯洁，使人工智能新浪潮在公众意识层面爆发——特别是在韩国和中国，围棋被视为人类智力的巅峰。人类棋手的失败，揭示了技术的强大力量，也加剧了人们的恐惧。

马斯克的警告受到很多人的注意。

2017年初，“生命未来研究所”主办了一次峰会，地点在加州中部海岸一个名为“太平洋丛林”的小镇。这里曾是阿西洛马会议的召开地。1975年冬天，世界上最著名的遗传学家们聚集在这里，讨论他们在基因编辑方面的工作是否会毁灭世界。现在人工智能研究者也面对同样的问题。

会上，每位圆桌嘉宾都被问及超级智能是否会出现。当麦克风一次次往下传递时，所有人都说“是”。直到麦克风传到马斯克那里。他说：“不。”笑声在会场久久回荡，与会者都明白他的意思——“我们要么走向超级智能，要么走向文明的终结”。

犹太亿万富翁尤里·米尔纳（Yuri Milner）特意搞了个晚宴，请一众人工智能科学家和主创——编剧兼导演乔纳森·诺兰、主演埃文·蕾切尔·伍德、坦迪·牛顿一起观看上映前的首播集《西部世界》。这位年过半百的风险投资人，投过脸书、推特和爱彼迎，住在俯瞰旧金山湾的洛斯阿尔托斯山的豪宅里。

《西部世界》是一部探索人工意识和人工智能前景的HBO连续剧。第一集的内容是，几个“西部世界”主题公园中的机器人在软件更新后出现了功能故障和行为失控，并且能够访问过去的记忆，一位机器人“先知”觉醒了……

关于超级人工智能（主要是通用型人工智能）的恐惧心理，自打1956年达特茅斯会议召开之后，每隔十年八年就会发作一回。

像马斯克这种一边敲警钟、一边加入竞赛的人就更让困惑。人工智能如果能很快毁灭人类，为什么不能让一辆特斯拉更早到达L5自动驾驶级别呢？

若有知音见采，不辞遍唱阳春。

第一个支持了这篇作品

硬周刊

超载叽

Bring insistence to life. “历史奔跑，逃离人类，导致生命的连续性与一致性四分五裂。” 我们的生命横跨好几个时代，要面对或重建“一致性”，心里得有点“硬”东西。物质享受和精神追求，两手抓两手都要硬。硬骨头-美食栏目；硬着陆-政治栏目；硬通货-经济栏目；硬吹死挺-文化/科技/游戏栏目；周末夜狂热-随想栏目

加载中…

马斯克打造TruthGpt，人工智能创造者们的怕与爱

硬周刊

推荐阅读

AI answers in the education sector

很可能是第一張小說家以原著故事原創歌詞透過AI生成之完整華/粵語完整…

AI生圖初試

AI（人工智能）短思——從松尾公也《妻音源Torichan歌唱Desperado》＆…

阅读、人工智能、社区与去中心化，一种游戏的可能

推荐阅读

AI answers in the education sector

很可能是第一張小說家以原著故事原創歌詞透過AI生成之完整華/粵語完整實驗專輯

AI生圖初試

AI（人工智能）短思——從松尾公也《妻音源Torichan歌唱Desperado》＆《星沉願望夜》出發

阅读、人工智能、社区与去中心化，一种游戏的可能