超载叽
超载叽

“啊哒”~嘤嘤怪+硬妹,一个经不起批评的人。科幻文学硕士,星球大战中文网副站长。关注科技、游戏、艺术、美食、历史等领域。曾服务于多家主流媒体,主持过文化、科技、游戏等栏目。 创作,是要发现和体现属于自己的趣味。 此博客登载本人原创文字和编译内容,未经授权严禁转载。 “伏枥骅骝千里志,经霜乔木百年心。”

马斯克打造TruthGpt,人工智能创造者们的怕与爱

搞深度学习的人,信奉马基雅维利的一句话:“要犯野心的错误,而不是懒惰的错误。”

埃隆·马斯克决定亲自下场。聊天机器人ChatGPT家喻户晓,马斯克大骂其公司OpenAI“只想着赚钱”“忘却初心”。刚刚买下的推特上,ChatGPT给他加了个“争议人物”的标签,更是令马斯克恼火。

马斯克要自己打造一个“真相GPT”(TruthGPT),也是聊天机器人,和ChatGPT最“根本”的区别是,只说真话。毕竟,世界各地的好奇网友都已经发现ChatGPT很容易“说谎”,经不起什么“诱惑”。

硅谷有很多奇形怪状的人,马斯克得算心口不一的那种。OpenAI旨在创造通用型人工智能,作为创始人之一,马斯克坚决反对通用型人工智能,说会毁灭人类。

然而他挖过深度思考(DeepMind)的人,给特斯拉做“自动驾驶”;也造了内嵌神经网络的人形机器人擎天柱(Optimus),现在还在鼓捣聊天机器人。

如果真的能杀掉所有人,为什么地球上的天才都在争先恐后地打造这玩意?

乌托邦的建立

给人工智能唱反调,马斯克一以贯之。

2014年,他说谷歌创始人拉里·佩奇正在建造人工智能机器人大军,搞不好就会毁灭人类。那时谷歌还没有和美国国防部合作的“马文计划”,首页上还挂着“不作恶”的信条,关键是,佩奇是马斯克最好的朋友之一,马斯克没事就睡在人家沙发上。

不够“义气”的事情还在后面。马斯克整天在旧金山教会区一家小巧克力工厂附近转悠,建立了一个实验室,目标崇高:完全没有营收压力,开源所有研究成果。开门要干好两件事给大伙瞧瞧:一是打造一个能在网络游戏《魔兽争霸》中打败顶尖玩家的机器团队;一是做一只还原魔方的五指机械手。

心仪的十大入伙人,都是地球上最顶尖的深度学习高手,没一个人说来,除非其他九个人都答应。为了打破僵局,创始人之一格雷格·布罗克曼在一个秋日的下午,邀请他们来旧金山北部纳帕谷的葡萄酒厂作客。酒酣耳热之后,高手们决定考虑一下。

三个星期后,九个人同意加入,有五人曾在“深度思考”的伦敦实验室待过一段时间。2015年,这间小实验室得名OpenAI,大目标是打造通用型人工智能,“小”目标是和已经走在人工智能前列的公司谷歌、脸书一较高下。

最先公布的两个项目,都噱头十足,带有鲜明的马斯克风格,而且都成功了。随着萨姆·阿尔特曼接管OpenAI,这间毫无功利心的实验室重组成一家营利公司,寻找新的投资者。

阿尔特曼跟马斯克一样,是创业者,不是科学家——虽然他有时会提起自己在大二辍学之前在斯坦福大学学过人工智能。他最大的天赋是融资。硅谷的时髦词叫“规模化”,只要认为一个想法可以规模化,阿尔特曼会毫不犹豫押下重注。

“我认识的最成功的人对自己的信任几乎到了妄想的地步。”回忆起马斯克带他参观SpaceX工厂,当时阿尔特曼对飞向火星的火箭不是很感兴趣,但对马斯克脸上确定的表情感到震惊。这种态度可以用意大利哲学家马基雅维利的一句话概括:“要犯野心的错误,而不是懒惰的错误。”

OpenAI的“技术高手”是首席科学家伊利亚·萨特斯基弗(Ilya Sutskever),他就是打造火爆全球的ChatGPT的背后功臣。

2012年,“深度学习之父”杰弗里·辛顿(Geoffrey Hinton)带着两个学生,将整个团队打造成一个初创公司DNNresearch,待价而沽。三名员工,没有产品,没有任何经营纪录,百度、谷歌、微软、“深度思考”四家公司展开轮番竞价,最后以4400万美元的价格被谷歌收入麾下。其中的一位学生,就是27岁的萨特斯基弗。

辛顿的另外一位学生杨立昆(Yann LeCun),掌管巨头脸书的人工智能领域。可以说,十年前,就这么一小批科学家,以极其戏剧性的方式,加速了人工智能的进步,改变了科技巨头看待技术的方式:可对话式数字助理、自动驾驶汽车、机器人、自动化医疗健康以及自动化战争和监控一股脑出现。

萨特斯基弗在多伦多大学读研究生时,采访过“深度思考”的两位创始人戴密斯·哈萨比斯(Demis Hassabis)和谢恩·莱格(Shane Legg),他们正在打造通用型人工智能,萨特斯基弗还略带鄙视,认为俩人简直与现实脱节。

在谷歌工作了几个星期之后,他很快接受了两位前辈的想法。

人工智能路线之争

发展人工智能有路线之争:通用型,专业型。

辛顿不相信强化学习背后的通用型人工智能之路,它需要太多的数据和太多的处理能力,在可预见的未来没法实现。他也怀疑通用型人工智能存在的意义,“如果我有一位机器人外科医生,它必须得了解很多关于医学和操纵手术工具的知识。我不明白为什么它还得需要知道棒球赛比分。”

和“深度学习之父”相反,“深度思考”和OpenAI都追逐通用型人工智能。

“深度思考”是人工智能行业的先行者,商业计划书的第一行就写着“打造通用型人工智能”。三位创始人戴密斯·哈萨比斯、谢恩·莱格和穆斯塔法·苏莱曼(Mustafa Suleyman)于2010年秋天成立“深度思考”,名字同时融合了深度学习和神经科学领域,也对英国科幻小说《银河系搭车客指南》中计算生命终极问题的超级计算机“沉思”(DeepThought)进行了致敬。

通过重金收购杰弗里·辛顿的公司,谷歌一马当先,介入深度学习领域。脸书的扎克伯格坐不住了,他不在乎除了定向广告和图像识别之外,深度学习没有特别适合脸书的东西,也不在乎公司缺乏长期的研究调查——目标只有一个,买下“深度思考”。

哈萨比斯觉得自己跟扎克伯格没有“化学反应”,他不太明白脸书能拿“深度思考”做什么,一个小实验室和痴迷用户增长的企业,实在攒不到一起。最大的问题是,扎克伯格没有认同他们对人工智能崛起的伦理焦虑,还拒绝了“建立独立道德委员会”的合同条款。

虽然谷歌出价没有脸书高,“深度思考”还是选择加入谷歌。

“深度思考”的命运预示着OpenAI的命运。搞人工智能训练,花的钱比贾府给元妃省亲还要多得多,跟“淌海水似的”。

首先,工资高。这一领域的人才非常稀少,谷歌先后收购DNNresearch和“深度思考”,四五年的时间里向研究人员支付了数千万美元,包括工资、奖金和公司股票。根据“深度思考”英国的年度财务账目,有一年的员工成本总计为2.6亿美元,而该公司当时只有700名员工,平均每名员工37.1万美元。

其次,大模型烧钱。2017年,模型Transformer横空出世,AI进入大模型阶段——大算力,大数据以及大算法,等于烧大钱。以OpenAI的GPT-3模型为例,训练GPT-3,需要至少1024张A100显卡持续运转一个月,而A100显卡最便宜的版本也要8769美元。还没开始算,先要花900万美元买显卡,还不算搭建机房的成本和后续的电费。而ChatGPT(GPT-3.5),训练一次的成本高达1千万美元。

小实验室只能“学成文武艺,货与帝王家”,没有其他选择。阿尔特曼修改了OpenAI“乌托邦”的使命,很快,既无科研成果、又无高手坐镇的微软,进入了他的视野。作为老牌“列强”,微软屡下决心搞人工智能,却长期被谷歌按在地上摩擦。

2019年,“携民渡江”的微软遇见“隆中对”的OpenAI,“金风玉露一相逢,便胜却人间无数”。当时比尔·盖茨也不是很看好Transformer大语言模型,过去五年里没有明显进展,看不出有什么作用,也只能试试看。

2011年,吴恩达创建“谷歌大脑”,通过分布式集群计算机开发超大规模的人工神经网络。他向高层反映,深度学习可以改善搜索引擎,利用分析数百万次的搜索行为,寻找人们点击和不点击的模式,神经网络将学会给出更接近用户实际需要的东西。“用户可以直接问问题,而不仅仅是输入关键词。”吴恩达说。

谷歌搜索业务负责人阿密特·辛格哈尔(Amit Singhal)不感兴趣。“用户不想问问题,他们想输入关键词。”他还担心神经网络的“暗箱”特征,当它自己做出决策时,人们没有办法确切地知道为什么。

两巨头的命运埋下转折。

2023年,微软将ChatGPT加入必应搜索,此时ChatGPT用户已经超过一亿,距离其上线只有两个多月。

谷歌手忙脚乱,把“退隐江湖”的两位创始人拉里·佩奇、谢尔盖·布林都拉回来“检查代码”,赶紧推出聊天机器人“巴德”——由于出现事实性错误,当天谷歌股价大幅下跌,饱受嘲笑。

机器也能学习?!

微软和谷歌的人工智能差异,本质是模型GPT和BERT的差异。

二者都是建立在Transformer架构上的语言模型,通过“预训练加精密调校”的模式完成下游任务的搭建。不同的是, GPT是单向模型,无法利用上下文信息,只能利用上文;而BERT是双向模型。GPT采用基于自回归模型,可以应用在自然语言理解和自然语言生成两个层面;而原生的BERT采用的基于自编码模型,只能完成自然语言理解任务,无法直接应用于文本生成。

二者各有优势,适用于不同场景。如果需要高精度长文本,GPT更合适。如果是问答或情感分析,侧重于给定文本中理解上下文的BERT更胜一筹。

或者说,无需“神化”大模型及其人工智能应用,它们相差不大,都好用,也没那么神秘。

人工智能热潮里的核心人物亚历克斯·克里泽夫斯基(Alex Krizhevsky),就从来不觉得自己的角色有多重要。他是杰弗里·辛顿拍卖DNNresearch时带的另一位学生。

在他眼里,深度学习只是数学、模式识别以及“非线性回归”,这些方法存在了几十年,只是像他这样的人在“恰当”的时间出现,正好有足够的数据和足够算力的芯片让一切发挥作用。“深度学习不应该被称为人工智能,”克里哲夫斯基说,“我读研究生是为了研究数学,而不是人工智能。”

相较于理性的科学家,思想家就没那么冷静了。“先天论者”盖瑞·马库斯是神经网络的主力批判者,他认为,人类知识的很大一部分,是大脑自带的,而不是从经验中学到的。

他的背后是一场跨越了几个世纪的哲学和心理学争论,从柏拉图到康德,再到诺姆·乔姆斯基,再到史蒂芬·平克。先天论者反对经验主义者,后者认为人类的知识主要来自学习。现在更进一步,连机器也能“学习”了!他曾给《纽约客》写专栏批评辛顿——“他做了一架好梯子,但再好也不能让人上月球”。

“深度思考”的“阿尔法狗”面世,加重了反对者的担忧。有人说,哈萨比斯推动阿尔法狗,就像奥本海默执行曼哈顿计划一样可怕。人工智能“阿尔法狗”先后战胜棋手李世石和柯洁,使人工智能新浪潮在公众意识层面爆发——特别是在韩国和中国,围棋被视为人类智力的巅峰。人类棋手的失败,揭示了技术的强大力量,也加剧了人们的恐惧。

马斯克的警告受到很多人的注意。

2017年初,“生命未来研究所”主办了一次峰会,地点在加州中部海岸一个名为“太平洋丛林”的小镇。这里曾是阿西洛马会议的召开地。1975年冬天,世界上最著名的遗传学家们聚集在这里,讨论他们在基因编辑方面的工作是否会毁灭世界。现在人工智能研究者也面对同样的问题。

会上,每位圆桌嘉宾都被问及超级智能是否会出现。当麦克风一次次往下传递时,所有人都说“是”。直到麦克风传到马斯克那里。他说:“不。”笑声在会场久久回荡,与会者都明白他的意思——“我们要么走向超级智能,要么走向文明的终结”。

犹太亿万富翁尤里·米尔纳(Yuri Milner)特意搞了个晚宴,请一众人工智能科学家和主创——编剧兼导演乔纳森·诺兰、主演埃文·蕾切尔·伍德、坦迪·牛顿一起观看上映前的首播集《西部世界》。这位年过半百的风险投资人,投过脸书、推特和爱彼迎,住在俯瞰旧金山湾的洛斯阿尔托斯山的豪宅里。

《西部世界》是一部探索人工意识和人工智能前景的HBO连续剧。第一集的内容是,几个“西部世界”主题公园中的机器人在软件更新后出现了功能故障和行为失控,并且能够访问过去的记忆,一位机器人“先知”觉醒了……

关于超级人工智能(主要是通用型人工智能)的恐惧心理,自打1956年达特茅斯会议召开之后,每隔十年八年就会发作一回。

像马斯克这种一边敲警钟、一边加入竞赛的人就更让困惑。人工智能如果能很快毁灭人类,为什么不能让一辆特斯拉更早到达L5自动驾驶级别呢?

CC BY-NC-ND 2.0 版权声明

若有知音见采,不辞遍唱阳春。

第一个支持了这篇作品

硬周刊

超载叽

Bring insistence to life. “历史奔跑,逃离人类,导致生命的连续性与一致性四分五裂。” 我们的生命横跨好几个时代,要面对或重建“一致性”,心里得有点“硬”东西。 物质享受和精神追求,两手抓两手都要硬。 硬骨头-美食栏目; 硬着陆-政治栏目; 硬通货-经济栏目; 硬吹死挺-文化/科技/游戏栏目; 周末夜狂热-随想栏目

048
加载中…
加载中…

发布评论