总是需要无数的光阴无谓地流逝,才能等到一个真正具有历史意义的时刻——一个人类群星闪耀的时刻出现……我把它们称为人类群星闪耀的时刻,因为在这个人类难以企及、不朽的时间黑夜里,它们宛若星辰,刺破了黑暗,放射出永恒的光芒。
——斯蒂芬·茨威格《人类群星闪耀时》
人工智能出现以来,人类还从未在哪个时代感受过如此强烈的AI震撼。
从AI绘画到ChatGPT,从AI配音到AI作曲,从百度文心一言到谷歌Bard,才不到一年时间,与AI相关的各种最新产品、工具以日新月异(字面意义上)的速度刷新着我们的眼球,AIGC更作为一种全新的内容生产方式,成为各行各业眼下最炙手可热的名词。
此时此刻,AI正如繁星般闪烁在人类科技与文明的星穹。但对被AI群星照耀的人类而言,心里却多少有些五味杂陈——因为AI所散发的星光,未来也许会渐渐盖过人类的光芒。
AI形成的科技发展力,眼下正以前所未有的力量推动着人类发展史上“奇点时刻”加速到来,进而从实质上影响人类社会的运转机制,对人类重新进行价值排序。而人类,显然还没有做好充足的心理准备去应对即将到来的冲击。
智力竞技王庭的“弑君者”
倘若将AI对人类的追逐战比作一场SLG国战,那么拥有上帝视角的玩家会发现,AI正以惊人的速度蚕食着人类所剩无几的地盘,它所向披靡,一次次将人类的尊严打得支离破碎。
黑白相间的国际象棋棋盘是第一个没有硝烟的智力竞技战场。1996年,IBM研发的国际象棋AI“深蓝”向国际象棋世界冠军、特级大师卡斯帕罗夫发起挑战,以2:4落败;一年后,运行速度已达“深蓝”两倍之快的“更深的蓝”再战卡斯帕罗夫,并最终以3.5:2.5获胜。
国际象棋只是AI“攻城略地”的桥头堡,此后20年,AI一路摧城拔寨,相继攻克中国象棋、将棋等“重镇”,锋芒直指被誉为“人类智力竞技之首”的围棋。
要知道,人类一直对“围棋守卫战”心存一丝期望,这种底气源于围棋极高的复杂程度——基于19*19的361格棋盘,围棋被公认为人类当之无愧的最难棋类游戏。从AI的视角来看,其业已征服的国际象棋每盘棋的总变化量约为10的201次方,象棋的总变化量约为10的200次方,而围棋却高达10的808次方,以天文数字领先于前两者。因此当时棋坛普遍认为,AI还没有与人类九段高手正面交锋的能力。
但这一点小小的“侥幸”很快便被AI击溃。2016年3月,谷歌旗下英国人工智能公司DeepMind研发的围棋AI 阿尔法狗(AlphaGo)以4:1的比分战胜如日中天的韩国名将李世石,李世石仅在在第四局凭“神之一手”略微挽回人类颜面。
这是AI第一次在围棋之巅正面击败人类顶尖高手,自这一刻起,飞速发展的人工智能今后只会将人类越甩越远。“大敌”当前,时年20岁不到的中国天才棋手柯洁在微博上放出豪言:“就算阿尔法狗战胜了李世石,但它赢不了我。”
然而当柯洁坐到升级后的阿尔法狗(AlphaGo Master版)面前,他才真正体悟到,他眼前的这台无情的计算机器究竟有多可怕。3:0,阿尔法狗以毫无悬念的比分轻取柯洁。
第三局比赛眼看大势已去,柯洁一度离场20分钟,独自一人痛饮血肉之躯与机器抗争的无力与迷茫。赛后面对媒体采访,柯洁哽咽道:“阿尔法狗太冷静、太完美了,不给你任何希望。我跟它下棋特别痛苦,只能猜它一半的棋,差距太大。这是我与人工智能的最后三盘棋。”
如果说AI在国际象棋、围棋领域的大获全胜,还只是穷举法或AI深度学习的胜利,那么德州扑克AI开始完虐人类赌神,则意味着AI已攻下人类智力博弈领域的最后一城——策略。
与国际象棋、围棋这类完美信息博弈不同,由于扑克对决中“隐藏信息”(即对手手中的未知牌)的存在,牌手在牌局中往往需要运用多种策略和心理博弈才能取得胜利,这些都是棋类游戏所不具备的。尤其是当AI来到德州扑克等多人牌局时,诸多不确定因素让其更加举步维艰。因此在很长一段时间内,德扑都被视作对AI的终极考验。
然而,即便是这最后一点“优越感”,人类也没能保住。
就在柯洁输给阿尔法狗升级版的同一年,美国卡耐基梅隆大学开发的人工智能Libratus在面对4名顶尖人类选手时(1v1轮流对决)取得了最终胜利;两年之后,Libratus又在6人德扑中力压5名人类赌神夺冠。这是AI首次在多人德扑中战胜人类,此时人类选手惊异地发现,AI已经开始在牌局中完全随机地使用混合策略——这本是人类一直在试图做的事。
2017年Libratus与其他四名人类选手的比赛数据,橙色折线为AI得分
至此,在绝大多数人类与AI的智力竞技对决中,作为造物主的人类已然全面败北。而更令人沮丧的是,咄咄逼人的AI发展速度,让人们开始质疑人类的价值。
2019年退役后,李世石接受采访时曾多次表示,“我学棋的时候围棋是艺术,但是AI让围棋沦为了游戏”,“蓝圆圈不过是概率统计罢了(即AI对棋盘上所有可下位置“蓝色圆圈”进行概率测算),围棋沦为游戏才会追求这种概率上的最高必然性。”
柯洁也在直播时直言:“AI让围棋无聊透顶,人类棋手已没有魅力,甚至找不到存在的意义。”而他直播间的名称则被其自嘲地改为“都什么年代了,还在下传统围棋”。
道心破碎后的世界名画:《只下围棋》
但AI从不会因为人类感情波动而停止前进的步伐。当人类仍在抱怨、恐惧着AI进步神速,阿尔法狗又再进一步。2018年,DeepMind推出集将棋、国际象棋、围棋等功能于一身的人工智能AlphaZero。仅仅运行了8个小时,它就以100:0的战绩碾压了其前辈阿尔法狗。
AlphaZero下国际围棋、将棋、围棋的胜率都极高
这个由人类亲手打开的潘多拉魔盒,正以超乎所有人想象的速度进行着“超进化”。不论是人类,还是AI自己,都不清楚其进化的终点在哪儿,更没有人知道,AI将把人类带向何方。
皇冠上最亮宝珠的“篡夺者”
“我来,我见,我征服”。公元前48年,凯撒大帝在泽拉战役中一举击败本都国王法尔纳克二世,随后这位征服者第一时间向罗马元老院送出了这份著名捷报。
而对AI来说,继征服智力游戏之后,其剑锋所指的是人类腹地——八大艺术之一的绘画。
或许任谁都不会想到,在人工智能概念提出60年后的今天,首先受到AI冲击的居然是创作行业。更让人类胆战心惊的是,相较于智力竞技型AI击败精英棋手、牌手在精神层面带来的沮丧与不忿,异军突起的AI绘画更可能颠覆人类苦心经营至今的创作秩序和行业生态,从业者丢掉饭碗只在旦夕之间。这是自绘画这一行当诞生以来从未有过的危机。
事实上,直到两年前,AI还只能绘出一团意义不明、近似于抽象画的电子垃圾。那个时候,也根本不会有画师和美术从业者意识到,这个襁褓之中的“幼稚婴孩”,将在一年后威胁到他们的营生,甚至可能撼动人类存续了数千年的艺术创作方式。
2021年初,美国人工智能非营利组织OpenAI推出了一个名为DALL-E的绘画AI,其名字由西班牙超现实主义绘画大师达利(Dali)和机器人瓦力(Wall-E)融合而来,操作者仅需输入文本信息,DALL-E就可以根据有限的Tag生成图像。但彼时,尚在蹒跚学步的DALL-E还只能绘制简单抽象的图像,线条勾勒和色块涂抹都相当粗糙,也很少人将这些拙笨的作品放在眼里。
DALL-E画的狐狸
而OpenAI免费向公众开放的DALL-E“青春版”DALL·E mini,更因相比原版更小的体量、更为粗糙的模型,成为“邪典”图片批量制造机、网络乐子人的欢乐源泉。
真正让人类开始正视AI绘画能力的,是Diffusion Model(扩散模型)的普及和应用。
Diffusion Model的原理与宇宙创世的过程莫名相似:宇宙自鸿蒙而生,从奇点慢慢演化为基本粒子、尘埃、星云以及大千世界;而依托于Diffusion Model的AI绘图则在空白中随机生成无数像素,然后再从像素中一点点浮现噪声、色块、结构,并完成最后的成像。但正是这种堪称“玄学”的绘图理论,为AI绘画插上了飞向人类艺术的伊卡洛斯之翼。
2022年2月,谷歌开发的Disco Diffusion正式推出。基于Diffusion Model,该AI绘画可以做到稳定可控的图片输出。稍有不足的是,它产图速度慢,经常要几十分钟才能出图。
知名自由艺术家@疯景CrazyJN使用DD绘制的AI场景画
4月,OpenAI发布了DALL-E的升级版——DALL-E2。仅仅上线两个月,DALL-E2就已经能够绘出表情生动的五官,而且相比前代,2代的美术作品精细度显然高出不止一个数量级。
DALL-E2已经可以在原画基础上进行二次创作
6月,Midjourne工作室推出的同名绘画AI首次亮相。两个月后,一名参赛者通过Midjourne生成的画作《太空歌剧院》在美国科罗拉多州举行的一场艺术博览会上获颁数字艺术奖——且组委会是在明知该画是由AI绘画的前提下授此奖项的。据《太空歌剧院》作者透露,他只是在Midjourn中输入关键词,然后进行适当的微调和筛选就获得了最终成品。但就是这样,这幅画依然一举击败了人类所创作的画作。
此时,人们才猛然惊醒:人工智能,这个人类智慧的结晶,竟欲染指人类皇冠上的最后一颗明珠——艺术与创作。
但AI绘图的进化早已不可阻挡。2022年8月,英国人工智能团队stability.ai开源了AI模型 Stable Diffusion,该AI集出图速度快、关键词发散性强、绘图精准等优点于一身,最重要的是,SD免费向全网用户开放,于是一场铺天盖地的AI绘图浪潮就此到来。
此后基于Stable Diffusion,短短半年时间,各路开发者就陆续推出了诸如Chilloutmix-Ni、LoRA、NovelAI、Textual Inversion等如今已广为流传的衍生训练模型。而且,通过“喂养”不同画风、出自名家之手的作品,AI已对二次元、写实等主流绘画风格驾轻就熟。如果抛开个别细节不谈,你甚至很难仅靠肉眼分辨这些质感极高的作品究竟是出自AI还是人类之手。
B站@神游ちゃん
既然AI绘画走到这一步,真人风格的画作自然无法幸免。今年2月,一位名叫勘云工造的国人博主公布了一系列足以媲美真人的赛博Coser图片,效果几乎与Coser出片一般无二。看到栩栩如生的AI绘图,看客们的第一反应是:“我们还需要经过化妆、修图的真人Cosplay吗?”一时间,Cos圈和福利姬人人自危。
【赛博Coser】史尔特尔 @勘云工造
这还不算完。2月14日,一位华人小哥、斯坦福大学计算机在读博士Lvmin Zhang推出了一个可控性更强的AI绘画插件——ControlNet。之所以说它可控性强,是因为凭借该模型自带的“Openpose”扩展姿势控制模组,用户只需要输入简单的草图或骨骼图,AI就可以根据线稿自行绘制相应的图片,同时还一劳永逸地解决了AI不会画手的“世纪难题”。
到了3月,Midjourne 最新版本V5已经可以根据关键词画出不同年代的真人和地域场景。
到这里,AI绘画从上手门槛、出图效率、性价比等多个维度对人工绘画完成了全方位包围,其用时之短、迭代之快、水准之高让人瞠乎其后,以至于你不敢想象一年多前,它的画作还那么贻笑大方,对人类画师来说显得那么“人畜无害”。
但生而为人,又怎能容忍AI抢走自己的生计?寒窗十载、苦练画技凭什么被AI一朝代替?
于是自2022年年底起,一场向AI绘画(当然也包括背后的使用者)的讨伐便浩浩荡荡地兴起于全球画师圈。但不管他们“兴师问罪”的初衷是AI喂养图片的版权归属问题,还是AI对手工创作价值的颠覆与背离,亦或真心实意地为人类艺术的尊严而战,这都是一场与所有创作者休戚相关的对决,其掀起的波澜没有谁可以置身事外。
社会生产合作的“颠覆者”
十九世纪六七十年代,如火如荼的第二次工业革命轰然而至,内燃机、电器推动并重构了社会生产力和劳动方式。其时,恩格斯在手稿《自然辩证法》上写道:“劳动创造了人本身”。
但在150年后的今天,第四次工业革命(即智能化时代)的剧烈程度已远不止于再次促进社会劳动力发展,其“破坏力”足以重塑人类迄今为止建立的社会基本结构。
语言是传承人类文明的基石。雨果奖、星云奖双料得主,华裔科幻作家特德·蒋曾在短篇小说《你一生的故事》(电影《降临》原作)中,试图探讨“萨丕尔—沃尔夫假说”:语言如何决定思维方式。而如今,这场比AI绘画影响更广泛更深远的变革,其风起之地正是人与计算机的交互语言、人工智能的核心课题——NLP(自然语言处理)。
NLP的核心目的是理解人类语言的意义
2017年,DeepMind率先在计算机RL(强化学习)的基础上提出RLHF(人类反馈强化学习)概念,首次将人类纳入AI训练的一环;同年,谷歌推出奠定了大语言模型(LLM)基础框架的全新架构Transformer,并基于该模型在2018年发布全新AI语言模型——BERT。
不过,真正让Transformer横扫全球的却是DeepMind在AI领域的直接竞争对手,微软旗下的AI研究机构OpenAI。
2018年6月,OpenAI推出当时还名不见经传的AI语言模型GPT-1。GPT-1的学习材料和参数分别只有5GB和1.17亿,它也只能进行一些简单的“文字接龙”游戏,既拼不过BERT“完形填空”式的语言方式,苦于算力和成本有限,又不能无节制扩大模型规模。即便2020年OpenAI已将GPT-3的学习材料扩大到45TB,参数提高到1750亿,普罗大众仍极少关注这个尚在牙牙学语的AI模型,哪怕AI圈内最顶尖的科学家也不甚看好GPT-3的前景。
参数越高,GPT能记忆的信息和知识就越多
人工智能教父、Facebook首席AI科学家Yann LeCun在谈及GPT-3时表示,人们对它抱有完全不切实际的期望,实际上GPT-3对于这个世界的运作方式一无所知。“试图通过扩大语言模型的规模来建造智能应用,就像建造一架飞往月球的飞机。你可能会打破高度记录,但是登上月球其实需要一种完全不同的方法。”
知名AI学者、Robust.AI创始人兼首席执行官Gary Marcus也持怀疑态度。在他看来,尽管GPT-3可以做到流畅地使用文本,但并不理解它所说的语义,“更大的模型和数据无疑会让 GPT-3 表现得更好,但仍然没有质的变化。这种变化并非革命性的。”
彼时,在大多数人眼中,GPT不过是一只没有理解能力,空会学舌的“赛博鹦鹉”。而他们也绝不会想到,GPT-3及其进阶版GPT-3.5,有一天将在人类世界引起巨震,乃至瞥见AGI(通用人工智能)降临前的一丝曙光。
2022年11月,基于GPT-3.5框架的AI聊天工具ChatGPT横空出世。这只被圈养了足足4年,经人工训练而集人类古往今来知识于一身的“怪物”,甫一放出笼子便迅速席卷了科技圈和互联网圈。聊天、翻译、写文章、解决问题,甚至是专业问题解答,你几乎能从这个“算无遗策”的聊天机器人身上得到一切想要的答案,而且它博学多闻,逻辑缜密,无比理性,有求必应。
随着ChatGPT逐渐深入互联网的各个角落,越来越多的人正从这个宝藏中发掘更多不可思议的功能。有人零编程基础用3天时间开发出一款游戏,有人为ChatGPT预设角色从而得到更加场景化的专业解答,一些软件开发者还身体力行地让ChatGPT参与到程序开发和Debug中……除了无法理解语言本身,ChatGPT简直无所不能。
海外网友Ammaar Reshi使用GPT-4、Replit、MidJourney、Claude等AI工具开发经典3D小游戏《SkyRoads》
但在惊艳于科技带来的震撼之后,一些回过神来的人开始感到后怕:对普通人而言,ChatGPT所表现出来的性能实在太全面太优秀了,且完美得令人发指!
一位来自北密歇根大学的教授称,他发现其学生的一篇论文是ChatGPT代写的原因,是这篇论文的语法实在太过完美了,观点太前卫,“ChatGPT的语言组织能力已经超越了我95%的学生”。
最让人不寒而栗的是,在亲自试用过ChatGPT后,一些人发现这个聊天AI已然可在部分社会分工中正面击败人类。尤其是在翻译、编程、法律、新闻、客服、数据分析、内容创作等文本处理领域,ChatGPT的完成度和准确率已经渐有超越人类之势。更不用说它不知疲倦,效率惊人。
人们简直不敢想象,当某一天引入了GPT-4的Office软件出现在每一位Windows用户的桌面上,为白领写邮件、做PPT、做Excel表格,软件开发公司开始使用代码生成工具GPT-4 Copilot X自动编写代码,所有人都可以毫无门槛地使用“Iphone化”的ChatGPT……当ChatGPT和各式AI工具深度参与社会劳动,它们会革掉多少人的命,让多少打工人失业?
OpenAI已于3月23日推出插件功能,赋予ChatGPT使用工具、联网、运行计算的能力
同样超乎人们想象的“黑科技”,还有GPT-3模型神经网络CLIP与人类相似的神经组织。2021年,OpenAI在CLIP上发现了近似于人类大脑的多模态神经元,这一发现既解释了CLIP为什么能够对视觉化概念拥有认知,也为日后文本生成图像的进一步发展奠定了基础。
很快,多模态神经元就被OpenAI实际应用于GPT。今年3月,时隔不到两年,OpenAI推出最新力作GPT-4。作为GPT-3的升级版,GPT-4的最大突破是能够接受文本和图像共同输入,对于人类提供的图片,它可以完成从识别、理解、分析,到回答等一连贯动作。面对人类给出的一冰箱食物,GPT-4还可以搭配出风味不同的食谱。
GPT-3到GPT-4的巨大跃迁意味着其实现了从大语言模型到多模态模型的华丽转身,而对使用者来说,这却象征着人类的“保留地”又一次被压缩。比如,GPT-4在各种专业和学术基准上所表现出的“人类水平”,在事实性、可引导性和可控制方面所取得的“史上最佳结果”,均无异于向世人宣告:某些工作,交给AI一样可以做得很好。
GPT-4考试平均分已明显高于普通学生
人类对GPT了解愈深便愈心惊。360集团创始人周鸿祎直言,ChatGPT并没有被神话,甚至很多人还把它的能力弱化了。它的智力已经超出一般人类,产生意识可能就是未来几年的事。
而亲手将ChatGPT从实验室“解放”出来的OpenAI创始人Sam Altman在接受采访时更表示,他本人和公司都对AI的潜力感到“有些害怕”,它可能会“消灭”很多工作。对此社会需要适应。“但AI也在提高和改善人类生活的方方面面,AI将重塑社会。”
OpenAI创始人Sam Altman
然而大多数普通人更担心自己才是被社会“重塑”、被全新的生产关系摆弄的弱小个体。毕竟摆在他们面前的一个更现实更残酷的问题是:若GPT仍保持着一到两年完成一次迭代的速度持续进化,假以时日,人类在社会生产中的位置是否终将被AI取代?届时,人类——人工智能的造物主,还能轻松自如地面对他们的造物吗?
人类“大败退”
纵观两百余年工业革命史,人类对机器的态度暧昧莫名。一方面人们渴望机器协同人类提高工作效能,解放社会生产力;但另一方面,一旦机器稍有代替人类的迹象,人类则绝不手软。
1811年3月的一天,一群因机器得到广泛应用而失业的技术工人群聚于英格兰诺丁汉郡周围的旷野上,随后冲入工厂狠狠捣毁了那些抢走他们工作的机器设备,并提出让社会回归工业革命之前状态的诉求。后世将这场十九世纪初在全英格兰蔓延的运动称为“卢德运动”。
1886年,“汽车之父”卡尔·本茨(奔驰汽车创始人之一)发明了世界上第一辆内燃机汽车。但直到十九世纪末,伦敦、纽约等西方大都市的交通工具仍以马车为主。因为马车已形成了一套完整的产业体系,车夫、马夫、马车生产商等从业者数以万计,无数家庭靠着马车行当吃饭,真可谓“百万槽工衣食所系”。
时代滚滚向前,第四次工业革命的车轮向当代人头上碾来。生产力的又一次革新近在眼前,可这一次“新勒德分子”们却惊恐地发现,继体力劳动效率被机器超越之后,人类在脑力劳动上的优势也荡然无存——本应砸向机器的大锤现在还可能瞄准自己。
单论游戏行业,绘画、配音、翻译、数据分析以及部分重复度高而又相对简单的工作都有被AI接替的可能。今年2月,心动董事长黄一孟就爆料称,有游戏团队把原画和翻译外包团队给砍了,“AI已经实际开始影响到很多人的工作岗位了。”还有业内人士透露,个别大厂已经开始缩减原画编制,因为“AI流程已经跑通了”。
不止如此,在一些鲜有人关注的边缘领域,AI也开始发挥出人意表的代工作用。譬如有淘宝店主表示,AI模特图已经可以平替真人模特,省下了一笔十分可观的拍摄费用。
AI的威能无远弗届,并最终染指人类最引以为豪的创造能力。更让一部分人难以接受的是,它还试图动摇人类身为“万物之灵”的自信——
当人类还站在围棋之巅的时候,解说和棋手喜欢用厚薄、味道来讲棋说弈;当人类还牢牢把握着艺术创作的主动权时,画家和音乐家惯用流派和主义来诠释对艺术的理解;当人类还是世界上唯一的程序编写者时,高端程序员常用美观工整来判断代码高明与否……人类自诩创作是个高深莫测的手艺,但AlphaGo、AI绘画和ChatGPT却相继证明,这些都是可能凭机器算力计算清楚的,只不过人类不具备这种能力,所以才玄之又玄地套上那些形容词。
但相比抗拒,更多人选择主动拥抱AI。因为他们相信,AI的使用权以及处理事务的判断权始终掌握在人类手中,倘若使用得当,高效的AI工具对现代文明发展、科技进步有利无弊。
《底特律变人》的世界距离我们还有多远?
而无论人类对AI的看法如何,无论AI未来是否真的会重构人类社会,它都注定将是推动人类文明继续向前的关键驱动力之一。任何人都无法阻止这股浪潮的到来。
正如比尔·盖茨所说:“AI的发展和微处理器、PC、互联网、手机的出现一样重要,它会改变人们工作、学习、旅行、健康护理以及沟通的方式。AI是自1980年以来最具革命性的科技进步,整个行业都将围绕它重新定位。企业将会因为自己利用AI的程度而分化。”
这是属于AI的独一无二的时刻,它将决定和改变人类的命运。作为人类,我们不妨静观其变。
元宇宙数字产业服务平台
下载「陀螺科技」APP,获取前沿深度元宇宙讯息
110777025(手游交流群)
108587679(求职招聘群)
228523944(手游运营群)
128609517(手游发行群)