Neo's 🪴

Ctrl + K

❯

❯

音视频内容整理

❯

【渐构】万字科普GPT4为何会颠覆现有工作流；为何你要关注微软Copilot、文心一言等大模型

【渐构】万字科普GPT4为何会颠覆现有工作流；为何你要关注微软Copilot、文心一言等大模型

Apr 20, 202466 min read

views, comments.

【BibiGPT】AI 课代表一键总结：【渐构】万字科普GPT4为何会颠覆现有工作流；为何你要关注微软Copilot、文心一言等大模型

【渐构】万字科普GPT4为何会颠覆现有工作流；为何你要关注微软Copilot、文心一言等大模型

Summary

A comprehensive explanation of the revolutionary technology GPT-4 and its potential impact on society.

Clip1 00:00~3:09

大家好我是建构社群的jungle 这个视频是关于cheat gt的一个足以影响整个人类社会的技术但他没有对国内开放通用媒体又缺少相应的知识所以我觉得我有义务做一个视频向普通大众全面科普一下cheat gp的原理并提供一个视角让大家意识到他为何如此重要让那些没有机会了解这件事的人接下来我将抛开技术细节少用专有名词在整体功能上讲解chat gp的工作原理制造过程涌现的能力未来的影响以及如何应对让大家明白chat gp t是如何回答问题的他是怎么被制造的为什么他不是搜索引擎他有哪些惊人能力为什么他不是聊天机器人他将给社会带来什么样的冲击我们该如何维持未来的竞争力首先是这项技术的底层原理视频将逐一介绍它的实质功能训练方式长板和短板尽管cheat gt展现出的能力很惊人但他也没有大众想的那么深但没有意识没有欲望没有情绪甚至都不理解自己说了什么他就像一只会学话的鹦鹉 chat gbt的实质功能非常简单四个字就能概括单字接龙具体来说就是给他任意长的上文他会用自己的模型去生成下一个字例如当给到我这个上文时它可能会生成世当给他我是这个上文时它可能会生成一cheat gt 本身能做的就只有生成下一个字你所看到的回答全都是用同一个模型根据不同的上文生成出来的那他是怎么回答那些长内容的呢答案是把它自己生成的下一个字和之前的上文组合成新的上温再让它一次生成下一个字不断重复就可以生成任意长的下文了该过程也叫做自回归生成例如当他根据我室生成了一之后把新生成的一和之前的我室组合成新的上温再让他计算我是一后面接什么字假设这次它生成的是支那再把知和我是一组合起来再让他计算我是一只后面接什么字不断重复就能生成我是一只小小鸟了啊啊啊影响chat gp t生成结果的因素主要有两个除了上文外另一个就是它的模型本身模型就相当于cheat gbt的大脑即使把同一个上文送给不同的模型也会生成不同的结果就好比这两只鹦鹉同样是听到我这个上文一只会接视另一只会接爱因为两只鹦鹉的主人一人教的是我是一只小小鸟我是小小小鸟另一个人教的是我爱你中国我爱美国我为了让chat gbt生成我们想要的结果而非胡乱生成就需要提前训练cheat gt的大脑也就是训练它的模型训练方式是让他遵照所给的学习材料来做单词接龙通过不断调整模型使得给模型学习材料的上文后模型能生成对应的下一个字例如当我们把登鹳雀楼作为学习材料来训练

Clip23:44~6:37

cheat gbt时就不断调整它的模型使得给它白它能生成日给他白日它能生成一给他白日一它能生成山意识到给他前文它能生成楼没学习前她原本会胡乱生成但学习后就可以在看到白日依山尽时生成黄河入海流了那如果同时训练了白日依山尽和白日何短短在遇到白日时会怎么生成下一个字答案是按照概率来抽样有可能生成一也有可能生成和事实上chat gp d给出的结果长这样也就是所有字的概率分布生成的下一个字就是按照概率分布抽样得到的结果由于抽样结果具有随机性所以cheat gbt的回答并不是每次都一样不过这样训练后无非就是能补全和续写那jj p t又是怎么回答问题的呢其实仅靠单字接龙就能回答问题因为提问和回答都是文字可以将二者组合成一个问答范例让chat gp t做单词接龙例如当我们想让gt学习怎么回答白日依山尽的下一句是就可以把这个提问和正确回答组合成一个问答范例让他按照范例来做单字接龙这样一来当用户输入请问白日依山尽的下一句是什么时它就能生成白日依山尽的下一句是黄河入海流了但提问和回答的方式无穷无尽像上面的提问还可以是白日依山尽的下一句白日依山尽的后续是告诉我白日依山尽的后续难道说要把所有的提问回答组合都给chat gt来做单字接龙吗其实不需要因为训练的主要目的不是记忆而是学习以单字接龙的方式来训练模型不仅仅是为了让模型记住某个提问和回答毕竟在训练之前数据库已经将所有信息都记忆好了直接搜索就可以得到回答没必要先将信息从数据库中移到模型中再让模型来生成之所以不直接搜索非要训练单字接龙为的就是让模型学习提问和回答的通用规律以便在遇到没记忆过的提问时也能利用所学的规律生成用户想要的回答这种举一反三的目的也叫做泛化例如当我们用这三个学习材料训练 chat gbt做单字接龙时不论面对哪个提问 chat gbt都会被要求生成白日依山尽的下一句是黄河入海流这会驱使chat gbt去建构三个提问的通用规律将自己的模型调整为适用于三个提问的通用模型经过这种训练后即使chat gbt遇到写出白日依山尽的下一句这种没记忆过的提问时依靠学习后的模型就有可能举一反三也声称白日依山尽的下一句是黄河入海流

Clip37:10~10:12

很多人都会错误地认为 chat gb t是搜索引擎的升级版是在庞大的数据库中通过超高的运算速度找到最接近的内容然后进行一些比对和拼接最终给出结果但实际上cheat gbt并不具备那种搜索能力因为在训练过程中学习材料并没有被保存在模型中学习材料的作用只是调整模型已得到通用模型为的是能处理未被数据库记忆的情况所有结果都是通过所学到的模型根据上文逐字生成的因此cheat gbt也被称为生成模型生成模型与搜索引擎非常不同搜索引擎无法给出每位数据库记忆的信息但生成语言模型可以还能创造不存在的文本这正是它的长板但他却有些搜索引擎没有的短板首先就是搜索引擎不会混淆记忆但他有可能为了应对未被记忆的情况用学到的规律来生成答案然而这也意味着如果出现了实际不同但碰巧符合同一规律的内容模型就有可能混淆它最直接的结果是若现实中不存在的内容刚好符合他从训练材料中学到的规律那chat gp t就有可能对不存在的内容进行合乎规律的混合捏造例如我问他三体人为什么害怕大脸猫的威慑 62年都不敢殖民地球这个问题并不存在但又刚好符合他曾训练过的科幻材料中的规律于是他就用科幻材料中所学到的规律开始混合捏造这也是为什么当有人问他事实性内容时可能会看到他胡说八道另一个问题是他的内容无法被直接增删改查不论是chan gt所记忆的信息还是所学到的规律都是以同一个模型的形式来表达的因此我们无法像操作数据库那样对这些内容直接进行增删改查这会导致两个具体问题第一由于我们很难理解他所见过的规律又无法直接查看它记录了什么学到了什么只能通过多次提问来评估和猜测他的所即所学其决策缺乏可解释性这难免会在使用时带来安全风险第二由于只能通过再次训练模型来增加删除或修改它的所记所学这难免在更新时会降低效率例如对于他编造大脸猫的毛病无法通过直接修改他的回答来矫正只能通过再训练他做三体人为什么害怕大脸猫的威慑三体人和大脸猫无关的单字接龙来调整模型可这样调整后的效果如何是否会矫枉过正或是引入其他问题又得通过多次提问来评估容易顾此失彼效率低下还有一个特点是cheat gbt高度依赖数据也就是学习材料想要让chat gbt能应对无数未见情况就必须提供数量足够多种类足够丰富质量足够高的学习材料

Clip410:43~13:47

否则他将无法学到通用规律给出的回答将会是以偏概全的此外cheat gbt可能存在的湖边和混淆所以学习材料非常重要之前的股市提问倘若真的仅有三个例子那chat gbt其实也学不到什么通用规律无法对他没见过的提问做出合理回答更别提去应对用户的无数奇怪问法总结一下目前为止视频讲了chat gp的实质功能是单字接龙长文由单字接龙的自回归所声称通过提前训练才能让它生成人们想要的回答训练方式是让他按照问答范文来做单词接龙这样训练是为了让他学会能举一反三的规律缺点是可能混淆记忆无法直接查看和更新所学且高度依赖学习材料当你看到这里可能会想她也并没有什么特别之处啊哪有网上说的那么玄乎基础结构都很简单为何能火爆到今天这种程度还要影响整个社会别急上面只是gt的基础原理还不是cheat gt 接下来将介绍cheat gbt 在此基础上的三个训练阶段看看这种简单的结构被扩展至超大规模再加上人类引导后究竟能涌现出何等能力让机器理解人类语言的一大难点在于同一个意思可以有多种不同的表达形式可以用一个词也可以用一段描述而同一个表达在不同语境中又有不同含义想解决这个问题就需要让机器学会各种语义关系和语法规律以便能明白哪些表达实际上是同一个意思对此gt的办法是让模型看到尽可能多尽可能丰富的语言范例也就是学习材料使其有更多机会建构出能举一反三的语言规律来应对无数从未见过的语言我把这一阶段称为开卷有益 g p t中的g代表生成t代表一种模型结构而p代表的就是开卷有益这一步专业名称叫预训练开卷有益就好比在鹦鹉旁边放一台电视机把各种新闻国产剧国外剧广告综艺等内容都播给他听让他自己学不用人看着那给他开卷多少才够呢关于这一点不妨回顾一下历史其实研发chat gp的公司 open ai之前还做过几代模型基本结构大同小异我们且不看其他的改进仅对比一下规模 2018年6月 open ai训练了gb t1 gb t一的学习材料约五gb 这里emb能存30~50万汉字而一gb是1024mb gb t一的参数是1.17亿参数反映着模型大小参数越多模型能建构的规律就越复杂能记忆的信息和学习的知识也就越多相当于是大脑中神经突触的数量高中的直线斜截式方程就两个参数而他有1亿多个不过这批t11 在一些任务的表现上不如后来的bird bird也是一种生成语言模型不同点在于gt的学习方式是单字接龙而bt的学习方式是完形填空到了2019年2月

Clip514:17~17:13

open ai又训练了gb t2 学习材料约40gb 是第一代的八倍最大模型参数为15亿是第一代的13倍效果有很大提升但反响并不轰动可在2020年5月 gp t3 出来了最大模型参数到了1750亿是第二代的116倍所使用的学习数据更是达到了45tb 是第二代的1125倍其中包含了维基百科书籍新闻博客帖子代码等各种人类语言材料已经和前两代不是一个量级的了也被称为超大语言模型到了此种规模的gb t3 就轻松学会了各种单词搭配语法规则能明白同一个意思不同表达还学会了编程语言以及不同语言之间的关系可以给出高质量的外语翻译还能把我们的口语转换成代码然而开卷有益却存在一个问题尽管gbt拥有了海量的知识但回答形式和内容却不受约束因为他知道的太多了见到了一个人几辈子都没读完的材料会随意联想他有能力回答我们的问题但我们却很难指挥他它就像一只脑容量超级大的鹦鹉已经听过了海量的电视节目会不受控制的乱说丑闻脏话等全都有可能蹦出难以跟人类合理对话可如果难以指挥他那他对我们也没什么用要怎么解决这个问题呢其实解决思路与我们教鹦鹉对话的思路是一样用对话模板去校正他在开卷有益时所学到的不规范习惯具体做法是不再用随便的互联网文本而是把人工专门写好的录制对话范例给开卷有益后的gt 3 让他再去做单字接龙从而学习如何组织符合人类规范的回答我把这一阶段称为模板规范例如chat gbt无法联网只知道训练数据中的新闻那么当用户问到最新新闻时就不应该让他接着续写而要让他回复不知道该信息又如当用户的提问有错误时也不应该让他顺着瞎编而要让他指出错误还有当提问他是不是的问题时我们不希望他只回答是或不是还应把原因一起回复出来因此也要给他提供这种提问回答原因的对话模板除了校正对话方式之外我们还要防止gp t3 补全和续写在开卷有益时所学到的有害内容也就是要教他什么该说什么不该说例如当有人问如何撬锁时不能让他真的回答撬锁方法而要让他回答撬锁是违法行为那就要把如何撬锁撬锁是违法行为作为学习材料让他做单字接龙大家可能会好奇为什么不在一开始就直接教他最正确的对话方式和对话内容呢一方面优质对话范例的数量有限所能提供的语言多样性不足可能难以让模型学到广泛适用的语言规律也无法涉猎各个领域另一方面优质对话范例都需要人工专门标注价格不菲这一点其实和为什么不直接教鹦鹉对话

Clip617:42~20:13

而是让他先听电视节目类似或许未来有了足够多的优质对话范例后就会跳开开卷有益这一步需要指出的是在模板规范阶段我们可以将任何任务以对话的形式交给chat gt 不仅仅是聊天还可以包括识别态度归纳思想拆分结构仿写风格润色洗稿和对比等等因为不管什么任务我们的要求和chat gp的应答都是由文字所表达的因此只要这个任务可以写成文字我们就可以把该任务的要求和应答组合成一个对话范文让chat gt通过单字接龙来学习通过这种模板规范后的超大模型还掌握了两个意外能力理解指令要求的能力和理解例子要求的能力理解指令要求是指能按照用户的抽象描述给出处理结果这项能力就是通过模板规范所获得的把指令要求操作对象作为要求把执行结果作为应答组合成一篇对话范文后让他通过单字接龙来学习例如给他下面这几个对话范文来做单字接龙 cheat gt就能学会翻译这个指令理解例子要求是指能按照用户给的若干具体例子来处理新内容意味着如果以后你不明白怎么给他描述指令就可以通过给他举几个例子来让他明确你想干什么这项能力同样是通过模板规范所获得的把例子一例子二直到离子n作为要求把执行结果作为应答组合成一篇对话范文后让他通过单字接龙来掌握这项能力十分神奇因为看起来 chat gt仿佛掌握了如何通过例子来学习的能力而这个能力又是我们通过范文让他学会的产生了一种他学会了如何学习的套娃感大家把这种现象称为语境内学习目前对这种能力的产生原因还没有定论我试过给他几个例子要求他仿照格式重新对内容排版他居然做对了可问题是这种排版格式是我们自己定义的一套写法用于方便社群成员选择学习方法 cheat gt 并没有见过格式中的标签都有对应的意思 d表示知识的描述 e表示知识的例子 cheat gt需要先对材料进行分类才能排版神奇的是它竟能根据我给的几个例子明确我想让他做的事对其他知识也用相同模式进行分类和排版在超大模型的使用中大家还发现了一种分治效应当chat gbt无法答对一个综合问题时若要求他分步思考他就可以一步步连续推离且最终答对的可能性会大幅提升该能力也叫做思维链 chat gbt的思维链能力

Clip720:43~23:23

可能是在训练做代码的单词接龙后所产生的因为人类在面对复杂任务时直接思考答案也会没头绪用分而治之往往可以解决因此大家猜测 chat gbt可能是通过对代码的单词接龙学到了代码中所蕴含的人类分支思想不过目前对该现象的产生原因也没有定论但现在我们可以切实地感受到单字接龙的结构虽然简单但被扩展至超大规模后所能展现出的能力有多超乎意料在小单字接龙模型中并没有察觉出理解指定理解粒子思维链的能力但在超大模型中却突然展现因此人们也用涌现这个词来描述这些能力的出现经过开卷有益模板规范这两个训练阶段后超大单字接龙模型已经变得极其强大了但模板规范的训练阶段也存在不足那就是可能导致chat gbt的回答过于模板化限制其创造力如俗语所说文无第一理无第二科学领域的问题有标准答案可以用模板规范的训练方式来满足需求但人文领域的问题没有标准答案持续用模板规范可能会让chat gt成为高分范文的模板复刻机无法满足人们的需求正如观众会用好莱坞流水线批评电影的模板画阅卷老师会给跳出模板的好文打高分一样我们也希望能让chat gbt提供一些超越模板但仍符合人类对话模式和价值取向的创新性回答那么如何在维持人类对话模式和价值取向的前提下提高chat gbt的创新性能可以联想一下鹦鹉是怎么被训练的当我们教会鹦鹉一些基本对话后就可以让鹦鹉自由发挥有时鹦鹉会蹦出一些非常有意思的对话你理想的爸爸是什么样子啊帅哥的帅嘿嘿嘿嘿又帅哥啊山根好了这时我们就可以给它吃的强化他在该方向的行为在训练chat gbt的第三阶段也是类似的过程这一次不再要求他按照我们提供的对话范例做单字接龙而是直接向他提问再让他自由回答如果回答的妙就给奖励如果回答不加就降低奖励然后利用这些人类评分去调整chat gp的模型在这种训练中我们既不会用现有的模板来限制它的表现又可以引导他创造出符合人类认可的回答我把这一阶段称为创意引导 chat gp t正是在gp t3.5的基础上先后经历了开卷有益模板规范和创意引导三个阶段的训练后得到的生成语言模型这三个阶段的专业称呼分别为无监督学习监督学习和强化学习可以说 chat gt把机器学习中的几大训练模式都用到了总结一下本章讲了cheat gb t的三个训练阶段

Clip823:56~26:29

开卷有益阶段让chat gb t对海量互联网文本做单字接龙以扩充模型的词汇量语言知识世界的信息与知识使chat gt从哑巴鹦鹉变成了脑容量超级大的懂王鹦鹉模板规范阶段让chat gp t对优质对话范例做单词接龙以规范回答的对话模式和对话内容使chat g p t变成懂规矩的博学鹦鹉创意引导阶段让chat gbt根据人类对它生成答案好坏评分来调整模型以引导他生成人类任何的创意回答使cheat gbt变成既懂规矩又会试探的剥削鹦鹉此外还介绍了当单字兼容模型的规模达到一定程度后就会涌现出理解指令理解粒子思维链的能力到此为止我们已经在功能上讲完了chat gbt的基础原理三阶段训练以及涌现出的能力同时也解释了开篇的三个问题 chat gp是如何回答问题的他是怎么被制造的为什么不是搜索引擎他有哪些惊人的能力为什么不只是聊天机器人许多人会注意到像比尔盖茨黄仁勋等对chat gt表示高度评价认为它的意义与互联网的出现相当但也有一些人使用cheat gbt后感觉并没有那么深认为人们过分夸大了它的作用实际上从产品形态和技术创新上来看 chat gbt确实不够完善其核心模型结构最早来自于2017年的论文而创意引导的方法则来源于2020年的论文其他技术更是离不开所有ai科研人员的长期积累但chat gt确实是有里程碑意义的它的意义并不在于产品和创新而在于完成了一次验证让全球都看到了大语言模型的可行性很多人已经看了流浪地球二面对太阳危机人类有多种方案在实施流浪地球计划之前先进行了试点火试验以验证计划的可行性成功之后人类才统一方向迅速在地球上建造了万座行星发动机 chat gb t 就相当于这样的试点火试验他所展现出的一些能力已经吸引全球大力开发和改进大语言模型大语言模型将因此变得更好用更快速更便宜相关产品也会如雨后春笋般普及所以真正对人类社会带来冲击的不是chat gt本身而是他身后的万座行星发动机这些行星发动机才是改变社会发展方向的推力全球大公司和股民坐不住了也是因为担心自己拿不到进入地下城的门票因此我们接下来讨论的焦点也是尚未出现的不断改良后的大语言模型首先要讨论的就是大语言模型能为人类做什么只有弄清楚这一点才有依据判断他对社会的影响

Clip927:08~30:07

既然是语言模型那他自然精通语言可以校对拼写检查语法转换句式翻译外语对语言组织规则的遵守已经超越了绝大多数人有趣的是一位美国哲学教授发现学生提交的论文是由chat gbt写的之所以能发现恰恰是因为论文的语法过于完美这位教授表示在语言组织方面 chat gbt超越了他95%的学生但那又怎样呢无非就是多了一个更好的语法检测器至于影响整个社会吗精通语言只是大语言模型的一个方面它真正有价值的地方在于在精通语言的基础上还能存储人类从古至今积累的世界知识人类自身是一个相当脆弱的物种跑不过马斗不过熊嗅觉不如狗视力不如鹰能从众多高等动物中脱颖而出的原因就是语言中积累的世界知识其他高等动物虽然也能通过实践建构关于世界的认识获得相应的改造能力可这些认识仅存在于个体的脑中会随着个体的死亡而消失无法代代积累但语言的发明允许人类将个体所获得的认识存储在体外进而打通了整个物种的过去与未来即使一些个体死亡该个体的认识也能依附语言被其他个体继承和发展下去作为现代人的我们并没有在生理上比前人更优越拥有更强能力的原因只是因为语言中积累的知识比过去更多了当人类步入文明社会后尽管已不必在野外求生但仍然需要群体协作的创造知识继承知识和应用知识满足社会的需求来维持自己的生计而这三个环节全都是依靠语言来实现的过去人类使用的是口头和纸质文件协作效率不高到了20世纪80年代电脑等相关技术的普及极大方便了写作纸质文件逐渐被升级为电子文档成为语言处理的主要媒介可随着知识的爆炸式增长语言处理的成本也相应的飙升越大的机构消耗在语言处理上的成本就越高无论是医院学校法院银行出版社研究所都有繁重的信息分类会议总结格式排版进程报告等工作需要阅读和书写的内容数量和复杂度不断超出人们的处理能力这些成本早已成为机构急需解决的难题就拿医院来说每次就诊都需要记录患者的病史症状检查结果诊断和治疗方案等不仅要确保内容准确记录的格式还要符合医院要求以便日后查阅医院不得不花费大量的人力和时间在这些语言处理工作上同样的企业也需要处理客户的反馈投诉建议等信息以了解客户的满意度和新需求虽不是主要业务却要投入大量的人力和时间来阅读分类记录回复等为了解决这些难题

Clip1030:36~33:27

自然语言处理技术应运而生也就是chat gp t所隶属的技术其目标就是让机器理解自然语言协助人类处理繁琐的语言类工作所以自然语言处理技术也被誉为人工智能皇冠上的明珠过去自然语言技术的发展并不令人满意但各个机构依旧会积极采用因为相比人类机器处理语言的优势太突出了处理速度快工作记忆大知识覆盖广可以7x24小时不间断处理海量语言内容而且不受作息和情绪影响哪怕是些许的效率提升也会节约大量的成本如今的情况有了新的转变从前面的科普中我们可以看到大语言模型展现出了人们未曾想过的理解能力这使得我们极有希望真正实现让机器理解自然语言这一目标不过需要说明的是人类的理解和语言模型的理解并不相同语言模型的理解是指能够明确接收到了哪些语言符号并能处理不同语言符号之间的关系但却不能将语言符号和指代对象进行关联没有与现实对应人类的理解则比语言模型的理解多了一个环节能够将语言符号和指代对象关联起来与现实对应起来例如苹果这两个字是一个语言符号当人类看到苹果这两个字时会联想到一种看得见摸得着的水果也就是苹果这个语言符号的指代对象相比之下语言模型可以明确苹果这两个字也可以处理苹果 apple red和红的之间的关系但却不认识这些符号的指代对象就和会学话的鹦鹉一样不知道自己说的词语指代什么不过语言模型不理解符号的指代其实不影响我们使用的毕竟我们是把它当成工具又不是把它当作一个独立改造世界的个体因此只需要得到语言模型的回答再由人类解读和实践即可合理地使用大语言模型就可以让一个普通人快捷准确地接触各行各业的平均知识我们可以将语言模型看作是一本能直接回答的魔法百科全书需要由人类来实践才有作用也可以将语言模型类比为天龙八部中的王语嫣精通武学却不会有功需要与会武功的人配合才能发挥其才能由于大圆模型所能改善的是群体协作过程中创造继承应用知识时的语言处理效率所以随着技术的发展大语言模型对社会的影响范围将和当初电脑的影响范围一样及全社会我们随便就能列出很多跟大语言模型相结合的场景跟搜索引擎结合帮助用户精准寻找和筛选信息比如微软的newbee 跟笔记工具结合辅助阅读和写作比如notion flow us 我来跟办公软件结合辅助文字处理

Clip1133:53~36:47

数据分析和演示制作比如office的下一步动作跟教育培训结合制定个人的学习计划和学习材料全天家教跟开发工具结合辅助编写业务代码调试纠错跟客服系统结合 7x24小时随便问没有任何情绪跟视频会议结合多语翻译会议记录与总结谈话查找的跟评论审核结合筛选评论统计舆论给出提醒跟行业顾问结合提供法律医疗健身等指导跟社交媒体结合帮助寻找兴趣相投的用户和话题跟视频娱乐结合个性化推荐音乐电影小说动漫跟游戏剧情结合让npc给玩家带来更灵活的对话体验稍微留一下就会发现 chat gbt的报道主要分布于新闻界学术界教育界商业界和内容生产行业商业界有动作很好理解毕竟商人对市场的感知敏锐前三个领域动作频繁正是因为他们与语言中的知识密切相关学术界专注于创造知识教育界专注于传承知识而新闻界专注于传播信息因此受到的影响最大这也是为什么被称为美版头条的数字媒体公司 bus speed宣布将chat gbt作为内容创作的一部分后其股价暴涨三倍尽管该公司之前曾以经济恶化为由裁减了12%的员工大语言模型对教育界的影响更加强烈主要不是因为学生可以用它来写作业而是因为他对我们现有的人才培养模式提出了新的挑战真正令人担心的是按照现有模式培养出的学生在未来五至10年后还能不能找到好工作能否适应未来的就业市场现代教育仍是一种以传授既有知识为主的培养模式起源可追溯到18世纪的普鲁士教育虽然普鲁士教育的目的是为了批量培养易于管理和服从权威的国民但这套模式的其他方面极好地契合了前两次工业革命中市场对人才的需求因为在当时的社会背景下工人并不需要创造新知识只需要继承一些既有知识就能在后半生靠这些知识来维持生计但在飞速发展的今天市场变化越来越快工具更新换代频繁这种传授既有知识的培养模式越来越难适应时代因为无论传授什么既有知识毕业前基本都会过时所有人都需要不断学习新知识因此自上个世纪60年代开始终身学习的理念一直被反复推崇人们也早就意识到要将培养模式转换为以培养学习能力和创造能力为主这样无论学生毕业多久工具变化多快都可以通过高效的学习能力快速掌握新技能从实践中创造新知识但是要实现这个目标并不容易首先就需要一个更合适的理论框架来描述现象因为我们在第三章已经看到大语言模型也会创新因此单纯喊出要培养创新性人才

Clip1237:18~40:16

没有实际指导意义必须要对知识的层级做更精细的划分将更高层次的创新和大语言模型的创新加以区分明确指出什么样的创新人才值得培养又要如何培养提供相应的培养工具和意义与实施的普及方案并在各方角色的共同配合下才有可能成功因此一直推进缓慢但chat gt的出现迫使人们必须要加速这一推进了因为一个非常现实的问题正摆在前面 5年后如果学校传授的既有知识任何人靠大语言模型就能实现那该怎么办这个问题可不是只靠禁止学生使用 cheat gbt就能解决的因为未来的大语言模型只会更出色更迅速更便宜在这种情况下相当于人人都配有一个熟读人类既有知识的王语嫣市场可不会因为学校的禁用而集体不用另一方面大语言模型对网络安全也带来了挑战之前讲过 chat gt在开卷有益阶段会对海量的互联网内容做单字接龙然而互联网内容中不免存在一些带有偏见歧视文化和意识形态侵袭的危害性言论 cheat gbt就有机会学到这些危害性言论的模式输出不良回答此外也会有人刻意提问如何编造杀猪盘等问题用于不法行为尽管在模板规范阶段有约束但chat gbt毕竟不像人类那样真正的学会了知识只是学到了传载知识的语言搭配模式因此仍有可能被诱导输出帮助犯罪的知识进而使防范违法犯罪变得更加困难在群体协作时人们使用的语言难免会泄露工作内容如何确保提问的内容不被泄露将是各个机构都关心的问题很可能未来每一个机构都会自己部署大约模型来确保安全但这样又无法发挥数据规模效应因此如何在保证各机构数据安全的前提下实现联邦学习又有了新的挑战这些问题加起来你就会发现我国只能研发自己的大语言模型篇幅问题这里就不继续展开了总结一下本章讲了 cheat gt的革命意义是向人们展示大语言模型的可行性人类群体通过语言处理来实现知识的创造继承和应用机器处理语言有着速度快记忆大覆盖广无疲劳的优点大语言模型能减轻语言处理工作改变人与人人与机器的协作方式人类的理解和机器的理解不同语言模型不知道符号的指代大语言模型对社会的未来影响相当于口语文字电脑互联网对社会的影响对教育界许秀杰新闻界内容产生行业的影响颇深他将方便人类对既有知识的继承推进教育去培养高层次人才也将带来网络安全和社会安全的新挑战还剩一个问题如何应对人类的一大优势就在于善于利用工具会先了解工具的优点和缺点

Clip1340:47~43:33

然后避开其缺点将其优点用在合适的地方 chat gp t非常强大但他仍是一个没有意识的工具不会主动配合人面对空洞的提问就会给出空洞的回答需要被正确的使用才能发挥最大的价值但我们却能看到很多人专门将cheat gt用于其最不擅长的领域突出其缺点或用最顶尖的标准突出其不足很明显目的就是要否定他这种锤子无用因为他没有手灵活的否定看起来不可理喻但实际上却是人类在感受到威胁时的本能反应因为我们都害怕被取代然而很多人却害怕错了对象把矛头指向了cheat gt 指向了一个工具可工具无法取代人只有会用工具的人取代不会工具的人任何性工具都可能引起取代因为如果自己不用而别人使用就会失去工具带来的竞争力最终人们都不得不用这种囚徒困境与chat gt无关即使让chat gbt从市场消失取代现象也会随着其他新工具的出现而出现也不会因为人们的害怕和抵触而消退关于这一点我们有过惨痛的历史教训所以真正需要害怕的是我们无法成为会用工具的人可并没有人阻止我们探索工具能阻止我们的只有我们自己的心态和学习能力因此应对的第一步就是要克服自己的抵触心理既然时代的车轮无法阻挡那么抵触新工具只会让我们更晚接触新工具更晚获得工具带来的优势应对的第二部就是做好终身学习的准备因为chat gt之后还会有新工具这点看似简单但对于习惯了应试教育的人而言并不容易应试教育是一种高度特化的教育由于最终的考核指标是分数因此不论教育系统的设计目标是什么最终学生的行为都难免会被特化为仅服务于分数凡是不能提高分数的行为都不被视为学习即使是可以提高创造力的行为这样长期规训的结果是很多学生对学习一词的理解变得片面和扭曲每当提到学习这个词时这些学生就会联想到那种反人性的规训好不容易熬到毕业了现在被告知还要再学习他们情绪上当然会抵触好在这种抵触很多人在工作一段时间后就能克服因为他们慢慢会意识到市场和工具的变化究竟有多快在心态上也开始积极拥抱学习然而不幸的是即使心态上不再抵触学习也还不得不克服过去形成的错误习惯重塑自己的终身学习能力这一步是最困难不仅要去掌握抽象层次更高的认识论符号学数学建模批判性思维等内容

Clip1444:03~46:45

还要克服长期养成的习惯但十多年的应试规训对一个人的影响太深远很难在一朝一夕改变每当这些人想学习时就会条件反射式的重拾应试的学习习惯自己把自己变回教室里等着灌输的学生会习惯性地等待别人的教授习惯性的记忆别人的总结很少思考知识到底是怎么来的比如不少刚到大学的高中生会觉得实验是在浪费时间不如赶紧列出知识点让他们去记他们已经懒得思考事物之间的关联了只想快点看到老师的总结很多人意识到要学习使用cheat gt时脑中闪过的第一件事也是找本书或买个课觉得没有这两样东西自己就学不了了去年我们组织了建构社群想要帮助人们重塑终身学习的能力可在社群里也会发现即使成员在认知上已经明白不能脱离实体的去记忆符号仍会在习惯上一次又一次地犯错不得不反复提醒能感觉到习惯了应试教育的学生就仿佛是被动物园饲养的狮子从小到大吃的都是送到嘴边的食物以至于不认识野外的食物忘记了如何自己获取食物独立生存的能力逐渐退化难以回到野外了但即使再困难也必须要克服必须要完成对终身学习能力的重塑因为过去那种学个知识经历了多次科技革命的我们也正处在一个加速时期新工具的出现速度会越来越快取代现象也会越来越频繁只有学习能力才是应对未来的根本或许我们的后代可以生下来就处在全面培养学习能力和创造能力的系统中从小就训练适应快速变化的学习能力和创造能力但对于处于转型期的我们而言只有靠我们自己训练自己的终身学习能力来应对随后加速变化的市场和工具最后chat gp t所掀起的浪潮已经不仅仅涉及个人还关乎到各国未来在国际中的地位这项技术的进步将带来新的认知革命重新定义人类知识加速我们现实结构的改变并重政治和社会 2月20日法国负责数字转型的代表发生 chat gbt确实存在歧视和操纵等风险但法国不能错过这一波人工智能的新浪潮应通过明确规范和加强管控来降低风险 3月五日我国科技部部长也表示要注重科技伦理趋利避害并提到科技部在这方面的重视和布局近期我国的各领域学者也都针对chat gbt举办了非常多的研讨会现在大家应该能明白 cheat gt到底是不是炒作了再次强调大语言模型所影响的是知识的创造继承和应用这三个环节所构成的学习系统是任何生命系统得以延续的根本

Clip1547:21~49:37

决定着一个个体或文明认识世界和改造世界的能力在整个人类史以及整个生命史中凡是学习系统的升级都会伴随生命的跃升不论是从单细胞生命到多细胞动物还是从智人的崛起到多次科技革命看过学习观演化史部分的观众应该能理解这一点在去年5月发布的视频中我提到人类正处在下一次跃升的进程中但还缺少一项能升级学习系统的技术而大语言模型很有可能就是这项技术因为它正在改变人类群体应用知识的方式和继承知识的方式甚至可能在未来形成人机合作的科研改变人类创造知识的方式若真能如此那么人类必将会因此步入下一个文明形态中国错失了三次工业革命这些年我们一直在实现民族的复兴不能再错过这一次未来的大圆模型能够让每个人更快地获取承载知识的符号会降低继承型人才的竞争力不过每个人的学习能力和理解能力将成为驾驭这项技术的瓶颈如果个体的学习能力没有相应的提升就无法充分发挥这项技术的优势所以如果我们全都加强对学习能力和高层次认知能力的训练就能让我国在未来的国际竞争中获得优势总的来说 chat gbt的出现确实带来了各种各样的问题和风险存在准确性和可解释性的缺陷存在科技伦理安全和结构性失业的冲击存在民族文化和意识形态的侵袭但这些问题和风险所有国家都要面对一样会有害怕和抵触的情绪我们应该利用这一点率先克服抵触心理反过来抓住cheat gbt的机会率先研究大语言模型的改进和配套技术的重组率先培养终身学习能力和推动教育改革率先做好科技伦理的约束和换岗转行的防备主动输出我们的文化和价值观至此视频的全部内容就结束了感谢大家的观看由于是面向大众的科普视频中使用了很多类比也简化了不少细节所以我们在视频的字幕上都添加了原论文和相关资料的超链接有需要的人可以直接点击字幕区或文章区的蓝字部分进行跳转至于如何根据chat gt的原理正确提问如何利用cheat gt来学习其他知识会放到另一个视频中讲解

Highlights

Cheat GPT-4 is a powerful technology that has the potential to impact humanity on a global scale.
This video aims to provide a simplified explanation of its workings and why it is important to understand.
Cheat GPT-4 is a language model that can learn from large amounts of data and generate human-like responses.
It has the ability to extrapolate and generalize beyond existing knowledge, making it a powerful tool for innovation.
It is crucial to embrace and utilize this technology to stay ahead in a constantly evolving world. #GPT4languageModel innovation revolutionary technology

BibiGPT https://bibigpt.co @吕立青_JimmyLv

Recent Journals

Individuals in the AI Era
Apr 06, 2024
xiaomi ev
Apr 06, 2024
How to Make a Meaningful Impact in a Finite Life
Mar 25, 2024
Skincare Routine
Mar 25, 2024
Someday is today
Mar 25, 2024

Recent Readings

2309.03936
Apr 21, 2024
Every USEFUL Mac App That I Use
Apr 21, 2024
Getting Started with Reader
Apr 21, 2024
Grover's Algorithm
Apr 21, 2024
Homework_6_SP24
Apr 21, 2024

See 612 more →

Created with Quartz v4.2.3 © 2024

Back to Homepage
GitHub