元数据

生成式人工智能

书名：生成式人工智能

作者：丁磊

简介： ChatGPT一经问世，在全球范围内引起巨大轰动，GPT-4接入未来办公软件更是让人震惊，而且技术正在以前所未有的速度快速迭代。那么，以这些技术为代表的生成式人工智能（AIGC）是否为新一轮的技术革命？它到底能做什么，具有哪些优势和场景应用趋势？面对新技术，未来商业的机会在哪里，对我们个人又有着什么样的影响？……这些问题对于我们理解当下，面向未来都十分重要。本书基于作者的专业背景和长期实践，系统介绍生成式人工智能的内在逻辑与应用，并将其与产业发展，理论和实际相结合，帮助读者从本源了解生成式人工智能，结合未来趋势和发展为读者指明方向。

出版时间 2023-05-01 00:00:00

ISBN： 9787521755992

分类：计算机-人工智能

出版社：中信出版集团

高亮划线

纵观AI产业版图

📌 基础层是人工智能产业的基础，为人工智能提供数据及算力支撑；技术层是人工智能产业的核心，主要包括各类模型和算法的研发和升级；应用层则是人工智能面向特定场景需求而形成的软硬件产品或解决方案
- ⏱ 2023-06-09 03:48:32
📌 决策式AI（也被称作判别式AI）学习数据中的条件概率分布，即一个样本归属于特定类别的概率，再对新的场景进行判断、分析和预测。决策式AI有几个主要的应用领域：人脸识别、推荐系统、风控系统、其他智能决策系统、机器人、自动驾驶。
- ⏱ 2023-06-09 03:48:38
📌 生成式AI则学习数据中的联合概率分布，即数据中多个变量组成的向量的概率分布，对已有的数据进行总结归纳，并在此基础上使用深度学习技术等，创作模仿式、缝合式的内容，相当于自动生成全新的内容
- ⏱ 2023-06-09 03:48:30
📌 AI模型从本质上来说是一个函数，要想找到函数准确的表达式，只靠逻辑是难以推导的，这个函数其实是被训练出来的。我们通过喂给机器已有的数据，让机器从数据中寻找最符合数据规律的函数。所以当有新的数据需要进行预测或生成时，机器就能够通过这个函数，预测或生成新数据所对应的结果。
- ⏱ 2023-06-09 03:48:32
📌 因此，决策式AI可以说是在对人类的决策过程进行模仿，但生成式AI就聚焦在创作新内容上
- ⏱ 2023-06-09 03:48:27
📌 从成熟程度看，决策式AI的应用更为成熟，已然在互联网、零售、金融、制造等行业展开应用，极大地提升了企业的工作效率。而生成式AI的“年岁更小”，2014年至今发展迅猛，堪称指数级的爆发，已在文本和图片生成等应用内落地
- ⏱ 2023-06-09 03:48:35
📌 例如构建数字建筑模型时，生成式AI能帮助建筑师们产出3D建筑模型，让他们更好地理解项目。建筑师们能够使用AI图像生成应用来丰富建筑设计方案的细节，假如建筑师们向应用中输入较为初级的建筑设计方案，AI就能够在初级设计的基础上，继续产出较为细化的设计方案，以此来深化设计。建筑师们还可以随手绘制一个潦草的建筑场景线图，让人工智能来生成对应的建筑实景图。我们可以想象，随着手绘信息的增加，生成式AI输出的实景图也越来越稳定
- ⏱ 2023-06-09 03:48:37

聚焦AIGC：内容皆可生成

📌 与PGC、UGC和AIUGC不同的是，在AIGC的概念中，“无生命的”人工智能成了完全的内容源头，“无生命主体”成了为人类创作内容的生产者。
- ⏱ 2023-06-09 03:48:28
📌 GPT的“学名”是生成式预训练模型(generative pre-training transformer)，这是一种用来分析和预测语言的人工智能模型，它可以帮助我们进行自然语言处理，例如机器翻译、自动文摘和快速问答。GPT的厉害之处是，它可以在文本中自动学习概念性内容，并自动预测下一段内容。也就是说，它可以根据上下文记住概念，并能够在短时间内直接输出相关内容。
- ⏱ 2023-06-09 03:48:34
📌 与此同时，也有其他公司在AI绘画赛道“另辟蹊径”。如一家成立时间不到两年的公司PromptBase，主营业务为销售AI绘画工具的提示词，将提示词复制到Midjourney、Stable Diffusion等AI绘画平台，可以实现精准快速的图像生成，让用户在探索提示词上少走弯路
- ⏱ 2023-06-09 03:48:37

生成式AI的核心价值

📌 因此总体来说，决策式AI更多体现的是基于大量数据、信息形成的知识总结和判断，生成式AI体现的则是基于知识、信息和数据在逻辑层面产生的创新成果。后者是更接近人类智慧的AI技术，其内容的创新强度也更胜一筹。
- ⏱ 2023-06-09 03:48:39
📌 生成式AI的优势如果在与决策式AI相对照后，你还不太理解生成式AI的优势，我们就用一个简单的比喻来描述一下这两者：决策式AI更像在做选择题，分类是它的强项；生成式AI则擅长做简答题，以创作为长处。
- ⏱ 2023-06-09 03:48:39
📌 如图1-13，在一个测试中，技术人员给一张猫的图片（模型认为图像是猫的概率为90%，是马的概率为5%）添加了一些噪声，模型就离奇地将其分类成了马（模型认为图像是马的概率为90%，是猫的概率为5%）。这个案例说明，基于条件分布的神经网络模型貌似缺乏对图片的语义性理解，我们也可以以此来推测，与之相似的只对条件分布进行建模的决策式AI模型很难理解语义上的信息，也不易做出正确稳定的决策。
- ⏱ 2023-06-09 03:48:30
📌 我们从模型背后的原理出发，会更好理解一些。决策式模型的原理是这样的：模型会从海量的猫和狗的图片数据中，了解到猫的外观和狗的外观差别非常大，当面对新的样本时，模型判断样本的外观和谁更相似，就认为样本是谁。而生成式模型则是这样：它从训练集中了解到了猫的特质（如大小、毛色、身形等个性化特征），而后从关于狗的数据中也了解到了这些特征，当面对新样本时，它就会先提炼其数据的特质，将之和猫、狗分别进行比较，两方都得到一个概率，哪组数据的概率较大，它就认为样本是谁。
- ⏱ 2023-06-09 03:48:42
📌 如果以粗放的标准来划分人类的内容生产工作，大略可以分为艺术创造性工作、设计性工作和逻辑思维性工作，而生成式AI在这三类均有涉猎，可以凭借强大的内容生产水平让人类产生“危机感”。
- ⏱ 2023-06-09 03:48:41
📌 2023年3月，我国诞生了首部AIGC生成的完整情节漫画。艺术家王睿利用AIGC，以小说《元宇宙2086》为蓝本，通过加噪点、去噪点、复原图片、作画这几个步骤，将文字转化成了可视化的内容，画面线条流畅、色彩绚烂，给人以强烈的视觉冲击，也在中国的科技艺术发展史上留下了浓墨重彩的一笔。
- ⏱ 2023-06-09 03:50:28

生成式模型基础

📌 2006年，计算机科学家、认知心理学家杰弗里·辛顿(Geoffrey Hinton)首次提出了“深度信念网络”。与传统的训练方式不同，深度信念网络有一个“预训练”(pre-training)的过程，可以方便地让神经网络中的权值找到一个接近最优解的值，之后再使用“微调”(fine-tuning)来对整个网络进行优化训练
- ⏱ 2023-06-17 00:01:40
📌 20世纪90年代，诺贝尔奖获得者埃德尔曼(Edelman)提出Darwinism模型并建立了一种神经网络系统理论。他从达尔文的自然选择理论中获得启发，将其与大脑的思维方式联系在了一起，认为“面对未知的未来，成功适应的基本要求是预先存在的多样性”，这与我们现在谈论较多的模型训练和预测方式相契合，对90年代神经网络的发展产生了重大意义。
- ⏱ 2023-06-17 00:02:40
📌 直到2006年，被称为“人工智能教父”的辛顿正式提出了深度学习的概念，认为通过无监督学习和有监督学习相结合的方式可以对现有的模型进行优化
- ⏱ 2023-06-16 23:59:37
📌 卷积神经网络的三个特性：第一，图像识别不需要识别图像的全部，每个神经元只需要聚焦图像的一小部分，识别的难度降低；第二，卷积层对应的神经元可以应用于不同的图像识别任务，比如图2-4中的神经元，经过训练，已经能够识别出小狗，那这些神经元也可以应用于识别其他任何图像中的相似物体；第三，虽然图像特征的维度降低了，但是由于保留了图像的主要特征，所以并不影响图像识别，反而减少了识别图像需要处理的数据量。这三个特性决定了卷积神经网络非常适合用于图像识别
- ⏱ 2023-06-17 00:10:30
📌 人工神经网络和卷积神经网络在深度学习领域都占有一席之地，但它们识别的都是独立的事件。比如卷积神经网络非常擅长识别独立的图像，如果让它识别一百张照片，输出的结果互相不受任何影响，但是让它识别或者预测一句连续的话，比如理解一个寓言故事或者翻译一段英文，可能就没有这么好的效果了。可是在现实生活中，我们会遇到很多连续的事件，比如“小明每次去超市都会买很多苹果，因为他最喜欢吃( )”
- ⏱ 2023-06-17 00:12:07
📌 RNN的全称是recurrent neural network，也就是循环神经网络。对循环神经网络的研究最早出现于20世纪80年代末，由几位神经网络专家提出，该模型经常用于时序信号（如语音）的识别和理解。循环就是重复的意思，循环神经网络模型在运行时会对同一个序列进行循环重复的操作。序列是被排成一列的对象，序列中的元素相互依赖，排列顺序非常重要，比如时序数据、对话等，一旦顺序错乱，含义和作用都会发生巨大改变。循环神经网络解决了卷积神经网络不能很好地识别连续性事件的问题，在深度学习领域发挥着不可替代的作用
- ⏱ 2023-06-17 00:15:34
📌 循环神经网络之所以能对连续性事件进行识别，是因为它不仅将当前的输入数据作为网络输入，还将之前感知到的数据一并作为输入。
- ⏱ 2023-06-17 00:15:59
📌 连续性数据在日常生活中出现的频率之高决定了循环神经网络有着广泛的应用空间
- ⏱ 2023-06-17 00:17:50
📌 GANGAN的全称是generative adversarial networks，即生成式对抗网络
- ⏱ 2023-06-17 00:19:36
📌 通过这种方式，GAN能够从多个维度学习到大量无标注数据的特性。以往的模型训练过程，要标注员将输入数据打上标签之后，模型才开始进行学习；而利用生成网络和判别网络之间的相互对抗，GAN可自发学习输入数据的规律，确保生成结果接近训练集中的真实样本，从而实现无标注数据的学习。其实，GAN和所有的生成式模型都一样，目标就是拟合训练数据的分布，对于图片生成任务来说，就是拟合训练集图片的像素概率分布。
- ⏱ 2023-06-17 00:21:12

Transformer和ChatGPT模型

📌 序列到序列任务一般具有以下两个特点：(1)输入输出序列都是不定长的。比如说机器翻译场景下，待翻译的句子和翻译结果的长度都是不确定的。(2)输入输出序列中元素之间是具有顺序关系的。不同的顺序，得到的结果应该是不同的，比如“我不喜欢”和“喜欢我不”这两个短语表达了两种完全不一样的意思。
- ⏱ 2023-06-17 00:24:09
📌 深度神经网络在解决输入和输出是固定长度的向量问题时，如图像识别，表现还是很优秀的，如果长度有一点变化，它也会灵活采用补零等手段来解决问题。但是对于机器翻译、语音识别、智能对话等问题，即将文本表示成序列后，事先并不知道输入输出长度，深度神经网络的处理效果就不尽如人意了。因此，如何让深度神经网络能够处理这些不定长度的序列问题，自2013年以后就成了研究界的热点，序列到序列模型也就在此基础上诞生了。
- ⏱ 2023-06-17 00:24:25
📌 序列到序列模型看似非常完美，但是在实际使用的过程中仍然会遇到一些问题。比如在翻译场景下，如果句子过长，会产生梯度消失的问题。由于解码时使用的是最后一个隐藏层输出的定长向量，那么越靠近末端的单词会被“记忆”得越深刻，而远离末端的单词则会被逐渐稀释掉，最终模型输出的结果也因此不尽如人意。面对这些问题，研究人员也提出了对应的解决方案，比如加入注意力(attention)机制。
- ⏱ 2023-06-17 00:25:24
📌 在不同的自然语言处理任务中，一个句子中的不同部分是有不同含义和重要性的，比如“我喜欢这本书，因为它讲了很多关于养花的知识”这句话：如果对这句话做情感分析，训练的时候明显应该对“喜欢”这个词语进行更多的关注；而如果基于书的内容进行分类，我们应该更关注“养花”这个词。这就涉及我们接下来要谈的注意力机制，这其实是借鉴了人类的注意力思维方式：人类从直觉出发，能利用有限的注意力，从大量信息中快速获取最有价值的信息。
- ⏱ 2023-06-17 00:25:46
📌 自注意力机制是注意力机制的一种变体。它减少了对外部信息的依赖，更擅长捕捉数据或特征的内部相关性。
- ⏱ 2023-06-17 00:27:32
📌 GPT系列模型GPT属于典型的“预训练+微调”两阶段模型。一般的神经网络在进行训练时，先对网络中的参数进行随机初始化，再利用算法不断优化模型参数。而GPT的训练方式是，模型参数不再是随机初始化的，而是使用大量通用数据进行“预训练”，得到一套模型参数；然后用这套参数对模型进行初始化，再利用少量特定领域的数据进行训练，这个过程即为“微调”。预训练属于迁移学习的一种。预训练语言模型把自然语言处理带入了一个新的阶段——通过大数据预训练加小数据微调，自然语言处理任务的解决无须再依赖大量的人工调参。
- ⏱ 2023-06-17 00:31:07
📌 GPT系列的模型结构秉承了不断堆叠Transformer的思想，将Transformer作为特征抽取器，使用超大的训练语料库、超多的模型参数以及超强的计算资源来进行训练，并通过不断提升训练语料的规模和质量，提升网络的参数数量，完成迭代更新。GPT模型的更新迭代也证明了，通过不断提升模型容量和语料规模，模型的能力是可以不断完善的。
- ⏱ 2023-06-17 00:31:51
📌 第一步，通过人工标注的方式生成微调模型。标注团队首先准备一定数量的提示词样本，一部分由标注团队自行准备，另一部分来自OpenAI现有的数据积累。然后，他们对这些样本进行了标注，其实就是人工对这些提示词输出了对应的答复，从而构成了“提示词—答复对”这样的数据集。最后用这些数据集来微调GPT-3.5，得到一个微调模型。
- ⏱ 2023-06-17 00:32:11

生成文字：新闻、报告、代码都可一键生成

📌 未来，人与机器的边界将会被进一步打破，“人机协同”这种新闻生产方式将占据新闻生产的主导地位，新闻机器人和新闻从业者需要明晰各自的分工，人工智能将会负责那些简单而又具有重复性的工作，专业的新闻从业人员则会负责那些需要深度思考和进行价值判断的工作。 ^3300058349-14-2749-2871
- ⏱ 2023-06-20 09:11:23

互动娱乐：游戏中的生成式AI革命

📌 游戏内容生成AI的使用如何助力游戏开发降本增效呢？让我们首先来了解一下游戏的成本构成。简单来说，不管是以个人为主的小成本独立游戏制作，还是公司牵头、人员齐备的大型商业游戏制作，对游戏的开发投入都主要分为两个部分，一是人力成本，二是非人力成本。
- ⏱ 2023-06-20 09:11:27
📌 开发游戏的人员主要由三大工种构成，分别是策划、美工以及程序开发，在这三大工种之下，又可以分出系统、文案、数值、关卡、引擎、角色、场景、美术风格、原画等诸多职能。非人力成本则包括游戏开发的房租、电费、电脑、服务器、IP授权费用等。人力成本占了所有游戏开发费用的大部分。
- ⏱ 2023-06-20 09:11:25

研发设计：设计能力样样俱全

📌 生成式设计(generative design)是一种有别于手动设计的新式设计方式，它应用AI能力为产品或零件提出多种设计变体，这样设计选项的生成速度更快，可以缩短产品开发时间并提供更多创造性选择
- ⏱ 2023-06-20 09:11:22
📌 目前生成式AI在设计方案时，仍然只能做辅助性工作。因为设计的价值不仅在于输出设计图，更在于设计背后的体系化思考、与需求的对接、对市场的理解、同用户的共情等，这些仍需要设计师的专业技能和经验储备，仍需设计师在实践中对设计进行校正、迭代和应用
- ⏱ 2023-06-20 09:11:22

市场营销：营销文案不再发愁

📌 在人工智能时代，企业在和客户的交互过程中会积累大量的数据，企业的决策在很大程度上是靠数据驱动的。对于市场营销这个高度依靠数据驱动的专业，人工智能技术天然与其契合。例如，当我们打开手机浏览网页或视频时，系统会很精准地推送一些我们感兴趣的文章、视频或直播；当我们浏览购物网站时，我们想要的或者感兴趣的产品似乎与我们“心有灵犀一点通”，统统展现在我们面前，等待着我们拥有它们；如此等等。这就是人工智能的魅力，
- ⏱ 2023-06-20 09:11:27
📌 用决策式AI来锁定精准人群，为用户匹配个性化的产品以及内容已经成为营销领域的标配
- ⏱ 2023-06-20 09:11:28
📌 在国内，蓝色光标旗下的销博特推出了2022元创版本智能策划模块，该版本主要聚焦营销策划场景的多人协同创作。通常，营销团队发起一场营销策划需要多种角色的人才组成专业小组，经过草案规划、数据分析、头脑风暴、媒体规划等多轮沟通交流，历时数周才能完成。而若使用销博特此次发布的智能策划模块，用户可以在该功能模块中填写简报，而后发起一个营销策划项目，由人工智能在30分钟内生成一个策划方案。然后用户可以邀请团队成员加入，查看已经创建好的策划方案，加入的成员可以一起参与讨论，提出自己的想法和修改意见。
- ⏱ 2023-06-20 09:11:25

客户服务：贴心服务打动客户

📌 知识库管理知识文章(knowledge articles)可以解决客户在使用企业的产品或服务时遇到的问题，知识文章的类型包括常见问题的解决方案、产品简介、产品或功能文档等。企业的所有知识文章构成了知识库(knowledge base)，知识库是一个自助式的客户服务库，客户可以从中找到答案，以便他们自己解决问题。同时，知识库也为智能客服注入灵魂，良好的知识结构、精准的知识内容，配合合理的对话流程能确保智能客服的对话质量，让对话更流畅。 ^3300058349-24-4003-4247
- ⏱ 2023-06-20 09:11:26

展望未来：AIGC是否是新一轮的技术革命？

📌 可以说，目前的自然语言处理技术和大型语言模型确实展现出了一些AGI的影子，但距离真正的AGI还很远。因为ChatGPT等模型虽然已经具有智能对话、语言翻译、文本生成等实用功能，但它们仍然缺乏某些关键的特征和能力，例如跨模态感知、多任务协作、情感理解等，这些能力的缺乏导致了我们目前看到的ChatGPT在回答中尚有生硬之处，比如有时它的回答看似合理，却是错误或荒谬的，有时人们调整问题措辞后，会获得不同的答案，无法拒绝不合理及不道德的请求
- ⏱ 2023-06-20 09:11:24
📌 当前的AIGC在文本生成、图片生成、视频生成等方面已经达到了堪称出神入化的效果，但AIGC的内容革命远不仅限于此，代码、算法、规划、流程设计等众人看来并非日常生活中可触可感的内容，或许是这场内容革命中更加关键的部分
- ⏱ 2023-06-20 09:11:28

Neo's 🪴

Table of Contents

生成式人工智能

元数据

高亮划线

纵观AI产业版图

聚焦AIGC：内容皆可生成

生成式AI的核心价值

生成式模型基础

Transformer和ChatGPT模型

生成文字：新闻、报告、代码都可一键生成

互动娱乐：游戏中的生成式AI革命

研发设计：设计能力样样俱全

市场营销：营销文案不再发愁

客户服务：贴心服务打动客户

展望未来：AIGC是否是新一轮的技术革命？

读书笔记

本书评论

Recent Journals

Individuals in the AI Era

xiaomi ev

How to Make a Meaningful Impact in a Finite Life

Skincare Routine

Someday is today

Recent Readings

Using Pip to install packages to Anaconda Environment

Kelly-必然 The Inevitable

Moore-跨越鸿沟，第三版 Crossing the Chasm, 3rd Edition

Ruggiero-Beyond Feelings

Unknown-参考周刊｜Vol.47 兰迪·波许经典演讲：何为时间管理？