什么是生成式人工智能？— 生成式人工智能详解

什么是生成式人工智能？

生成式人工智能是一种可用于创建新的内容和想法（包括对话、故事、图像、视频和音乐）的人工智能。它可以学习人类语言、编程语言、艺术、化学、生物学或任何复杂的主题，也可以重复利用已知知识来解决新问题。例如，学习英语词汇并根据其处理的字词创作一首诗。您的组织可以将生成式人工智能用于各种用途，例如聊天机器人、媒体创作以及产品开发和设计。

人工智能和生成式人工智能有什么区别？

人工智能是更广泛的概念，旨在让机器更加接近人类。人工智能的涵盖范围非常广，例如 Alexa 这样的智能助手、聊天机器人、图像生成器，以及机器人吸尘器和自动驾驶汽车。生成式人工智能则是人工智能的一个子集，专注于以有意义且智能的方式生成新内容。

生成式人工智能是什么时候诞生的？

生成式人工智能于 2010 年代末出现，当时，深度学习，特别是生成式对抗网络（GAN）和转换器等模型，取得了进展。自 2022 年以来，云计算的发展使生成式人工智能在商业上可行并可用。

生成式人工智能中的基础模型是什么？

基础模型是在广泛的文本和图像数据上训练的大型生成式人工智能模型。它们能够执行各种常规任务，例如回答问题、撰写论文和为图像添加字幕。

什么是生成式人工智能示例？

生成式人工智能在各个行业都有许多使用案例

金融服务

金融服务公司可以利用生成式人工智能工具，在降低成本的同时更好地为客户提供服务：

金融机构使用聊天机器人生成产品推荐并回复客户查询，从而改善整体客户服务
贷款机构加快金融服务不足的市场（特别是在发展中国家）的贷款审批
银行快速检测到索赔、信用卡和贷款中的欺诈行为
投资公司利用生成式人工智能的强大功能，以低成本为其客户提供个性化的金融建议

阅读有关 AWS 上适用于金融服务行业的生成式人工智能的更多信息

医疗保健及生命科学

生成式人工智能最有前景的使用案例之一是加速药物发现和研究。生成式人工智能可以创建具有特定特性的新型蛋白质序列，以此设计抗体、酶、疫苗和基因疗法。

医疗保健和生命科学公司使用生成式人工智能工具设计合成基因序列，为合成生物学和代谢工程应用程序设计合成基因序列。例如，这些公司可以创建新的生物合成途径或优化用于生物制造的基因表达。

生成式人工智能工具还可以创建合成的患者和医疗保健数据。这些数据对于在不访问大型现实数据集的情况下训练 AI 模型、模拟临床试验或研究罕见疾病非常有用。

阅读有关 AWS 上适用于医疗保健与生命科学行业的生成式人工智能的更多信息

汽车和制造业

汽车公司将生成式人工智能技术用于从工程到车内体验和客户服务的多种用途。例如，这些公司可以优化机械零件的设计，以减少车辆设计中的阻力或调整辅助系统的设计。

汽车公司使用生成式人工智能，通过快速回答最常见的客户问题来优化客户服务。生成式人工智能可以创建新的材料、芯片和零件设计，以优化制造流程并降低成本。

另一个生成式人工智能使用案例是合成数据以测试应用程序。这对于通常未包含在测试数据集中的数据（例如缺陷或边缘情况）特别有用。

阅读有关 AWS 上适用于汽车行业的生成式人工智能的更多信息

媒体和娱乐

从动画和脚本到完整的电影，生成式人工智能模型只需花费相当于传统生产一小部分的成本和时间，即可制作出新颖的内容。

业内其他生成式人工智能使用案例包括：

艺术家可以通过人工智能生成的音乐来补充和增强他们的专辑，从而创作出全新的体验
媒体组织使用生成式人工智能，通过提供个性化内容和广告来改善受众体验，从而增加收入。
游戏公司使用生成式人工智能来创建新游戏并允许玩家构建头像。

远程通信

电信领域的生成式人工智能应用场景专注于重塑由订阅用户在客户旅程的各个接触点上的累积互动定义的客户体验。

例如，电信组织可以应用生成式人工智能，通过类似人类的实时对话代理来改善客户服务。这些组织可以通过个性化的一对一销售助手来重塑客户关系。他们还可以通过分析网络数据来推荐修复方法，从而优化网络性能。

阅读有关 AWS 上适用于电信行业的生成式人工智能的更多信息

能源

生成式人工智能适用于涉及复杂原始数据分析、模式识别、预测和优化的能源行业任务。能源组织通过分析企业数据来确定使用模式，从而改善客户服务。利用这些信息，组织可以开发有针对性的产品、能源效率计划或需求响应计划。

生成式人工智能还有助于电网管理、提高运营现场安全性以及通过油藏模拟优化能源生产。

生成式人工智能有哪些好处？

高盛表示，生成式人工智能可推动全球国内生产总值（GDP）增长 7%（或近 7 万亿美元），并在十年内将生产率增长提高 1.5 个百分点。

接下来，我们将介绍生成式人工智能的更多优点。

加速研究

生成式人工智能算法可以用新的方式探索和分析复杂的数据，使研究人员能够发现原本可能不明显的新趋势和模式。这些算法可以汇总内容，概述多种解决方案路径，集思广益，并根据研究笔记创建详细的文档。这就是生成式人工智能可极大地增强研究和创新的原因所在。

例如，制药行业正在使用生成式人工智能系统来生成和优化蛋白质序列，并显著加快推进药物发现。

改善客户体验

生成式人工智能可以自然地响应人类对话，并可用作客户服务和客户工作流程个性化的工具。

例如，可以使用人工智能驱动的聊天机器人、语音机器人和虚拟助手，它们可以更准确地响应客户，从而可在首次联系时解决问题。它们可以通过以个性化的方式展示精心策划的服务和沟通内容来提高客户参与度。

优化业务流程

借助生成式人工智能，企业可以在所有业务领域利用机器学习（ML）和人工智能应用程序来优化业务流程。可以将此技术应用于所有业务领域，包括工程、营销、客户服务、财务和销售。

例如，以下是生成式人工智能可以执行的优化：

从任何来源提取和汇总数据，将其用于知识搜索功能
评估和优化营销、广告、财务和物流等领域的不同成本降低方案。
生成合成数据，为有监督学习和其他机器学习过程创建标注数据。

提高员工的工作效率

生成式人工智能模型可以增强员工的工作流程，并且充当组织中每个人的高效助手。它们可以采用类似人类的方式完成从搜索到创建的所有任务。

生成式人工智能可以提高不同类型员工的工作效率：

根据特定的输入和约束条件生成多个原型，从而支持创意任务。该技术还可以根据人工反馈和指定约束条件优化现有设计。
针对应用程序开发任务生成新的软件代码建议。
通过生成报告、摘要和预测来支持管理。
为营销团队生成新的销售脚本、电子邮件内容和博客

可以节省时间、降低成本并提高整个组织的效率。

生成式人工智能技术如何演变？

过去几十年来，统计学中一直使用基本生成模型来帮助进行数值数据分析。神经网络和深度学习是现代生成式人工智能的最新先驱技术。2013 年开发而成的变分自动编码器是第一个可以生成逼真图像和语音的深度生成模型。

VAE

VAE 引入创建多种数据类型创新变体的功能。该功能推动其他生成式人工智能模型的迅速出现，例如生成式对抗网络和扩散模型。这些创新侧重于让生成的数据日益类似于真实数据，尽管这些数据是人为创建的。

转换器

2017 年，随着转换器的推出，人工智能研究发生进一步的转变。转换器将编码器和解码器架构与注意力机制无缝集成。转换器以卓越的效率和多功能性简化语言模型的训练过程。像 GPT 这样的著名模型已成为基础模型，它们能够在广泛的原始文本语料库上进行预训练，并针对不同的任务进行微调。

转换器变革自然语言处理可能实现的功能。它们为从翻译、摘要到回答问题等任务提供了生成式功能。

未来

许多生成式人工智能模型持续取得长足进步，并且已经形成跨行业应用。最近的创新侧重于优化模型以使用专有数据。研究人员还希望创建越来越类似人类行为的文本、图像、视频和语音。

生成式人工智能如何运作？

像所有人工智能一样，生成式人工智能的运作方式是使用机器学习模型，后者是根据大量数据进行预训练的超大型模型。

基础模型

基础模型（FM）是在广泛的广义和未标记数据上训练的机器学习模型。这些模型能够执行各种各样的常规任务。

FM 是这项已经发展了数十年的技术的最新进展结果。通常，FM 使用学习的模式和关系来预测序列中的下一个项目。

例如，在生成图像时，模型会分析图像并创建更清晰、更明确定义的图像版本。同样，对于文本，模型会根据之前的单词及其上下文预测文本字符串中的下一个单词。然后，模型使用概率分布技术选择下一个单词。

大型语言模型

大语言模型（LLM）是 FM 的一种。例如，OpenAI 的生成式预训练转换器（GPT）模型是 LLM。LLM 专门处理基于语言的任务，例如摘要、文本生成、分类、开放式对话和信息提取。

阅读有关 GPT 的信息

LLM 的与众不同在于它们能够执行多项任务。实现此功能的原因是 LLM 包含许多参数，使其能够学习高级概念。

像 GPT-3 这样的 LLM 可以考虑数十亿个参数，并且能够根据很少量的输入生成内容。通过在预训练中接触各种形式和多种模式的互联网规模数据，LLM 学会了在各种环境中应用它们的知识。

生成式人工智能模型如何运作？

传统的机器学习模型具有辨别性，或者侧重于对数据点进行分类。它们尝试确定已知因素和未知因素之间的关系。例如，这些模型查看图像，即像素排列、线条、颜色和形状等已知数据，然后将它们映射到字词，即未知因素。从数学上讲，这些模型的工作原理是识别可以用数值方式将未知和已知因素映射为 x 和 y 变量的方程。

生成式模型在此基础上更进一步。这些模型不是在给定某些特征的情况下预测标签，而是在给定特定标签的情况下尝试预测特征。从数学上讲，生成式建模计算 x 和 y 同时出现的概率。该模型学习不同数据特征的分布及其关系。

例如，生成式模型分析动物图像以记录变量，例如不同的耳朵形状、眼睛形状、尾巴特征和皮肤图案。这些模型学习特征及其关系，以了解不同动物的总体外观。然后，它们可以重新创建训练集中没有的新动物图像。

接下来，我们给出几大类生成式人工智能模型。

扩散模型

扩散模型通过对初始数据样本进行迭代性的受控随机更改来创建新数据。这些模型以原始数据为起点，然后加入细微的变化（噪点），逐渐使其与原始数据不那么相似。这种噪点经过仔细控制，以确保生成的数据保持一致性和真实性。

在多次迭代中添加噪点之后，扩散模型反转该过程。反向去噪会逐渐消除噪点，从而产生与原始数据样本相似的新数据样本。

生成式对抗网络

生成式对抗网络（GAN）是基于扩散模型概念构建的另一种生成式人工智能模型。

GAN 的工作原理是以竞争方式训练两个神经网络。第一个网络称为生成者，通过添加随机噪点来生成虚假的数据样本。第二个网络称为辨别者，其尝试区分真实数据和生成者产生的虚假数据。

在训练过程中，生成者不断提高其创建真实数据的能力，而辨别者日益加强区分真假数据的能力。这种对抗过程一直持续到生成者产生的数据令人信服，以至于辨别者无法将其与真实数据区分。

GAN 广泛用于生成逼真的图像、风格转换和数据增强任务。

变分自动编码器

变分自动编码器（VAE）学习一种称为潜在空间的紧凑数据表示形式。潜在空间是数据的数学表示形式。可以将潜在空间视为唯一的代码，根据数据的所有属性来表示数据。例如，如果研究面部，则潜在空间包含代表眼睛形状、鼻子形状、颧骨和耳朵的数字。

VAE 使用两个神经网络，即编码器和解码器。编码器神经网络将输入数据映射为潜在空间每个维度的均值和方差。该神经网络从高斯（正态）分布中生成随机样本。此样本是潜在空间中的一个点，表示输入数据的压缩简化版本。

解码器神经网络从潜在空间中获取此取样点，然后将其重新构造回与原始输入相似的数据。使用数学函数衡量重新构造的数据与原始数据的匹配程度。

基于转换器的模型

基于转换器的生成式人工智能模型基于 VAE 的编码器和解码器概念构建。基于转换器的模型为编码器添加更多层，以提高理解、翻译和创意写作等文本式任务的处理性能。

基于转换器的模型使用自注意力机制。在处理序列中的每个元素时，这些模型会权衡输入序列中不同部分的重要性。

另一个关键功能是这些人工智能模型会实施上下文嵌入。序列元素的编码不仅取决于元素本身，还取决于其在序列中的上下文。

基于转换器的模型的运作方式

要理解基于转换器的模型如何运作，可以将语句想象成单词序列。

自注意力可以帮助模型在处理每个单词时将注意力集中在相关的单词上。为获取单词之间不同类型的关系，基于转换器的生成式模型采用称为注意力头的多个编码器层。每个注意头都学习关注输入序列的不同部分，从而使模型能够同时考虑数据的各个方面。

每一层还优化了上下文嵌入，使嵌入的信息更丰富，同时可获取从语法句法到复杂语义的所有内容。

生成式人工智能有哪些限制？

尽管生成式人工智能系统有所进步，但这些系统有时会生成不准确或误导性的信息。它们依赖于训练所依据的模式和数据，可以反映出这些数据中的固有偏差或误差。与训练数据相关的其他问题包括

安全性

如果使用专有数据自定义生成式人工智能模型，则会出现数据隐私和安全问题。必须努力确保生成式人工智能工具生成能够限制未经授权访问专有数据的响应。如果人工智能模型的决策缺乏问责性和透明度，也会出现安全问题。

了解使用 AWS 实现生成式人工智能的安全方法

创造力

尽管生成式人工智能可以生成富有创意的内容，但它往往缺乏真正的独创性。人工智能的创造力受其训练所依据的数据的限制，所输出的内容可能会有重复性或衍生性。人类的创造力涉及更深层次的理解和情感共鸣，对于人工智能而言，要完全复制这些特质，仍具挑战性。

成本

训练和运行生成式人工智能模型需要使用大量的计算资源。与尝试从头开始构建新模型相比，基于云的生成式人工智能模型更易于访问且更经济实惠。

可解释性

由于其复杂性和不透明性，生成式人工智能模型通常被视为黑匣子。了解这些模型如何产生特定的输出具有挑战性。改善可解释性和透明度对于增进信任和提高采用率至关重要。

生成式人工智能的采用有哪些最佳实践？

如果组织想要实施生成式人工智能解决方案，请考虑采用以下最佳实践来强化工作。

从内部应用程序开始采用

最好从内部应用程序开发开始采用生成式人工智能，重点关注流程优化和员工生产效率提升。可以获得更加可控的环境来测试结果，同时培养技能和理解相关技术。可以广泛测试模型，甚至可以在内部知识源上自定义模型。

这样，在最终将这些模型用于外部应用程序时，客户将获得更理想的体验。

提高透明度

就所有生成式人工智能应用程序和输出进行清晰的沟通，这样用户就可知道他们正在与人工智能而非人类进行交互。例如，AI 可以自我介绍为人工智能，或者可以标记和突出显示基于人工智能的搜索结果。

这样，用户就可以在与内容互动时自行做出判断。他们还可以更主动地处理底层模型可能存在的任何不准确或隐藏的偏差（由于训练数据的局限性）。

实施安全性

实施防护机制，从而使生成式人工智能应用程序不会允许无意中未经授权访问敏感数据。让安全团队从一开始参与进来，这样就可在启动时考虑所有方面。例如，在根据内部数据训练任何模型之前，您可能必须掩蔽数据并移除个人身份信息（PII）。

广泛测试

开发自动和手动测试流程来验证结果，以及测试生成式人工智能系统可能遇到的所有类型场景。让不同的测试版测试人员组以不同的方式试用应用程序并记录结果。该模型还将通过测试不断改进，并且您可以更全面地控制预期结果和响应。

什么是面向初学者的生成式人工智能培训？

生成式人工智能培训从理解基础机器学习概念开始。学员还必须探索神经网络和 AI 架构。使用 TensorFlow 或 PyTorch 等 Python 库的实际经验对于实施和试验不同的模型至关重要。您还必须学习模型评测、微调和提示工程技能。

拥有人工智能或机器学习方面的学位可提供深入的培训。考虑参加在线短期课程和认证以促进专业发展。AWS 上的生成式人工智能培训包括 AWS 专家就以下主题提供的认证：

AWS 如何协助生成式人工智能？

借助 Amazon Web Services（AWS），您可以针对自己的数据、使用案例和客户轻松构建和扩展生成式人工智能应用程序。借助 AWS 上的生成式人工智能，您可以获得企业级的安全和隐私，并且可以接触行业领先的 FM、生成式人工智能驱动的应用程序，以及数据优先的方法。

从一系列生成式人工智能服务中进行选择，这些技术支持处于生成式人工智能采用和成熟化的每个阶段的所有类型组织：

代码生成是生成式人工智能最具前景的应用领域之一。借助 Amazon Q 开发者版（一款基于生成式人工智能的软件开发助手），您可以在提高开发人员生产效率方面取得出色成果。
Amazon Bedrock 是另一项完全托管的服务，它提供多种高性能 FM 和一系列广泛功能。可以轻松地试用各种顶级 FM，使用自己的数据对其进行私有自定义，以及创建执行复杂业务任务的托管代理。
还可以使用 Amazon SageMaker JumpStart 发现、探索和部署开源 FM，甚至可以创建自己的 FM。SageMaker JumpStart 提供托管基础设施和工具，可加快构建、训练和部署可扩展、可靠且安全的模型。
AWS HealthScribe 是一项符合 HIPAA 要求的服务，有助于医疗保健软件供应商构建临床应用程序，从而通过分析患者与临床医生的对话自动生成临床记录。AWS HealthScribe 将语音识别和生成式人工智能（AI）相结合，通过转录患者与临床医生的对话和生成更易于查看的临床笔记来减轻临床文档方面的负担。
QuickSight 中的 Amazon Q 使用自然语言命令帮助业务分析师轻松创建和自定义视觉效果。全新的生成式商业智能编写功能扩展 QuickSight Q 的自然语言查询，使其不仅是回答结构合理的问题（例如“加州销量排名前十的产品有哪些？”）以帮助分析师根据问题片段（例如“排名前十的产品”）快速创建可自定义的视觉效果，更可以通过询问后续问题来明确查询的意图，完善视觉效果并完成复杂的计算。

立即创建账户开始在 AWS 上使用生成式人工智能。

什么是生成式人工智能？