什么是生成式 AI?
生成式 AI 定义
面向学生的解释(基础):
生成式 AI 是一种能够创造新的原创内容的技术;例如,创作艺术、音乐,编写软件代码和进行写作等。当用户输入提示时,人工智能可根据从互联网上现有示例中学到的知识生成回复,通常会生成独特且富有创意的结果。
面向开发人员的解释(技术):
生成式 AI 是人工智能的一个分支,其核心是能够生成原创内容的计算机模型。通过利用大型语言模型、神经网络和机器学习的强大功能,生成式 AI 能够模仿人类创造力生成新颖的内容。这些模型使用大型数据集和深度学习算法进行训练,从而学习数据中存在的底层结构、关系和模式。根据用户的输入提示,生成新颖独特的输出结果,包括图像、视频、代码、音乐、设计、翻译、问题回答和文本。
生成式人工智能的工作原理
生成式 AI 模型的工作原理是,利用受人类大脑神经元启发而开发的神经网络,从现有数据中学习模式和特征。然后,这些模型可以生成与所学模式相符的新数据。例如,基于一组图像训练的生成式 AI 模型可以创建出看起来与训练时所用图像相似的新图像。这类似于语言模型根据上下文中提供的单词便可生成洋洋洒洒的文本一样。
生成式 AI 可利用生成式对抗网络 (GAN)、大型语言模型、变分自动编码器模型 (VAE) 和转换器等先进技术来创建跨一系列动态领域的内容。下文将详细介绍这些方法。
这些模型可以从大型数据集中学习,通过迭代训练过程来完善它们的输出结果。模型可分析给定数据中的关系,有效地从所提供的示例中获取知识。通过调整参数并最大限度地缩小期望输出和生成输出之间的差异,生成式 AI 模型可以不断提高自身能力,以生成高质量、与上下文相关的内容。无论是一首奇思妙想的诗歌,还是聊天机器人的客户支持回复,生成的结果通常与人工写的内容没什么区别。
从用户的角度来看,生成式 AI 通常从引导内容生成的初始提示开始,然后是一个反复迭代的过程,以探索和完善各种形式的结果。
观看此视频,深入了解生成式 AI 的工作原理。了解在探究为您的企业或组织实施它时要考虑的事项。
生成式 AI 模型的类型
生成式 AI 会采用各种模型来创建新的原创内容。部分最常见的生成式 AI 模型包括:
生成式对抗网络 (GAN):GAN 由两个关键组件组成:生成器和鉴别器。生成器根据从训练数据中学习到的模式生成合成数据。鉴别器则充当鉴定人,评估所生成数据与真实数据相比的真实性,并决定数据的真假。训练过程将教会生成器生成更逼真的输出结果,而鉴别器则不断提高对真实数据和合成数据的区分能力。GAN 广泛应用于图像生成领域,并在创造异常逼真的视觉效果方面展现出了令人印象深刻的成果。
变分自动编码器 (VAE):VAE 是可学习编码和解码数据的神经网络。编码器用于将输入数据压缩为一个低维表示(称为潜在空间)。同时,解码器用于从潜在空间重建原始数据。VAE 能够通过对潜在空间中的点进行采样,并将其解码为有意义的输出,从而生成新数据。这种方法在图像和音频合成方面尤为有用,因为可以通过对潜在表示的处理,生成多种多样且有创意的输出。
大型语言模型 (LLM):像 ChatGPT(生成式预训练转换器)这类最常见类型的 LLM,都是基于大量文本数据训练出来的。这些复杂的语言模型使用了从教科书、网站到社交媒体帖文等多个领域的知识。它们利用转换器架构来理解并根据给定的提示生成连贯的文本。转换器模型是大型语言模型中最常见的架构。它由编码器和解码器组成,通过将给定提示转换为词元来处理数据,从而发现词元之间的关系。
从本质上讲,转换器模型可以预测单词序列中的下一个单词,从而模拟人类对话。LLM 能够参与逼真的对话、回答问题,并生成创造性的、类似于人的回复,因此非常适用于与语言相关的应用,例如聊天机器人、内容创建、翻译等等。
生成式 AI 有哪些优势?
生成式 AI 在个人和商业层面都具有强大的优势。随着技术的发展,它的影响力只会越来越大。从短期来看,最直接、最显著的优势之一就是提高效率和简化工作流。自动执行任务的能力可为人员和企业节省宝贵的时间、精力和资源。从起草电子邮件到进行预订,生成式 AI 已经在提高效率和生产力方面发挥作用。下面就生成式 AI 发挥作用的方式列举一二:
- 通过内容创建自动化,企业和个人能够大规模制作高质量的定制内容。这已经在各个领域产生了很大影响,尤其是广告、营销、娱乐和媒体制作领域,优势更为明显。
- 生成式 AI 可以作为艺术家、设计师、作家、建筑师和其他创作者的灵感工具,助力他们探索新的可能性、产生新的想法,并在创意工作中不断突破自我。通过协同使用生成式 AI,创作者可以将工作效率提升到过去难以想象的高度,从而为涉猎艺术品、文学、新闻、建筑、视频、音乐和时尚等更多领域铺平道路。
- 生成式 AI 模型可用于需要提供新解决方案或想法的解决问题型的任务,也可用于分析数据以改进决策。例如,在产品设计中,由 AI 支持的系统可以根据具体的约束和要求生成新的原型或优化现有设计。针对研发方面的实际应用可能是革命性的。在几秒钟内总结复杂信息的能力对解决问题有着广泛的益处。
- 对于开发人员来说,生成式 AI 可以简化代码的编写、检查、实施和优化的过程。
- 对于面向消费者的企业来说,由生成式 AI 支持的聊天机器人和虚拟助手有助于他们提供更好的客户支持体验,缩短响应时间,减轻资源负担。
生成式 AI 有哪些挑战和局限性?
虽然生成式 AI 具有巨大的发展潜力,但它也面临着一定的挑战和局限性。部分关键问题包括:
数据偏见:生成式 AI 模型依赖于它们训练所使用的数据。如果训练数据存在偏见或局限性,这些偏见就会在输出结果中反映出来。组织可以通过仔细限制训练模型所使用的数据,或使用符合自身需求的定制专用模型来缓解这些风险。
伦理方面的考虑:生成式 AI 模型创造逼真内容的能力引发了伦理方面的担忧,例如它对人类社会产生的影响,以及被滥用或操纵的可能性。确保以负责任且合乎伦理的方式使用生成式 AI 技术,将是一个持续存在的问题。
输出不可靠:众所周知,生成式 AI 和 LLM 模型会产生幻觉反应,当模型无法获取相关信息时,这一问题就会更加严重。这可能会导致向用户提供错误的答案或误导性信息,而这些信息听起来却真实可信。内容听起来越真实,识别出不准确的信息就越难。
领域特定性:缺乏对特定领域内容的了解是 ChatGPT 等这类生成式 AI 模型的一个常见局限。模型可以根据它们训练所使用的信息(通常是公开互联网数据)生成连贯且与上下文相关的回复,但它们通常无法访问特定领域的数据,也无法提供依赖于独特知识库(如组织的专有软件或内部文档)的答案。您可以通过提供对特定于领域的文档和数据的访问权限来最大限度地减少这些限制。
时效性:模型的新鲜程度取决于它们训练所用的数据。模型所能提供的回复是基于“特定时间点”数据的,而非实时数据。
计算要求:训练和运行大型生成式 AI 模型需要大量的计算资源,包括性能强大的硬件和大量的内存。这些要求可能会增加成本,并限制某些应用程序的可访问性和可扩展性。
数据要求:训练大型生成式 AI 模型还需要访问大量的语料数据,这些数据的存储可能非常耗时且成本高昂。
来源问题:生成式 AI 模型并不总是能确定所提取内容的来源,从而引发复杂的版权和归属问题。
缺乏可解释性:生成式 AI 模型通常像“黑盒”一样运作,这使得理解其决策过程变得特别困难。缺乏可解释性可能会阻碍信任并限制在关键应用领域的采用。
模型部署和管理过程:选择正确的模型需要试验和快速迭代。对于许多开发人员来说,为生成式 AI 应用程序部署大型语言模型 (LLM) 既耗时又复杂,而且具有陡峭的学习曲线。
流行的生成式 AI 模型有哪些?
生成式 AI 模型的形式多种多样,每种模型都有独特的功能和应用,而且生成式 AI 接口的数量似乎每天都在增加。目前,最流行、最强大的生成式 AI 模型包括:
ChatGPT
ChatGPT 是由 OpenAI 开发的一个大型语言模型,自 2022 年 11 月公开发布以来取得了巨大成功。它使用对话式聊天界面与用户互动,并对输出结果进行微调。它旨在理解文本提示,并生成类似于人的回复,而且它已展示出了参与对话交流、回答相关问题,甚至展现幽默感的能力。
据说,最初向用户免费提供的 ChatGPT-3 版本是根据互联网上超过 45 TB 的文本数据进行训练的。不久之后,Microsoft 将 GPT 的一个版本集成到了 Bing 搜索引擎中。OpenAI 的升级版、基于订阅的 ChatGPT-4 是于 2023 年 3 月推出的。
ChatGPT 采用最先进的转换器架构。GPT 是“Generative Pre-trained Transformer”(生成式预训练转换器)的缩写,转换器架构为自然语言处理 (NLP) 领域带来了革命性的变化。
DALL-E
同样来自 OpenAI 的 DALL-E 2 专注于生成图像。DALL-E 结合了 GAN 架构与变分自动编码器,可基于文本提示生成高度细腻和富有想象力的视觉结果。借助 DALL-E,用户可以描述自己心目中的图像和风格,模型就会生成它。与 MidJourney 和新晋加入的 Adobe Firefly 等竞争对手一样,DALL-E 和生成式 AI 正在彻底改变图像的创建和编辑方式。随着整个行业不断涌现的新兴能力,视频、动画和特效也将发生类似的转变。
Google Gemini
Gemini 最初是基于 Google LaMDA 系列大型语言模型的一个版本构建而成,后来升级到更先进的 PaLM 2,是 Google ChatGPT 的替代品。Gemini 的功能与 ChatGPT 类似,可以编码、解决数学问题、回答问题、写作,以及提供 Google 搜索结果。
生成式 AI 用例
尽管这项技术还不是很成熟且发展迅速,但生成式 AI 已经在各种应用和行业中站稳了脚跟。通过构建生成式 AI 驱动的用户应用程序,公司可以构建新的客户体验,以提高满意度、收入和盈利能力,还可以构建新的员工工作流,以提高生产效率,同时降低成本和风险。用例包括:
- AI 在技术领域的应用:生成式 AI 可以通过交互式支持和知识库帮助技术组织提升客户体验和服务,通过编写代码和建模试验来加速产品研发,以及使用 AI 驱动的助手重新定义员工工作流,帮助快速合成和提取信息。
- AI 在政府机构中的应用:国家和地方政府机构都在考虑如何利用生成式 AI 打造更具个性化且高度相关的公共服务,提供更准确的调查和情报分析,让员工实现更高的工作效率,简化选民的数字体验等等。
- AI 在金融服务领域的应用:银行、保险公司、财富管理公司、信贷机构和其他金融机构可以利用生成式 AI 来打造影响营收的创新型客户体验,例如零售银行业务助手、自助服务客户聊天机器人、虚拟财务顾问、贷款助手等。生成式 AI 还可以提高员工查找相关信息的能力,从而加快他们的工作流。无论是欺诈检测、风险管理、市场研究还是销售和交易,由 AI 驱动的助手都可以帮助减少花在手动任务上的时间并加速决策。
- AI 在广告和营销领域的应用:生成式 AI 可为广告和营销活动、社交媒体帖文、产品描述、品牌宣传材料、营销电子邮件、个性化推荐以及许多其他有针对性的营销、追加销售和交叉销售策略提供自动化、低成本的内容。基于消费者数据和分析制作量身定制的内容,生成式 AI 可以提高客户参与度和转化率。它还可以使用数据对客户进行细分,以预测目标群体对活动的反应。
- AI 在医疗保健领域的应用:生成式 AI 模型可帮助进行医学图像分析、疾病诊断、识别药物相互作用和加速药物发现,从而节省时间和资源。通过生成合成医学数据,模型可帮助扩充有限的数据集,并提高诊断系统的准确性。
- AI 在汽车和制造业领域的应用:借助生成式 AI,汽车和制造公司能够提供相关工具包,用于简化员工运营工作,例如识别运营技术问题,管理交互式供应链,使用数字孪生进行预测性维护,或者为任何业务部门提供相关的虚拟助手。组织还可以考虑开发交互式数字手册、自助聊天机器人、辅助产品配置器等,以提升客户体验和留存率。
- AI 在艺术和媒体领域的应用:与其他任何领域相比,生成式 AI 或许更能为创意领域带来彻底改变。它可以帮助艺术家和设计师更快地生成独一无二的作品,帮助音乐家谱写新的旋律,帮助游戏设计师渲染全新的世界,以及帮助电影制作人生成视觉效果和逼真的动画。电影和媒体公司也能以更经济地方式制作内容,例如使用原演员的声音将作品翻译成不同的语言。
- AI 在电子商务和零售业领域的应用:生成式 AI 可以利用购物者的购买模式推荐新产品,并创建更顺畅的购物流程,从而帮助电子商务企业为购物者提供更具个性化的购买体验。对于零售商和电子商务企业来说,无论从更直观的浏览到使用聊天机器人支持的 AI 客户服务功能,以及 AI 常见问题解答板块,AI 都可以打造更好的用户体验。
生成式 AI 的下一步是什么?
生成式 AI 的未来充满希望。随着技术的进步,越来越复杂的生成式 AI 模型都在面向全球关注的各种问题进行探索。通过生成和测试分子解决方案,AI 可能会使药物发现和开发的研究速度骤然加速,从而加快研发进程。例如,Pfizer 在冠状病毒疫情期间就采用了 AI 进行疫苗试验1。此外,AI 还是应对许多环境挑战的新兴解决方案。值得注意的是,一些 AI 支持的机器人已经在协助进行海洋清洁工作了。
生成式 AI 还能够生成超现实、令人惊叹的原创且富有想象力的内容。营销、娱乐、艺术和教育等行业的内容将根据个人偏好和要求进行量身定制,有可能会重新定义创造性表达的概念。AI 的这些进步最终可能会应用于虚拟现实、游戏和沉浸式讲故事体验等领域,与现实几乎没有什么区别。
在短期内,随着先进的功能嵌入我们日常使用的工具,从电子邮件平台和电子表格软件到搜索引擎、文字处理器、电子商务市场和日历,我们都将最直接地感受到生成式 AI 的影响。工作流将变得更加高效,重复性任务将实现自动化。分析师预计,所有市场领域的生产力和效率都将大幅提升。
组织将使用根据自有数据训练的定制生成式 AI 解决方案来改善从运营、招聘和培训到供应链、物流、品牌和沟通等各个方面。开发人员将使用它在极短时间内编写出完美的代码。与之前出现的许多具有根本变革性的技术一样,生成式 AI 有可能会影响我们生活的方方面面。
深入了解 2024 年技术搜索趋势。观看此网络研讨会,了解 2024 年的最佳实践、新兴方法以及热门趋势对开发人员的影响。
使用 Elasticsearch 为生成式 AI 时代助力
随着越来越多的组织将生成式 AI 整合到内部和外部运营中,Elastic 设计了 Elasticsearch Relevance Engine™ (ESRE),旨在为开发人员提供所需的工具,以支持基于人工智能的搜索应用程序。ESRE 可以提高搜索相关性,大规模生成嵌入和搜索向量,同时还可让企业集成自己的转换器模型。
我们的相关性引擎专为构建 AI 支持的搜索应用程序的开发人员量身定制,其功能包括支持通过 API 集成第三方转换器模型,例如生成式 AI、ChatGPT-3 和 ChatGPT-4 等。Elastic 在专有数据和生成式 AI 之间架起了一座桥梁,组织可以通过上下文窗口为生成式 AI 提供量身定制的、特定于业务的上下文。Elasticsearch 和 ChatGPT 之间的这种协同作用可确保用户收到符合事实、与上下文相关的最新查询答案。
Elasticsearch 的检索能力和 ChatGPT 的自然语言理解能力的结合,提供了无与伦比的用户体验,为信息检索和 AI 支持的辅助功能设立了新标准。ChatGPT 在改进检测、回复和理解方面巨大的潜在应用,甚至对未来的安全领域也有影响。
要详细了解如何使用 Elastic 和生成式 AI 提升搜索体验,请注册以观看免费演示。
浏览更多生成式 AI 资源
- 选择 LLM:2024 年开源 LLM 入门指南
- AI 搜索算法的解释
- 什么是大型语言模型?
- 生成式 AI 在高等教育 IT 中的作用
- 使用生成式 AI 革新澳大利亚政府服务
- AI 变革的高级搜索
- ChatGPT 和 Elasticsearch:OpenAI 遇见私有数据
- Microsoft Build 中的 Elastic
您接下来应该怎么做
当您准备好后,我们可以通过下面四种方法帮助您从业务数据中获取见解:
- 开始免费试用,并了解 Elastic 可以为贵公司提供什么帮助。
- 浏览我们的解决方案,了解 Elasticsearch 平台的运作方式,以及我们的解决方案如何满足您的需求。
- 了解如何在企业中提供生成式 AI。
- 与您认识且喜欢阅读此类内容的人分享本篇文章。通过电子邮件、LinkedIn、Twitter 或 Facebook 将本篇文章分享给他们。
生成式 AI 常见问题解答
ChatGPT 是否使用 Elasticsearch?
Elasticsearch 可安全地为 ChatGPT 提供对数据的访问,以生成更相关的回复。
生成式 AI 有哪些示例?
生成式 AI 的示例包括 ChatGPT、DALL-E、Google Gemini、Midjourney、Adobe Firefly 和 Stable Diffusion。
人工智能和机器学习之间有什么区别?
人工智能 (AI) 指的是一个广泛的领域,旨在开发能够执行模拟人类智能任务的系统,而机器学习 (ML) 是 AI 的一个分支,涉及使用复杂的算法和技术,使系统能够在没有明确指令的情况下从数据中学习、识别模式并提高性能。
生成式 AI 术语表
生成式对抗网络 (GAN):GAN 是一种神经网络架构,由生成器和鉴别器组成,它们协同工作以生成逼真且高质量的内容。
Autoencoder(自动编码器):自动编码器是一种学习编码和解码数据的神经网络架构,通常用于数据压缩和生成等任务。
Recurrent neural networks (RNNs)(循环神经网络 (RNN)):RNN 是专门用于处理序列数据的神经网络。它们有一个记忆组件,可以保留以前步骤的信息,因此适合执行文本生成等任务。
大型语言模型 (LLM):包括 ChatGPT 在内的大型语言模型都是基于大量文本数据训练出来的强大生成式 AI 模型。它们可以根据给定的提示生成类似于人的文本。
Machine learning(机器学习):机器学习是 AI 的一个分支,通过使用各种算法、模型和技术,让系统无需遵循明确指令就能够从数据中自动学习并改进。
Natural language processing(自然语言处理):自然语言处理是 AI 和计算机科学的一个子领域,涉及计算机与人类语言之间的交互。它适用于文本生成、情感分析和语言翻译等任务。
Neural networks(神经网络):神经网络是受人类大脑结构和功能启发的算法。它们由互联节点或神经元组成,用于处理和传输信息。
Semantic search(语义搜索):语义搜索是一种以理解搜索查询的含义和搜索内容为中心的搜索技术。它旨在提供更多与上下文相关的搜索结果。
Vector search(向量搜索):向量搜索是一种将数据点表示为高维空间中的向量的技术。它通过计算向量之间的距离来实现高效的相似度搜索和推荐系统。
脚注
1“Artificial Intelligence-Based Data-Driven Strategy to Accelerate Research, Development, and Clinical Trials of COVID Vaccine”(基于人工智能的数据驱动战略,加速新冠病毒疫苗的研发和临床试验),Biomed Res Int.2022 年;作者:Ashwani Sharma、Tarun Virmani、Vipluv Pathak、Anjali Sharma、Kamla Pathak、Girish Kumar 和 Devender Pathak;2022 年 7 月 6 日在线发表;上次访问时间:2023 年 6 月 27 日