Skip to content

生成式 AI 入门指南

Published: at 03:22 PM

如果你是一名渴望开始构建生成式 AI 应用程序的工程师,当前与生成式 AI 相关的信息过载和炒作周期可能会让许多人感到不知所措。

这是我用来入门并享受构建生成式 AI 应用程序的一组主题列表。

大语言模型与小语言模型

大多数我接触过的人认为生成式 AI = LLMs,并且需要深入理解 LLMs 及其工作原理,以及如何进行训练和微调 LLMs 等。事实是,LLMs 只是任何生成式 AI 应用程序组件的众多组成部分之一(尽管是重要的一个)。事情已经发展到 LLMs 几乎成为商品的程度,其中许多作为 SaaS/PaaS 以 API 形式提供,使得人们可以在 LLM 上简单地构建 React 前端应用。OpenAI APIs 是经典示例。

要玩转一堆自托管和本地 LLMs,请安装 Ollama 或 LM Studio 等工具,你可以轻松下载从 Llama2 到 Mistral 到 Huggingface 的大多数模型并试用它们。Ollama 提供基于 CLI 的端点,你可以与之对话,而 LM Studio 提供便捷的聊天 UI 界面,你可以在其中测试不同的 LLMs。

前端 UI

如果你是前端工程师或要构建与 LLMs 对话的前端应用,我强烈推荐 Vercel AI SDK 和 Vercel AI 模板,它们允许你在几分钟内克隆和部署一个生成式 AI 应用。

提示工程

是的,我知道提示工程是一匹被 beaten 的马,相比于大约 6 个月前,现在人们不太谈论它,但我无法足够强调提示工程的重要性及其对生成式 AI 应用程序输出质量的影响。请记住,使用生成式 AI 你是在构建概率性应用程序,应用对用户输入响应良好的概率 heavily 依赖于通过提示模板和提示传递给 LLM 的上下文。所有这些都属于提示工程的范畴。

Langchain

你遇到超过 95% 的生成式 AI 应用教程都以某种形式使用 LangChain,我强烈建议投入大量时间理解 LangChain,你可以选择 Python 版本或 JavaScript 版本的 LangChain。使用 LangChain 时,请确保理解关于 chains、tools、agents 等的概念。

代理框架

当你进入构建应用的高级阶段时,你会遇到代理和多代理对话的概念,这时你可以开始查看以下工具。以下是我使用效果良好的一些代理框架的小集合:

Semantic Kernel

Autogen

Taskweaver

CrewAI

学习生成式 AI 时的常见构建应用

互联网上和 YouTube 上不乏生成式 AI 教程,其中大多数对入门非常好。然而,如果信息过载让人不知所措,那么这里有一些可以尝试的应用。

基于文档的 RAG 聊天

最流行构建的应用之一是回答关于文档(通常是 PDF)或文档集合问题的聊天机器人。这被称为 RAG 应用程序,其中 RAG 代表检索增强生成。在这里,你学习关于如何从不结构化文档创建块和嵌入并将它们存储在向量数据库中的关键概念。然后,你学习查询向量数据库以检索与问题最匹配的块并通过 LLM 处理以获得自然语言输出。这是理解检索系统与生成式 AI 集成的绝佳方式。

构建自定义 GPT

OpenAI 最近推出了创建“finetuned”或“trained”以回答特定主题集合问题的自定义 GPT 的能力。这是构建无代码生成式 AI 应用的很好起点。通过自定义 GPT,你可以在利基主题领域或风格上专业化模型,使其成为创建独特应用或通过定制对话代理增强现有服务的理想选择。该过程涉及选择相关训练数据并迭代优化模型的响应,提供模型训练和微调的实践体验。

生成艺术图像

另一个令人兴奋的项目是构建一个基于文本描述使用生成式 AI 模型生成艺术图像的应用程序。这涉及理解和利用 DALL-E 或类似技术。这样的项目不仅有趣,而且在理解 AI 如何解释和可视化创意提示方面具有教育意义。这是探索 AI 与创造力交叉点的好方法。

自动化内容创建

一个实用且越来越受欢迎的生成式 AI 应用是自动化内容创建。这可能从生成博客文章、创建营销文案,甚至起草代码。此类应用提供关于 AI 如何协助重复性或创造性任务的洞察,提高生产力并激发新想法。

个性化推荐系统

最后,使用生成式 AI 构建个性化推荐系统可能既具有挑战性又有回报。此类系统可能基于用户行为和偏好推荐产品、内容甚至行动。它涵盖关于用户画像、行为分析和在预测决策中应用 AI 的学习。

总之,从这些项目开始可以提供全面且引人入胜的方式进入生成式 AI 世界,既提供基础学习又提供实践体验。


Previous Post
从SEO到搜索AI优化
Next Post
深入循环神经网络