AIGC高频产品面试题(二)

什么叫大模型,人工智能大模型是什么?

  • 之前,人工智能大多针对特定的场景应用进行训练,生成的模型难以迁移到其他场景,属于“小模型”的范畴。整个训练过程中,不仅手工调参工作量大,还需要给机器“投喂”海量的标注数据,这拉低了人工智能的研发效率,且成本较高。
  • 大模型通常是在无标注的大数据集上,采用自监督学习的方法进行训练的。之后,在其他场景的应用中,开发者只需要对模型进行微调,或采用少量数据进行二次训练,就可以满足新应用场景的需要。
  • 特别是OpenAI GPT 3大模型,它在翻译、问答、内容生成等领域的不俗表现,让业界看到了实现通用人工智能的希望。当前ChatGPT是基于GPT-3.5的,在GPT-3的基础之上进行了调优,能力进一步增强。

GPT对AIGC的重要性,它能做什么?

以ChatGPT为首的AIGC大潮的出现,则使得人工智能具备了大众化的基础,应该说,ChatGPT是人工智能大众化的里程碑。
最常用:文本生成、语言翻译、编程辅助
在这里插入图片描述

分析一下ChatGPT可能带来的效率提升

据OpenAI的官方网站,GPT-3.5中gpt-3.5-turbo模型的使用费用是每1000 tokens 0.002美元(token是用于自然语言处理的词的片段。对于英文文本,1个token大约是4个字符或0.75个单词),GPT-4的使用费用为每1000个prompt token(用于文本生成的特定文本片段或单词)0.03美元或每1000个completion token(语言模型基于prompt token生成的完整文本)0.06美元。1000个token大约相当于750个英文单词,CSDN上大批作者测算所得的相关数据如表:
在这里插入图片描述

假设英文译为中文,英文单词数与中文字数之比为1∶1.6,在使用GPT-4的情况下,若输出1500个汉字,收0.06美元,约人民币0.432元,也就是约每千字0.36元。因此1万个汉字提示词的价格为人民币3.6元。以用GPT-4为一个流量很大的自媒体公众号写一篇万字长文为案例展开分析。如上所述,一个提示词工程师(戏称“提示词魔法师”)用GPT-4 completion token输出一万个汉字,可以近似按照3.6元计算。如果在国内请一个经验丰富、熟稔爆红网文的写手,写一篇约一万字的高质量长文,可能要花费至少要一周时间,付出5000元,且对方还可能情有不甘。一个提示词魔法师微调GPT-4,输出万字长文,只需要1小时就能搞定。所以,两者的耗时比是40∶1。再计算价格。按照5000元/周来定时薪,一周的工作时长是40小时,平均每小时即125元,再加上调用token的费用,时薪大致是150元。那么两种工作方式的费用之比是5000∶150=100∶3。假定耗时与价格的乘积与效率成反比,那么GPT-4的效率和人的效率比为4000∶3,前者大约是后者的1333倍,我们称这个值为“AI/人”。
当然,这是理想情况,把很多因素给简化了,但是ChatGPT确实带来了惊人的效率提升。

ChatGPT的外貌和内涵是什么?

  1. 从物理上看,ChatGPT是一种基于深度学习算法的计算机程序,它由数以亿计的神经元和参数组成,运行在计算机的中央处理器或图形处理器上。它的输入是一个文本序列,输出则是根据该序列预测的单词或字符,它可以通过这种方式不断生成新的文本。
  2. 从代码上看,ChatGPT是一个Python程序,它使用了TensorFlow、PyTorch等深度学习框架,实现了基于Transformer架构的神经网络模型。
  3. ChatGPT基于使用GPT的聊天机器人框架,以Python来实现。要搭建ChatGPT,首先需要安装OpenAI的Transformers库和GPT-3 API的Python客户端。其次,需要创建一个GPT-3模型实例,然后调用它的generate方法来生成文本。
  4. ChatGPT的主要代码实现包括预处理输入数据、定义模型架构、训练模型,以及使用模型进行推理和生成文本等功能。ChatGPT的代码实现非常复杂,包括大量的数学运算和机器学习算法,需要有一定的编程和机器学习经验才能理解和修改它的代码。

跨模态与多模态分别是什么?

跨模态生成(cross-modal generation)和多模态生成(multimodal generation)不同,虽然都涉及处理多种类型的数据(如文本、图像、音频、视频等),但它们的含义和应用场景有所不同。

  1. 跨模态生成:通常指的是从一种模态的数据生成另一种模态的数据。例如,给定一段文本描述,生成对应的图像;或者给定一张图像,生成描述这张图像的文本。这种生成过程涉及从一种模态转换到另一种模态,因此被称为“跨模态生成”。
  2. 多模态生成:利用多种模态的数据共同生成新的内容。例如,给定一段音频和对应的文本,生成一个同步的动画。在这种情况下,生成过程需要同时考虑多种模态的数据,因此被称为“多模态生成”。
  3. 文本和音频生成音乐:给定一段歌词和一段旋律,生成一首歌曲。
  4. 文本和音频生成视频:给定一段文本和配套的音频,生成一个视频。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/875066.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

道可云元宇宙每日资讯|国家数据局:积极探索区块链创新应用

道可云元宇宙每日简报(2024年7月22日)讯,今日元宇宙新鲜事有: 国家数据局:积极探索区块链创新应用 7月19日,国家数据局副局长、党组成员夏冰在2024中国联通合作伙伴大会上表示,国家数据局将积…

[ECCV 2024] [复旦]RECE:扩散模型概念移除,只需3秒即可充分移除风险概念!

本文内容来自公众号粉丝投稿,作者来自复旦大学的视觉与学习实验室(FVL)。研究团队提出了一种可靠、高效的概念移除方法(RECE)。该方法以解析解的形式,迭代地进行风险概念移除、风险概念嵌入推导,从而确保模型彻底移除风…

【MySQL进阶之路 | 高级篇】优化数据库结构和大表优化

目录结构: 目录 目录结构: 1. 优化数据库结构 1.1 拆分表:冷热数据分离 1.2 增加冗余字段 1.3 优化数据类型 情况1:对整数类型数据进行优化 情况2:既可以使用文本类型也可以使用整数类型的字段,要选…

IPython中的LaTeX魔法:%%latex 指南

IPython中的LaTeX魔法:%%latex 指南 在数据科学和科学计算领域,IPython因其强大的交互式特性而广受欢迎。IPython提供了一个名为Jupyter Notebook的环境,它允许用户在网页浏览器中以网页应用的形式编写和运行代码。而LaTeX,作为一…

vue3【详解】组合式函数

什么是组合式函数? 利用 Vue 的组合式 API 来封装和复用有状态逻辑的函数,用于实现逻辑复用,类似 react18 中的 hook 函数名称 – 以 use 开头,采用驼峰命名,如 useTitle参数 – 建议使用 toValue() 处理(…

LeetCode热题100刷题17:124. 二叉树中的最大路径和、437. 路径总和 III、199. 二叉树的右视图

124. 二叉树中的最大路径和 /*** Definition for a binary tree node.* struct TreeNode {* int val;* TreeNode *left;* TreeNode *right;* TreeNode() : val(0), left(nullptr), right(nullptr) {}* TreeNode(int x) : val(x), left(nullptr), right(nul…

主页目录导航

Java核心 JVM专题一:深入分析Java工作机制 JVM专题二:Java如何进行编译的 JVM专题三:Java代码如何运行 JVM专题四:JVM的类加载机制 JVM专题五:类加载器与双亲委派机制 JVM专题六:JVM的内存模型 JVM专…

llama3.1数据集处理方法

一、预训练数据 截止到23年底。 1.网页数据清洗 1.个人身份信息和安全性过滤:设计过滤器,会删除根据多种Meta安全标准被评定为有害的域名,以及已知包含成人内容的域名。 2.文本提取和清洗:处理未截断的网页文档的原始HTML内容&…

Github 2024-07-17 开源项目日报 Top10

根据Github Trendings的统计,今日(2024-07-17统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量非开发语言项目3Python项目3Rust项目2TypeScript项目2MDX项目1项目化学习 创建周期:2538 天协议类型:MIT LicenseStar数量:161973 个Fork数量…

基于51单片机的指纹红外密码电子锁

基于51单片机的指纹红外密码电子锁 1、系统功能介绍2、演示视频3、系统框图4、系统电路介绍4.1、STC89C52单片机最小系统设计4.2、LCD12864显示屏电路设计4.3、矩阵键盘按键控制部分电路设计4.4、AS608指纹模块电路设计 5、程序设计5.1、LCD12864屏幕初始化5.2、AT24C02存储芯片…

打造直播工具详解:从零开始开发直播美颜SDK

今天,笔者将详细讲解如何从零开始开发一个直播美颜SDK,帮助开发者了解开发过程中的关键环节和技术要点。 一、需求分析与规划 在开发之前,首先需要明确美颜SDK的功能需求。一般来说,美颜SDK应包含以下几个核心: 基础…

【TAROT学习日记】韦特体系塔罗牌学习(7)——恋人 THE LOVERS VI

韦特体系塔罗牌学习(7)——恋人 THE LOVERS VI 目录 韦特体系塔罗牌学习(7)——恋人 THE LOVERS VI牌面分析1. 基础信息2. 图片元素 正位牌意1. 关键词/句2.爱情婚姻3. 学业事业4. 人际财富5. 其他象征意 逆位牌意1. 关键词/句2. …

uniapp在手机端预览文件

handlePdf(url) {uni.showLoading({title: 加载中,mask: true,})wx.downloadFile({url: url,success: function(res) {console.log(res)uni.hideLoading()var filePath res.tempFilePathuni.showLoading({title: 正在打开,mask: true,})wx.openDocument({filePath: filePath,f…

从零开始的CPP(23)动态规划解决最长回文串

leetcode5 给你一个字符串 s,找到 s 中最长的 回文串 示例 1: 输入:s "babad" 输出:"bab" 解释:"aba" 同样是符合题意的答案。 最开始我是将回文串都存入map。使用substr进行切割…

css快捷代码【超出一行文本显示省略号/超出三行显示省略号/超出n行...】

常见的css小tips:显示省略号,文本超出容器显示省略号…没啥好说的,直接拷贝代码吧 .containers {overflow:hidden;text-overflow:ellipsis;text-align:justify;word-break:break-all;display:-webkit-box;-webkit-box-orient:vertical;-webk…

MS17-010漏洞复现+利用

1、 漏洞简述 漏洞名称:“永恒之蓝”漏洞 漏洞编号:MS17-010,CVE-2017-0143/0144/0145/0146/0147/0148 漏洞类型:缓冲区溢出漏洞 漏洞影响:信息泄露 CVSS评分:9.3(High) 利用难…

食家巷擀面皮:一口惊艳的传统美味

在美食的世界里,总有一些经典让人难以忘怀,食家巷擀面皮便是其中之一。食家巷擀面皮,那一张张薄而有劲道的面皮,宛如艺术品般细腻。它的外观晶莹剔透,散发着诱人的光泽,让人看一眼就忍不住想要品尝。制作擀…

Vue使用FullCalendar实现日历/周历/月历

Vue使用FullCalendar实现日历/周历/月历 需求背景:项目上遇到新需求,要求实现工单以日/周/月历形式展示。而且要求不同工单根据状态显示不同颜色,一个工单内部,需要以不同颜色显示三个阶段。 效果图 日历 周历 月历 安装插件…

MySQL学习——影响选项文件处理的命令行选项

大多数支持选项文件的MySQL程序都处理以下选项。因为这些选项会影响选项文件处理,所以必须在命令行上给出,而不是在选项文件中给出。为了正常工作,这些选项中的每一个都必须在其他选项之前给出,但以下情况除外: 打印默…

力扣第二十五题——K个一组反转链表

内容介绍 给你链表的头节点 head ,每 k 个节点一组进行翻转,请你返回修改后的链表。 k 是一个正整数,它的值小于或等于链表的长度。如果节点总数不是 k 的整数倍,那么请将最后剩余的节点保持原有顺序。 你不能只是单纯的改变节点内…