chatgpt图片识别、生成图片、语音对话多模态深度试玩

  1. 大模型替代人的工作的能力,越来越明显了。最近chatgpt支持多模态了,看这大佬们玩的不易乐乎,手痒也想试一试,因此有给openai上供了20刀。
  1. 另外我是gpt的拥护者,但是周围的同事有对此担忧,因为他们长期积累的技能可能一下子没了门槛。
  2. 在工作中我已经充分使用了这些工具,此时我仿佛拥有了一个小团队,我提出思路和方案,苦活累活、无意义的重复劳动交给gpt。这样我可以有更多的学习最新的研究、更重要的技能。

1 图生图

1.1 操作方式

打开new bing,切换创意模式,上传图片,输入提示词“根据图片内容生成图画”,如果你想告诉他用什么风格,可以在提示词追加,用中国风或者皮克斯风格。
image.png

1.2 观看效果

我把娃娃的手绘上传到new bing(接入的是dalle-3模型),让它根据图片内容生成图片,下面看效果。
第一张美人鱼
b99843d77aa74ad627b8f32630d2bc9.jpgimage.png
第二张海底世界(美人鱼、章鱼、鱼)
ad15e8a93fc86f9ad62bef6edb174d3.jpgimage.png
第三张长城
由于我图片倒置了,生成了很有创意的机械龙
a65882b46c55738265043db41b26ee2.jpgimage.png
第四张画的葫芦,求子和平安
识别成鱼了,有点意外。
fe49e53d3501c8b68311db0a5918c3a.jpgimage.png

2 提示词生图

我们采用chatgpt4 DALLE-3

2.1 操作方式

前提是需要chatgpt4账号,选择dall-e3,然后输入提示词。
image.png

2.1 讲述一个程序员遇到bug,熬夜加班修bug的故事

输入标题中的提示词
image.png

2.2 根据古诗生成图片

image.png

2.3 设计软件图标

图标在我们UI设计中很常见,话不多说,贴图
image.png

2.4 设计logo和衬衫

这个难度有点大,我始终没提示好
image.pngimage.png

3 识别图片并提问

3.1 操作方式

苹果手机安装了chatgpt客户端,打开客户端拍照上传,并提问。

3.2 识别地图地图并提问超哪个方向

eecff5381414e353ca7eb38e94c2759.jpg

3.3 分析图片公式

拍了一个泰勒展开式让它分析
4b5f209a96eee8778f72b6e3e60a900.jpg

4 语音对话

4.1 设置开启语音

在设置speech中选择语音风格
image.pngimage.png

4.2 体验

语音提问,语音回复,这里没法播放录音,贴出回复的内容。
image.pngimage.png

5 总结

上述的技能,总结一下叫“提示工程”(promote engineering),掌握这些很重要。所以下次在抱怨gpt不行之前,需要反问一下自己提出的问题是否清晰。
如果你想学习请按下面操作搜错资料

  • b站搜索“吴恩达 chatgpt 提示工程”
  • 去https://www.deeplearning.ai/ 吴恩达的在线网站学习课程。

题外话:这里不是卖课,吴恩达是AI界的顶级科学家,免费教学推广人工智能的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/109300.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Tengine 边缘AI计算框架移植RV1126(包括opencv的交叉编译)

目录 1.编译opencv 2.拷贝SDK源码到虚拟机 3. 拉取TIM-VX代码 4.拉取Tengine源码并配置 1.编译opencv 编译opencv是为了,在编译Tengine时指定OpenCVConfig.cmake,以便寻找特定的opencv动态库 01.从github拉取opencv源代码 git clone -b 4.5.5 https://github.co…

【AIFEM案例操作】水轮机转轮强度和模态分析

AIFEM是由天洑自主研发的一款通用的智能结构仿真软件,助力用户解决固体结构相关的静力学、动力学、振动、热力学等实际工程问题,软件提供高效的前后处理工具和高精度的有限元求解器,帮助用户快速、深入地评估结构的力学性能,加速产…

DICOM图像像素值、灰度值与CT值的解释及关系

​DICOM图像像素值、灰度值与CT值之间的关系可以通过以下方式进行解释: DICOM图像像素值:在DICOM图像中,像素值是用来表示图像信息的基本单位。这些值通常在0-4096的范围内,反映了图像的像素亮度。 DICOM图像灰度值:灰…

H264短期参考帧和长期参考帧

问题引出 最近在做短期参考帧的marking操作时发现一个问题,我的预期是用两个短期参考帧,其中一个短期参考帧为当前帧的前一帧,另一个为距离当前位置较远的一个帧。 在大多数的帧都没有问题,但是在个别帧的位置会发生参考帧列表中帧的顺序和预期不一致的情况,我在第28帧的…

SLAM算法中状态估计的算法有哪些?

状态估计 在SLAM(Simultaneous Localization and Mapping)中,状态估计是核心组件之一,其主要目的是估计机器人的轨迹(或姿态)和地图特征的位置。针对不同的传感器、场景和应用,已经发展出了多种状态估计方法。以下是一些主要的状态估计方法: 扩展卡尔曼滤波(Extended…

多测师肖sir_高级金牌讲师___python之json模块

python之json模块 python标准模块之json 定义:json (java script object notation)是轻量级的文本数据交换格式 案例json: json和字典 一样 一、json模块可以实现json数据的序列化和反序列化 (1)序列化…

Linux常用命令——comm命令

在线Linux命令查询工具 comm 两个文件之间的比较 补充说明 comm命令可以用于两个文件之间的比较,它有一些选项可以用来调整输出,以便执行交集、求差、以及差集操作。 交集:打印出两个文件所共有的行。求差:打印出指定文件所包…

django无法导入第三方库

引子 有的人可能会很困惑,为什么自己在pip中安装了某个包,但是在django中死活无法导入。 在cmd中能够导入。 启动django,总是无法导入。 本文将会用一分钟解决你的困惑。 正文 那么本文以上述的第三方库dj_db_conn_pool为例,…

WuThreat身份安全云-TVD每日漏洞情报-2023-10-16

漏洞名称:Apache HTTP/2 安全漏洞 漏洞级别:高危 漏洞编号:CVE-2023-44487,CNVD-2023-75597,CNNVD-202310-667 相关涉及:Google Cloud Platform 漏洞状态:POC 参考链接:https://tvd.wuthreat.com/#/listDetail?TVD_IDTVD-2023-25208 漏洞名称:Adobe Commerce and Magento Ope…

汽车智能制造中的RFID技术在供应链生产管理中的应用

行业背景 汽车零部件工业是汽车工业中至关重要的一部分,对于汽车工业的长期稳定发展起着基础性的作用,近年来,汽车配件配套市场规模达到了2000亿元,维修市场达到了600亿元,随着汽车国产化的推进,汽车零部件…

k8s 暴露pod

kubenretes中暴露Pod及Service的6种方式 ,分别为port_forward、hostNetwork、hostPort、nodePort、loadBalancer、Ingress。 下面讲下nodeport nodePort Kubernetes中的service默认情况下都是使用的ClusterIP这种类型,这样的service会产生一个Cluster…

Webpack5 htmlwebpackplugin用法

文章目录 HtmlWebpackPlugin介绍HtmlWebpackPlugin用法1. 安装HtmlWebpackPlugin插件:2. 引入HtmlWebpackPlugin插件:3. 配置HtmlWebpackPlugin:4. 更多HtmlWebpackPlugin配置选项: 总结 HtmlWebpackPlugin介绍 Webpack是一个功能…

Linux命令及命令来源

Linux是一个强大的操作系统,拥有许多内建的命令。以下是常见的Linux命令及其简单的解释和用法: ls:列出目录内容。 来源:list。用法:ls、ls -l、ls -a cd:改变当前目录。 来源:change director…

AMEYA360-罗姆ROHM马来西亚工厂新厂房竣工

全球知名半导体制造商罗姆为了加强模拟IC的产能,在其马来西亚制造子公司ROHM-Wako Electronics (Malaysia) Sdn. Bhd.(以下简称“RWEM”)投建了新厂房,近日新厂房已经竣工,并举行了竣工仪式。 RWEM此前主要生产二极管和LED等小信号产品&#…

Linux网络编程系列之UDP广播

Linux网络编程系列 (够吃,管饱) 1、Linux网络编程系列之网络编程基础 2、Linux网络编程系列之TCP协议编程 3、Linux网络编程系列之UDP协议编程 4、Linux网络编程系列之UDP广播 5、Linux网络编程系列之UDP组播 6、Linux网络编程系列之服务器编…

Django ORM查询

Django提供了一套非常方便的类似SqlAlchemy ORM的通过对象调用的方式操作数据库表的ORM框架。 Django ORM操作主要分为以下几类: 增:向表内插入一条数据删:删除表内数据(物理删除)改:update操作更新某条数…

数字化 | 智能电子日历

想要一款随时随地都能掌握日期的电子日历吗? WiFi通信,实时更新,超低功耗,可充电,超长续航,电子纸,黑白红三色显示的电子日历,就是你的最佳选择! 无论是在办公室、家中或…

QCC51XX-QCC30XX系列开发教程(实战篇) 之 12.4-空间音频手机侧和耳机侧接口设计时序图

查看全部教程开发请点击:全网最全-QCC51xx-QCC30xx(TWS)系列从入门到精通开发教程汇总(持续更新中) ==================================================================== 版权归作者所有,未经允许,请勿转载。 ==========================================

自建应用-企业微信-侧边栏开发配置

企业微信侧边栏开发配置 配置侧边栏配置后效果图js-sdk 配置侧边栏 配置后效果图 js-sdk https://developer.work.weixin.qq.com/document/path/91789

“系统重要性银行”光环下,南京银行的重重忧思

撰稿|行星 来源|贝多财经 南京银行喜忧参半,提名系统重要性银行,还面临信誉老题、业绩新题难解的问题。 近期,中国人民银行、国家金融监督管理总局开展了2023年度我国系统重要性银行评估,认定20家国内系统重要性银行&#xff0…