AI多模态「六边形战士」,原创音乐、1分钟百页PPT、抖音爆款……

2024年AI行业最大的看点是什么? 那一定是多模态AI应用。

大模型发展到今天这个阶段,文本处理已经是各家大模型的必备技能了,对音频、视觉等多模态的理解和应用才是下一个阶段大模型比拼的赛道。

3.5研究测试:
hujiaoai.cn
4研究测试:
askmanyai.cn
Claude-3研究测试:
hiclaude3.com

最近,在AIGC的toB市场,大模型的价格战愈演愈烈。看似这场硬仗才刚刚开始,但胜负尚未可知。然而对于C端,产品实用性和需求能否满足才是市场检验AI产品的真正试金石。

Quset Mobile发布的最新2024生成式AI及AIGC应用洞察报告中,小编发现天工AI已经冲到AIGC APP月活跃用户规模统计的第三名!在短短的半年多的时间,月活用户已近千万,一定程度上证明了天工AI 在大模型满足用户需求上做的还是比较到位的。

那在GPT大杀四方的时候,天工AI为什么能吸引这么多用户的青睐呢?在我们的AI交流社群里,正好有位有小伙伴想找到一个对于新媒体运营友好的AI工具。

虽然国内具备多模态能力的大模型产品有不少,但是天工AI是一个以AI搜索为主的多模态全能AI助手,能搞定图文研报生成、PPT生成、音乐生成、漫画视频生成等非常复杂的跨模态任务。

借着这个机会,小编带着大家体验一下天工AI的能力。

先放一个天工AI体验渠道:

电脑端:www.tiangong.cn
手机端:手机应用商店搜索App“天工”,下载安装使用
小程序:搜索【天工AI智能助手】,直接使用

比如,怎么做抖音美妆运营,我们将这个问题直接转抛给天工AI,看看它是怎么一步步解决问题的。

第一步:多模态搜索,1分钟获取背景资料

以做美妆赛道新媒体运营为例,在天工AI官网上,输入“抖音运营美妆类目的最佳打开方式,给我一个完善的研究报告”,选择【增强模式】,开始「搜索」,天工AI几秒中内就能生成详细的研究报告给到我们,足够我们做背景的研究和学习。

此外,如果你仔细观察会发现这份研报并非单纯的文字描述,是图文并茂的,比如我们拆出来看“哪些彩妆品牌适合新手入门”这个章节,它对每一个美妆品牌和产品都给出了正确的参考图片,信息一目了然,可读性非常高。

输出的结果中不只有图文,还有对比表格,比如:当我们想了解香奈儿5号和邂逅香水时,天工AI能直接输出左右对比的表格,视觉体验非常友好。

这个画面大家是不是有点眼熟?没错,这样的表现和谷歌刚刚发布的Gemini demo中的示例如出一辙!

对于C端市场来说,产品的用户体验是非常重要的,而影响用户感知的,是使用过程中的各个细节,比如和Gemini高度相似的图文交织搜索体验,目前这样的体验效果国内只有天工AI做到了。

如果你觉得上述信息过多,还可以直接让它帮忙总结摘要,即刻触发天工AI的多步骤推理能力。巧了,还是和Gemini demo中的示例一模一样,不仅会主动问我需要总结哪方面的内容,同时也支持自定义个性化澄清:

这款辅助推理小卡片真的让人感动。它能主动澄清、询问、响应用户的提问需求,这种体验让我觉得,真正理解用户的搜索引擎出现了,你提问的对面不再是一个冷冰冰的搜索系统,而是可以有温度的私人助理。

第二步:AI写作+AI文档,5分钟搞定脚本创作

当我们尝试使用天工AI的【AI写作】和【AI文档】来快速制作脚本时,整个过程简直高效得令人惊喜!

首先,我们可以利用天工AI强大的文档分析理解能力,一键导入所需的产品信息。然后,它卓越的写作能力就会根据我们的要求,快速生成一个脚本:

我们可以看到,通过天工AI生成的脚本内容丰富、操作感强。只需简单几步操作,就能快速产出一个高质量、完成度极高的脚本,省去绞尽脑汁想创意的时间!而且,脚本的质量远超过了自己动手写的水平,对于运营入门小白非常友好!

同时小编还注意到一个细节,为什么推广5号香水还要提到邂逅香水呢?

有心了! 是非常懂得打广告的小天才!

而且从我们提问得到的答案中可以看出,天工AI经过了认真仔细的分析和处理,回答有理有据,一看就是认认真真“读过”资料没有胡说八道的样子!

我还测试了天工AI在没有文档解析时的创作能力,让它生成了一个名为《重生之我是马斯克,我在OpenAI做AGI》的视频脚本:

令人惊讶的是,这个脚本的完成度也非常高,无论是内容的连贯性还是细节的丰富程度,都达到了可以直接拍摄成为TikTok爆款的水平~

第三步:天工AI音乐,5分钟生成专属BGM

天工AI拥有的AI音乐是国内唯一可以免费体验AI音乐生成的产品,这得益于今年4月刚推出的SkyMusic大模型,这个模型是全球首款并达到SOTA效果的AI音乐生成模型。

只需要输入歌名,AI帮你填充歌词,再喂给它一首你想要的风格歌曲,比如《坤坤神曲》,立马生成一首旋律朗朗上口的歌。专辑封面、背景效果都给你一键生成。BGM也不愁了。

当我们需要一首命题的背景音乐来配合你的新媒体时,我们可以试试天工AI的音乐生成功能!

配乐的难题天工AI也完美解决!

第五步:用AI视频转绘,自己出镜当主角

还最近还有一个特别有趣的功能悄悄上线——「AI视频转绘」智能体。这个功能可以一键将视频转换成动漫风格或迪士尼风格。从生成的视频来看,效果持续稳定,视频播放流畅自然。

重点是,这个功能免费啊家人们!还不冲吗!

用天工AI,我们轻松一站式搞定了抖音运营的核心步骤,整个过程不到20分钟!成品的质量不仅超乎预期,而且还超好。最棒的是,有了AI的帮助,我们能更快、更便捷地创作出更棒的作品,甚至还能让视频动漫化、风格化,创造出需要但之前不存在的配乐。

这才是真正发挥了AI的力量~ 通过天工AI,我们不仅节省了花费时间,还提升了创作的自由度和质量,实现了以前难以做到的事情。

第六步:用AI ppt,3分钟生成PPT直接做分享

这时候,小编注意到网站侧边栏有一个叫“AI PPT”的按钮。

如果让它把上面几千字的报告做成一份PPT,我岂不是都可以直接去卖课了?!(虽然自己还没学会!但是已经会用它赚钱了【狗头表情】)

说干就干!我直接把报告内容粘贴进去,输入指令“帮我做一份抖音美妆博主运营的PPT”。首先,天工AI展示了PPT的文本概要,然后点击“生成PPT”,它立刻就帮我制作出了一份完整的PPT:

看看这效果,目录清晰、图文并茂,都不需要配图了,我愿称之为“PPT大师”!更棒的是,可以选择以PDF或PPTX格式下载,直接免费导出一份现成的PPT。

至此,仅用半小时就完成了从一个简单的需求“了解抖音美妆博主运营知识”到制作出一份详尽的研究报告,再到一份精美的PPT的全过程。如果没有天工AI,这些工作需要至少一周以上的时间。

通过整个过程可以切实的感受到天工AI强悍的多模态能力,无论是撰写研究报告、创作AI音乐、制作AI视频,还是图文生成,它都能轻松应对,它都能轻松拿捏~

通过这一系列体验,小编可以明确感觉到,支撑天工AI这样强大产品力的背后,一定有不容小觑的技术能力支撑!于是,我便顺势扒了一下天工AI背后的大模型——天工3.0。

超级应用背后的「天工3.0」

「天工3.0」是上个月昆仑万维刚发布并开源不久的最新基座大模型,基于自研技术,采用了和GPT-4相同的MoE架构,参数高达4千亿,是全球模型参数最大、性能最强的MoE模型之一。更重要的是,天工3.0是一款功能强大的多模态大模型,不仅擅长基础的文本处理,还在多模态处理如AI图片生成、AI音乐制作、AI动漫创作等方面表现出色。目前来看,国内还没有其他任何一款面向C端市场能将这么多模型功能集成在一起。

无论你想做点什么事,在天工AI 都能找到帮的上你的工具~ 总之,由于篇幅所限,小编在天工AI上发现的很多好玩的应用都没来得及分享,包括音乐生成、表格生成、以及各种智能体等,感兴趣的小伙伴点击直接上手体验下吧~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/840756.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Golang单元测试

文章目录 传统测试方法基本介绍主要缺点 单元测试基本介绍测试函数基准测试示例函数 传统测试方法 基本介绍 基本介绍 代码测试是软件开发中的一项重要实践,用于验证代码的正确性、可靠性和预期行为。通过代码测试,开发者可以发现和修复潜在的错误、确保…

Python实现数据可视化效果图总结

一、JSON格式 JSON是一种轻量级的数据交互格式。可以按照JSON指定的格式去组织和封装数据。 JSON本质上是一个带有特定格式的字符串 Json格式 JSON数据格式在Python中可以是字典、又可以是列表中嵌套着字典的格式。 Pyhton数据和Json数据相互转化 二、pyecharts模块 如果想…

Shell脚本语言学习1

shell解析器:指定脚本使用的shell解释器 #!/bin/bash 执行脚本:bash ./hello.sh 或者 sh ./hello.sh 必须加./ 给文件赋权:chown x hello.sh 就可以./hello.sh 扩展方案:source hello.sh 也可以执行。 . hello.sh也可以 子bash和当…

[BT]小迪安全2023学习笔记(第30天:Web攻防-SQL带外注入)

第30天 堆叠注入 支持数据库:MySQL、MsSQL、PostgreSQL 数据库后台能够执行堆叠操作,但不一定在注入点就能够实现堆叠操作,因为这和网站处理方式有关 二次注入 注入过程:比如在用户注册或者修改用户信息时可以在某一个存在注入…

二叉排序树的创建

二叉排序树就是节点经过排序构建起的二叉树,其有以下性质: 1. 若它的左子树不为空,则左子树上所有节点的值均小于它的根节点的值。 2. 若它的右子树不为空,则右子树上所有节点的值均大于它的根节点的值。 3. 它的左、右子树也分…

Springboot零星知识点1

1、请求路径的组成 2、多个环境配置文件 3、对 自定义的属性 增加文字描述,而且IDEA不会警告 4、读取属性值的两种方式 5、东东

【linux】docker下nextcloud安装人脸识别插件

一、插件源码地址: GitCode - 开发者的代码家园 二、插件官网地址: Releases - Face Recognition - Apps - App Store - Nextcloud 三、插件安装教程: 1、查看本地nextcloud版本号 http://ipAddress:8080/settings/admin/overview 2、找…

【博客714】golang使用mmap来优化gc

golang使用mmap来优化gc: 背景 需要处理的对象非常多时,比如:时序数据库victoriametrics源码中,利用了mmap申请内存并自己维护,从而避免过多gc影响性能,因为频繁申请和释放堆对象会降低性能 参考victoriam…

PaddleClas 指定gpu

在使用PaddleClas进行模型训练或预测时,如果您想要指定使用特定的GPU设备,可以通过CUDA_VISIBLE_DEVICES环境变量来设置。 在命令行中设置GPU的方法如下: # 指定第0号GPU export CUDA_VISIBLE_DEVICES0 # 之后运行PaddleClas的命令&#xf…

深入解析:如何高效地更新Python字典

新书上架~👇全国包邮奥~ python实用小工具开发教程http://pythontoolsteach.com/3 欢迎关注我👆,收藏下次不迷路┗|`O′|┛ 嗷~~ 目录 一、引言 二、修改字典中的值 三、向字典中添加键值对 四、更新字典的两种方法总结 五、…

Java进阶学习笔记16——接口的综合案例

接口的综合案例: 接口的应用案例:班级学生信息管理模块的开发 需求: 请设计一个班级学生的信息管理模块:学生的数据有:姓名、性别、成绩。 功能1: 要求打印出全班学生的信息;功能2&#xff…

天线增益越高不一定越好

在以下应用场景下,过高的天线增益会导致性能下降:   城市环境或建筑物周围:高增益天线容易受到其他信号的干扰,在城市环境下或者在某些建筑物周围使用时,可能会被其他无线网络和其他电磁设备的信号干扰,…

浏览器的一些功能

1.改主页面 点浏览器右上角的三个点也就是一个... 点了设置 你可以在这里改它的颜色 还有页面 一些有意思的网站: sandspiel像素风格游戏 趣味互动游戏:请画一个小人 (webhek.com)​​​​​​ 2018 - makemepulse解压游戏 Layered Water (vlucendo.com)水模…

【C++项目】实时聊天的在线匹配五子棋对战游戏

目录 项目介绍 开发环境 核心技术 项目前置知识点介绍 Websocketpp 1. WebSocket基本认识 2. WebSocket协议切换原理解析 3. WebSocket报文格式 4. Websocketpp介绍 5. 搭建一个简单WebSocket服务器 JsonCpp 1. Json格式的基本认识 2. JsonCpp介绍 3. 序列化与反序…

[js] 中文编码解码encodeURI,decodeURI

encodeURI (URIstring)// 编码decodeURI (URIstring)  // 解码参考: JS 中的编码和解码(encode和decode)

CSS3盒模型与布局

盒模型与布局 居中对齐 文本居中对齐 水平居中 使用 text-align: center; 属性在块级元素内使内联元素(如文本、图片等)水平居中。 .parent {text-align: center; }垂直居中 使用 line-height 设置为与容器高度相同的值,实现单行文本的垂直居中。 .parent {height: 100…

基于地理坐标的高阶几何编辑工具算法(3)——相离面吸附

文章目录 工具步骤应用场景算法输入算法输出算法示意图算法原理 工具步骤 点击面,点击“相离面吸附”工具,绘制一个面,双击结束后,与所有相交的面进行吸附 应用场景 为了让相离的两个几何面在空间上相邻,使用该工具…

ROS+UBUNTU开发常用指令

ROS部分 一、功能包编译 1.1、单独编译指定的功能包 catkin_make -DCATKIN_WHITELIST_PACKAGES"需要单独编译的包名"1.2、再次回到编译所有功能包 catkin_make -DCATKIN_WHITELIST_PACKAGES""ubuntu部分 一、清空 Bash 历史记录文件: ~/.b…

数据插值之朗格朗日插值(一)

目录 一、引言 二、代码实现 2.1 Lagrange插值求插值多项式: 代码解析: 1.vpa解释 2.ploy(x)解释: 3.conv()解释 4.poly2sym()解释 2.2 Lagrange插值求新样本值和误差估计: 代码解析&…

【编译原理】LL(1)预测分析法

一、实验目的 LL(1)的含义:第一个L表明自顶向下分析是从左向右扫描输入串,第2个L表明分析过程中将使用最左推导,1表明只需向右看一个符号便可决定如何推导,即选择哪个产生式进行推导。 LL(1) 预测分析方法是确定的自顶向下的语…