对话天壤创始人薛贵荣:AIGC正在成为新的“水煤电”

AIGC正在悄无声息地成为各行各业的必需品。

 

@数科星球原创

作者丨苑晶

编辑丨大兔

 

国内的大模型混战半年有余,传统互联网巨头和人工智能公司纷纷入场。在“百模大战”的关键时刻,行业悄然发生分化。一些更具前瞻性的企业开始眺望远方,准备打一场“非对称”的商业竞争。

 

在已闭幕的2023世界人工智能大会中,上海天壤智能科技发布“天壤小白”大模型产品“三件套”,包含通用语言大模型、应用开发平台和语义搜索引擎。其中,天壤小白语言大模型参数规模达1860亿。

 

自2018年成立,天壤一直专注于通用人工智能的研究。目前,公司主要服务于企业服务、数字金融、生物科技、城市运行等数字化场景。在与数科星球(ID:digital-planet)深度交流时,天壤创始人兼CEO薛荣贵认为,AIGC技术已经成为新一代的“水电煤”,人工智能企业的大量涌现将重塑未来的商业格局。

 

01

 

生成式内容技术的潜力

 

在通向AGI时代的过程中,语言大模型正在扮演着极其重要的角色(虽然AIGC技术包括但不限于语言大模型,但后者的重要性却非常大)。逻辑上,语言大模型是撬动人与机器交互的前提,目前已在文本生成、机器翻译和对话系统中得到了充分应用。

 

可以想见,在图像生成、语音生成和3D引擎不断完善后,AIGC的应用领域和能力也会不断扩展和提升。

 

在众多大模型产品中,天壤小白的优势在于多轮对话和逻辑推理。

 

在大模型行业,多轮对话有助于理解当前对话的意图和意图背后的逻辑关系,从而生成更加准确的回答。这可以被看作是实现更加智能化的交互和服务的钥匙。在技术上,由于天壤小白可以建立起对语言的长期记忆和上下文感知,从而更好地应对人类的自然语言交流和表达需求。

 

在薛贵荣的理解中,大模型的逻辑推理正在改变行业规则。“以往,我们也曾尝试小模型,但在提示词的背景下,一个知识面不宽的模型所得到的结果也是不丰富的。”另外,小模型对多轮对话的支持也较为有限。

 

此外,天壤小白还结合了思维链技术,技术上,它可以通过将一个复杂的任务分解为多个子任务,并在不同的层级上并行处理这些子任务,从而提高整个任务的效率和准确性。

 

具体来说,当一个大型的深度学习模型需要完成一个复杂的任务时,它通常会被设计成由多个子模块组成,每个子模块都负责处理一个特定的子任务。这些子任务可以是图像分类、目标检测、语音识别等。

 

在推理过程中,这些子任务被独立地处理,每个子模块都使用不同的数据和参数进行分析。当所有任务处理完成后,它可以将这些子模块组合起来,形成一个完整的任务解决方案。

 

天壤内部的技术人员认为,这种思维链技术可以帮助拆解复杂的任务,并将其分解为多个可管理的子任务。这使得整个任务的训练过程更加高效,并且可以在多个子任务之间共享知识和经验,从而提高整个模型的性能和准确性。

 

“总之,大模型的理解力、推理能力和分析能力非常不一样。”他总结。而这,也是天壤持续推进大模型业务的原因所在。

 

02

 

AIGC在智能交通中的应用

 

众所周知,AlphaGo的出现是强化学习领域的一个重要里程碑,它的成功表明了强化学习在解决复杂问题方面的巨大潜力。其通过与自己不断对弈,逐步提升自己的水平,从而在复杂的围棋棋局中做出最优决策。这不仅在围领域引起轰动,更进一步打开了人工智能赋能各行各业的全新可能性。

 

正是受此启发,薛贵荣和天壤团队燃起对AI的信心,自研AI围棋TRgo,仅用AlphaGo 1% 的计算资源,成功击败了世界围棋冠军朴廷桓,成为国内率先探索强化学习的团队之一。

 

不仅在围棋领域有所斩获,2020年,天壤在交通行业取得重要进展。天壤推出了城市级交通拥堵治理系统TRTraffic,并助力南昌成为全国首个“交通不限行”城市。

 

然而,天壤在探索通用人工智能和训练大模型的路上,也面临着缺数据的难题,就像今天的中文版ChatGPT,高质量的中文语料数据十分稀缺。对此,天壤寻求创新,利用机器人对抗生成数据、优胜劣汰迭代优化模型,以及利用强化学习进行数据增强等。

 

这些方法使得模型效果大幅提升,也证明了强化学习在应对不同挑战方面的优越性能。

 

现在,随着AI技术的进一步突破,他更加看好AI在感知、认知和决策的进步。“我们可以用人工智能解决复杂场景下的应用。”薛贵荣对数科星球(ID:digital-planet)这样说。

 

天壤内部技术人员称:“人工智能可以帮助城市向不限行城市发展,在这之中深度学习、强化学习技术可以运用其中。”

 

03

 

各行业大模型的应用

 

除了在语言大模型方面取得突破,天壤还将领先的AIGC技术应用于生物制药领域,为该领域带来了巨大的潜力和机遇。

 

原理上,AIGC可以生成全新蛋白质,甚至,生成的蛋白质可以完全不同于自然界中的天然蛋白质。

 

在结果上,新的技术极大地缩短蛋白质研究的时间和成本,开辟了计算生物学研究的全新范式。在目前来看,已应用的技术可以避免传统的蛋白质设计方法中的繁琐和不确定性,同时也可以大大提高蛋白质的质量和稳定性。薛贵荣对数科星球(ID:digital-planet)称:“生物科技产业将进一步爆发,其中AIGC将会成为下一轮爆发的技术底座。”

 

2021年,该公司发布蛋白质结构预测模型TRFold2,基于CASP14测试集的预测精准度媲美AlphaFold2。2022年,该公司发布蛋白质设计模型TRDesign,实现按需设计蛋白质,具体项目中则包括:

 

发布蛋白质复合体结构预测模型TRComplex;

 

发布孤儿蛋白质结构预测模型TRFold-Single;

 

打造国内首个蛋白质设计工作台xCREATOR。

 

与其说,“判别式AI”是基于数据做出判断,那么生成式AI则因上下文思考能力,拓展了AI在决策之时的思考边界。

 

宏观上,AIGC所需要的算力、算法、中间件技术和数据会激发一轮新的投资热潮;行业中,各行各业结合AIGC将加速智能化的普及速度;微观上,拥抱智能化速度更快的企业能够获得新的市场竞争力。

 

04

 

开放平台背后的价值

 

大模型虽好,但不是任何企业都可以做。其中,一大原因是,打造用户-数据-能力三位一体的增长飞轮,极具挑战:

 

首先,多样化的用户需求和反馈可以帮助大模型不断优化和改进。大模型的迭代和改进需要不同用户的需求和反馈作为指导,用户可以通过使用大模型来发现其存在的问题和不足,并向模型开发者提供反馈和建议。这些反馈和建议可以帮助模型开发者更好地理解用户需求,并针对性地进行模型的改进和优化,从而提高模型的性能和准确率;

 

其次,数据是大模型迭代和智能涌现的基础。大模型需要大量的数据来进行训练和优化,只有拥有足够的数据,模型才能够不断地迭代和改进。同时,数据还可以帮助模型更好地学习和理解自然语言和知识,从而提高模型的智能水平和表现能力;

 

基于上述两点,可以看到,大模型能力的提升是一个由真实的用户反馈和高质量数据迭代构成的双轮效应。两者缺一不可,共同推动大模型的智能涌现和发展。

 

薛贵荣认为,ChatGPT3.5-4.0的迭代就是上述逻辑的典范。为了能更快赶上国外先进水平,天壤制定了开放平台的策略以应对挑战。

 

7月7日,天壤发布“天壤小白”开放平台。该平台内置其自研大语言模型,并将一整套工具和资源整合至平台内。据了解,该平台旨在帮助开发者轻松创建AI应用,更灵活地探索大模型,创造体验更好、超越期待的AI创新产品。

 

而针对目前大模型落地的关键瓶颈:大模型的“幻觉”,即一本正经地胡说八道、私有数据的安全、市场缺乏企业级的中文大模型,以及大模型自身的封闭性问题,天壤则推出“三件套”:即大语言模型、语义搜索引擎和开发平台。这三者构成了一个开发智能应用的全栈式支持体系,为开发者提供一站式的解决方案。

 

首先是通用语言大模型,通过1860亿参数的深度学习训练,具备类ChatGPT的能力,能够进行多语言的对话互动、知识问答、逻辑推理等核心功能。它能够理解复杂的上下文信息,并根据先前的对话内容做出精准回应。

 

其次,是语义搜索引擎,它进一步强化了大模型的生成能力。在生成文本前后,该引擎会检索相关事实信息,对输入和输出进行验证,以确保内容是正确、合理、完整和一致的,避免大模型产生“幻觉”,或者提供错误或无意义的回答。实际测试中,天壤小白的语义搜索模型召回率有着十分出色的表现。其中在与OpenAI的语义搜索引擎TOP1和TOP3的召回率(分别统计召回的TOP1、TOP3个结果中包含正确答案的概率)对比测试中,天壤小白的结果为77%和86%,均超过OpenAI 73%和85%的表现。

 

最后,是应用开发平台,其采用可视化的界面,所见即所得,用户在平台左侧栏目输入预置的提示词(prompt)后,当即就能在右侧栏目测试应用效果,确保应用效果符合预期。整个创建过程耗时不超过十分钟。

 

目前来看,该开放平台极大降低了用户使用门槛,即便没有编程基础也可以通过可视化的操作界面实现应用配置。据开放平台内部员工介绍,开发者可以根据不同场景和需求,选择不同参数和精度的多元模型服务、配置提示词参数和交互类型,以及利用文档集功能进行语义检索,从而助力用户创造超越期待的AI应用,使应用效果达到最佳状态。

 

用户也可以根据具体需求,选择调用其他大模型或企业私有模型等。

 

结尾:在深度对话中,数科星球(ID:digital-planet)听到多位企业家承认OpenAI具有一定程度的先发优势。

 

但在国内,随着数据沉淀和强化学习技术创新,大模型的迭代效应正在展现。

 

用薛贵荣的话来评价便是:“掌握更多的优质数据才能更加逼近人类智能。”现在,天壤的破局点是继续加大对大模型的投入以实现规模、深度、广度的全覆盖。

 

作为一家技术型企业,天壤已初步展现出其能挑战AlphaFold的潜力,并在AI围棋、智能交通、生物科技等领域有着前沿突破。

 

时间在中国企业一边,或许,在未来我们可以见证更多的优秀企业出现。而如今,我们正在一步步走向智能时代。

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/7901.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ajax/axios访问后端测试方法

文章目录 1、浏览器执行javascript方法GET请求POST请求 2、Postman测试工具GET请求POST请求 3、idea IDE提供的httpclient4、Apache JMeter 1、浏览器执行javascript方法 GET请求 http://localhost:6060/admin/get/123 POST请求 技巧:打开谷歌浏览器&#xff0c…

zookeeper学习(二) 集群模式安装

前置环境 三台centos7服务器 192.168.2.201 192.168.2.202 192.168.2.150三台服务器都需要安装jdk1.8以上zookeeper安装包 安装jdk 在单机模式已经描述过,这里略过,有需要可以去看单机模式中的这部分,注意的是三台服务器都需要安装 安装…

C数据结构与算法——队列 应用(C语言纯享版 迷宫)

实验任务 (1) 掌握顺序循环队列及其C语言的表示; (2) 掌握入队、出队等基本算法的实现; (3) 掌握顺序循环队列的基本应用(求解迷宫通路)。 实验内容 使用C语言实现顺序循环队列的类型定义与算法函数;编写main()函数…

算法与数据结构(三)--栈

一.栈的基本概念 栈是一种特殊的表,这种表只在表首进行插入和删除操作。 因此,表首对于栈来说具有特殊的意义,称为栈顶。相应的,表尾称为栈底。不含任何元素的栈称为空栈。 栈的修改遵循后进先出的原则,Last In First…

Java前后端交互long类型溢出的解决方案

问题描述: 前端根据id发起请求查找对象的时候一直返回找不到对象,然后查看了请求报文,发现前端传给后台的数据id不对,原本的id是1435421253099634623,可前端传过来的id是 1435421253099634700,后三位变成了…

Zabbix邮件报警(163网易邮箱)

目录 一、电脑登录网易邮箱配置 二、Server端安装配置邮件服务器 邮箱查看 三、编辑zabbix_server.conf 引用邮件脚本 查看邮件 五、配置zabbix web监控项邮件报警 操作思路 Server.zabbix.com web操作 确认报警媒介信息 配置zabbix中的用户所使用的报警媒介类型以及接收邮…

【网络】HTTPS协议

目录 一、概念 1、HTTPS 2、加密解密 3、加密的必要性 4、常见的加密方式 4.1、对称加密 4.2、非对称加密 5、数据摘要 && 数据指纹 6、数字签名 二、HTTPS的工作过程 1、只使用对称加密 2、只使用非对称加密 3、双方都使用非对称加密 4、非对称加密 对…

rust gtk 桌面应用 demo

《精通Rust》里介绍了 GTK框架的开发,这篇博客记录并扩展一下。rust 可以用于桌面应用开发,我还挺惊讶的,大学的时候也有学习过 VC,对桌面编程一直都很感兴趣,而且一直有一种妄念,总觉得自己能开发一款很好…

深入学习 Redis - 深挖经典数据类型之 set

目录 前言 一、Set 类型 1.1、操作命令 sadd / smembers(添加) sismember(判断存在) scard(获取元素个数) spop(删除元素) smove(移动) srem&#x…

CSAP_ORD_BOM_MAINTAIN 销售订单BOM

[TOC] 1 BAPI:CSAP_ORD_BOM_MAINTAIN 2 Detail 2.1 Deleted line STPO_API03-FLDELETE ‘X’ 2 .2 Modified Line 2.21 Please specify below lines . STPO_API03-ITEM_NODE STPO-STLKN. STPO_API03-ITEM_COUNT STOP-STPOZ. 2.22 Example. CONSTANTS : C…

若依-前台无法正常启动,npm run dev失败

问题场景: 使用若依Vue前端分离版-基于SpringBoot的权限管理系统进行实战。 问题描述与解决 拉取若依项目后,根据官方开发文档(项目readme文档)进行依赖下载安装后,启动失败。 出现以下几个问题: 运行n…

VisDrone2019上训练YOLOv5(用ultralytics)

使用的package library: ultralytics 环境:python3.8, torch1.7.0 把ultralytics代码git clone 到本地 git clone https://github.com/ultralytics/ultralytics/ 本地新建一个train.py,内容写下面这些。 from ultralytics import YOLO# Load a model…

Golang time 包以及日期函数

time 包 在 golang 中 time 包提供了时间的显示和测量用的函数。 time.Now()获取当前时间 可以通过 time.Now()函数获取当前的时间对象,然后获取时间对象的年月日时分秒等信息。 示例代码如下: package mainimport ("fmt""time" )…

Redis原理篇(二)

Redis原理 Redis数据结构 Redis网络模型 RESP协议 Redis内存回收 Redis原理篇 一、原理篇-Redis数据结构 1.1 Redis数据结构-动态字符串 我们都知道Redis中保存的Key是字符串,value往往是字符串或者字符串的集合。可见字符串是Redis中最常用的一种数据结构。 不…

网络安全 Day19-计算机网络基础知识04(网络协议)

计算机网络基础知识04(网络协议) 1. ARP1.1 ARP通讯原理1.2 arp欺骗1.3 ARP欺骗与预防1.4 排查ARP病毒 2. DHCP工作原理(自动分配内网IP)3. TCP协议三次握手、四次挥手原理4. DNS协议工作原理 1. ARP Linux查看arp:ar…

聊聊STM32 ADC的话题

STM32 微控制器系列提供了多个模拟数字转换器(ADC)模块,用于实现模拟信号的采集和转换为数字信号。ADC 在很多应用中都是非常重要的,例如传感器数据采集、电压测量等。 在 STM32 中,ADC 可以通过 STM32HAL 库提供的函…

自动驾驶感知系统-超声波雷达

超声波雷达,是通过发射并接收40kHz的超声波,根据时间差算出障碍物距离。其测距精度是1~3cm.常见的超声波雷达有两种:第一种是安装在汽车前后保险杠上的,用于测量汽车前后障碍物的驻车雷达或倒车雷达,称为超声波驻车辅助…

时间复杂度和空间复杂度

在计算机科学中,算法的效率是一个重要的概念。算法的效率可以通过复杂度来度量,其中包括时间复杂度和空间复杂度。 了解算法的复杂度对于程序员来说非常重要。在解决实际问题时,我们需要选择合适的算法来保证程序的性能和效率。因此&#xff…

【前端笔记】本地运行cli项目报错ERR_OSSL_EVP_UNSUPPORTED

报错原因 Node版本>17.x,本地npm run 起项目后会发现终端报错,具体有以下2块关键信息: Error: error:0308010C:digital envelope routines::unsupported和 opensslErrorStack: [ error:03000086:digital envelope routines::initializa…

SpringCloud学习路线(9)——服务异步通讯RabbitMQ

一、初见MQ (一)什么是MQ? MQ(MessageQueue),意思是消息队列,也就是事件驱动架构中的Broker。 (二)同步调用 1、概念: 同步调用是指,某一服务…