谷歌云 | Gemini 大模型赋能 BigQuery 情感分析:解码客户评论,洞悉市场风向

情感分析是企业洞察客户需求和改进产品服务的重要工具。近年来,随着自然语言处理 (NLP) 技术的飞速发展,情感分析变得更加精准高效。Google 推出的 Gemini 模型,作为大型语言模型 (LLM) 的代表,拥有强大的文本处理能力,可帮助企业轻松实现情感分析。

Gemini 模型在 BigQuery 中的应用

BigQuery 作为 Google 云数据仓库,拥有强大的数据分析能力。将 Gemini 模型与 BigQuery 结合,可以实现更加高效的情感分析。具体来说,BigQuery 提供了 ML.GENERATE_TEXT 函数,该函数允许您直接在 SQL 查询中利用 Gemini 模型来分析 BigQuery 表中的文本。这意味着您无需将数据从 BigQuery 迁移到其他平台或编写复杂的代码,就可以进行深入的文本分析。

ML.GENERATE_TEXT 函数还可用于使用基于gemini-pro-vision 多模态模型的远程模型来生成描述视觉内容的文本。该功能主要具有以下优势:

  • 易于使用: 基于 SQL 的查询方式,即使非专业人员也能轻松上手。

  • 可扩展性: BigQuery 可以处理海量数据,Gemini 模型可以高效分析大规模文本数据。

  • 强大的分析能力: Gemini 模型可以进行细粒度的文本分析,提取情感、主题、关键词等信息。

  • 灵活的应用场景: 情感分析、主题提取、文本摘要、文本生成等多种场景。

接下来,我们以假设的一个打车公司为例,了解如何使用 ML.GENERATE_TEXT 函数:

设置说明:

  1. 开始之前,请选择您的 GCP 项目,链接结算帐户,并启用必要的API;

  2. 创建云资源连接并获取连接的服务账户;

  3. 授予服务帐户访问权限。 

  4. 加载数据。要从公共存储帐户加载,请使用以下命令:

    1. 请将“[PROJECT_ID.DATASET_ID]”替换为您的 project_id,并输入数据集的名称

    2. 该命令将在您的数据集中创建一个名为“ customer_review ”的表

CREATE SCHEMA IF NOT EXISTS `[PROJECT_ID.DATASET_ID]` OPTIONS (location='us');LOAD DATA OVERWRITE `[PROJECT_ID.DATASET_ID].customer_review`
FROM FILES ( format = 'PARQUET',
uris = ['gs://data-analytics-golden-demo/rideshare-lakehouse-raw-bucket/rideshare_llm_export/v1/raw_zone/customer_review/000000000000.parquet']);

情感分析

然后,让我们来看一个执行情感分析的例子。

1.创建模型

在 BigQuery 中创建一个利用 Vertex AI 基础模型的远程模型。

句法:

CREATE OR REPLACE MODEL
`PROJECT_ID.DATASET_ID.MODEL_NAME`
REMOTE WITH CONNECTION `PROJECT_ID.REGION.CONNECTION_ID`
OPTIONS (ENDPOINT = 'ENDPOINT');

代码示例

  • 请替换'[PROJECT_ID.DATASET_ID.MODEL_NAME]'  为您的 project_id、dataset_id 和模型名称

  • 请替换'[PROJECT_ID.REGION.CONNECTION_ID]'  为您的 project_id、region 和 connection_id

CREATE OR REPLACE MODEL `[PROJECT_ID.DATASET_ID.MODEL_NAME]`
REMOTE WITH CONNECTION `[PROJECT_ID.REGION.CONNECTION_ID]`
OPTIONS (ENDPOINT = 'gemini-pro');

2.生成文本

只需几行 SQL,您就可以使用该模型和 ML.GENERATE_TEXT 函数分析 BigQuery 表中的文本或视觉内容。

ML.GENERATE_TEXT 语法因远程模型所针对的 Vertex AI 模型而异。阅读文档以了解 ML.GENERATE_TEXT 函数的所有参数。

句法:

ML.GENERATE_TEXT(
MODEL project_id.dataset.model,
{ TABLE project_id.dataset.table | (query_statement) },
STRUCT([max_output_tokens AS max_output_tokens][, top_k AS top_k][, top_p AS top_p][, temperature AS temperature][, flatten_json_output AS flatten_json_output][, stop_sequences AS stop_sequences])
)

代码示例:

  • 请替换'[PROJECT_ID.DATASET_ID]'  为您的 project_id 和 dataset_id

  • 请替换'[PROJECT_ID.REGION.CONNECTION_ID]'  为您的 project_id、region 和 connection_id

CREATE OR REPLACE TABLE `[PROJECT_ID.DATASET_ID].review_sentiment_analysis` AS
WITH PROMPT AS (SELECT CONCAT ('For the given review classify the sentiment as Positive, Neutral or Negative.','\n input: The driver was able to make some small talk, but he didn\'t go overboard. I liked that he was friendly and chatty, but he also knew when to leave me alone. The trunk fit my belongings, and the car was clean and comfortable. Overall, it was a good ride.','\n output: \n Positive - Trunk fit my belongings, friendly, chatty','\n input: I took a rideshare last night and it was an okay experience. The car was adequately clean, but it was a bit warm for my liking. The driver was able to make some small talk, but I wasn\'t really in the mood to talk. Overall, it was a fine ride.','\n output: Neutral - Clean, A bit warm, fun ride','\n input: ', customer_review_text,
'\n output: '
) AS prompt, customer_id, 
customer_review_textFROM `[PROJECT_ID.DATASET_ID].customer_review`LIMIT 20
),
REVIEW_RESPONSE_GENERATION AS (SELECT *FROMML.GENERATE_TEXT(MODEL `[PROJECT_ID.DATASET_ID.MODEL_NAME]`,(SELECT * FROM PROMPT),STRUCT(200 AS max_output_tokens,0.5 AS temperature,40 AS top_k,1.0 AS top_p,TRUE AS flatten_json_output))
)
SELECT ml_generate_text_llm_result, customer_id, customer_review_text, prompt, ml_generate_text_status FROM REVIEW_RESPONSE_GENERATION;SELECT ml_generate_text_llm_result, customer_id, customer_review_text, prompt, ml_generate_text_status  FROM `[PROJECT_ID.DATASET_ID].review_sentiment_analysis`;

3.结果:

在提示中,我们为模型提供了上下文以及两个示例,清晰地展示了我们期望的输出格式。您可以通过少量样本提示的方法,验证生成的输出是否与我们提供的示例保持一致。

少量样本提示中,包含一些带有相应情感标签的评论示例对于引导模型行为至关重要。为了确保模型在各种情况下都能有效工作,提供足够数量的结构良好的示例(涵盖各种评论场景)是必不可少的。

然后,通过对客户评论进行情感分析,我们可以深入了解他们对我们产品的偏好和痛点。通过识别评论中的关键主题,我们可以有效地将宝贵的反馈传达给产品团队,使他们能够做出数据驱动的明智决策并进行改进。

在上表中,您可以看到 ML.GENERATE_TEXT 的结果,其中包括输入表以及以下列:

  1. ml_generate_text_result:这是 JSON 响应,生成的文本位于文本元素中。

  2. ml_generate_text_llm_result:包含生成文本的 STRING 值。当 flatten_json_output 为 TRUE 时返回此列。

  3. ml_generate_text_rai_result:包含安全属性的 STRING 值。当 flatten_json_output 为 TRUE 时返回此列。

  4. ml_generate_text_status:一个字符串值,包含相应行的 API 响应状态。如果操作成功,则此值为空。

提取主题

接着,让我们使用上面创建的模型从评论中提取主题:

  • 请替换'[PROJECT_ID.DATASET_ID]'  为您的 project_id 和 dataset_id

CREATE OR REPLACE TABLE `[PROJECT_ID.DATASET_ID].extract_themes` ASWITH PROMPT AS (SELECT CONCAT(
"""
Classify the text as one or more of the following categories and return in the below json format.
- "trunk space small"
- "trunk space large"
- "driving too fast"
- "driving too slow"
- "clean car"
- "dirty car"
- "car too hot"
- "car too cold"
- "driver likes conversation"
- "driver likes no conversation"
- "driver likes music"
- "driver likes no music"
- "distracted driver"JSON format: [ "value" ]
Sample JSON Response: [ "dirty car", "car too cold" ]Text:
""", customer_review_text) AS prompt, customer_id, customer_review_textFROM `[PROJECT_ID.DATASET_ID].customer_review`LIMIT 10
),
EXTRACT_THEMES AS (SELECT *FROMML.GENERATE_TEXT(MODEL `[PROJECT_ID.DATASET_ID.MODEL_NAME]`,(SELECT * FROM PROMPT),STRUCT(1024 AS max_output_tokens,0 AS temperature,1 AS top_k,0 AS top_p,TRUE AS flatten_json_output))
)
SELECT ml_generate_text_llm_result, customer_id, customer_review_text, prompt, ml_generate_text_status FROM EXTRACT_THEMES;SELECT ml_generate_text_llm_result, customer_id, customer_review_text, prompt, ml_generate_text_status  FROM `[PROJECT_ID.DATASET_ID].extract_themes`;

结果:

使用 BigQuery 控制台中的 ML.GENERATE_TEXT 函数和 SQL,我们可以高效地识别客户评论中的关键主题。这让我们能够更深入地了解客户的看法,并提供可操作的数据来改进我们的产品。

分析主题

现在我们已经确定了评论的主题,让我们更深入地了解BigQuery 中的数据画布,这是我们在 Next '24 上推出的以AI 为中心的体验,旨在重新构想数据分析。BigQuery 数据画布可让您使用自然语言发现、转换、查询和可视化数据。它还提供了一个图形界面,可让您在有向无环图 (DAG) 中使用数据源、查询和可视化,从而让您可以查看映射到您的思维模型的分析工作流程。

鉴于我们的主题存储在“extract_themes”表中,让我们创建一个数据画布来进一步分析它们。单击“+”图标旁边的向下箭头,然后选择“创建数据画布”

您将进入以下图示的页面,在其中搜索“提取主题”表并开始操作:

选择一个表,您就会在画布上看到它,您可以在其中直接查询它或将其与其他表连接。

要创建主题条形图,请单击“查询”按钮并输入“最常见主题的条形图,删除空值并将结果限制为前 10 个值”。即使“主题”不在专用列中,AI 也能理解您的请求并自动生成正确的查询 - AI 识别出主题位于“ml_genertae_text_llm_result”列中。最后,单击“运行”以查看查询结果。

到这里,您的主题数据已准备就绪!单击“可视化”即可立即查看您的条形图。 

最后,您就可以成功拥有从客户评论中提取的主题的条形图,以及基于数据和发现的解释自动生成的有用见解。 

简而言之,BigQuery 数据画布可让您使用简单的自然语言命令从头到尾分析数据:发现相关数据、将其与客户信息合并、找到关键见解、与团队成员协作以及创建报告 - 所有这些都在一个地方完成。此外,您可以保存这些结果或将它们与其他数据合并以进行进一步分析,或将其提取到笔记本中。

总结

Gemini 模型与 BigQuery 的结合,为企业提供了强大的情感分析工具。借助 Gemini 模型,企业可以轻松解码客户评论中的情感,洞察市场趋势,从而更好地改进产品服务,提升客户满意度。

立即联系 Cloud Ace云一,解锁您的商业洞察力!

Cloud Ace云一,致力于为中国出海企业提供专业、高效的云服务,助力您实现数字化转型,成功掌握更多商机!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/43396.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

生成图质量评价

1. RichHF-18K 论文地址 解决问题: 如何对生成图质量进行算法评价,以优化图片质量,提升模型生成能力 解决思路: 参考多模态模型,构建评价模型,从7个维度分三个分支对生成图进行测评: Tips&…

如何将overleaf的latex格式转换为word

安装pandoc https://pandoc.org/installing.html 下载安装后,打开windows shell,测试是否安装成功: pandoc -v使用代码转换 进入你防止latex的文件夹,运行以下命令: pandoc -o output.docx -t docx .\main.tex其中…

录制微课的软件有哪些?这些软件你不能错过!

随着在线教育的蓬勃发展,微课已成为一种广受欢迎的教学形式。微课录制软件的选择对于教师而言至关重要,它不仅要具备简单易用的特点,还要能够满足高质量录制的需求。而对于教师来说,录制微课的软件有哪些呢?本文将介绍…

【日常记录】【插件】js 获取浏览器信息、操作系统等相关信息

文章目录 1. 原生方式2. 插件的方式2.1 Bowser 的基本使用2.2 UAParser2.3 Platform.js 参考链接 1. 原生方式 原生方式可以通过 navigator.userAgent 来获取 需要写一个正则来匹配,获取相关的信息 2. 插件的方式 获取浏览器版本相关信息的库主要有以下几个 Bowser&…

高德API接入安卓相关问题说明

高德API接入安卓相关问题说明 我们都在怀念过去,失去后我们才懂得珍惜,有些人或事早已经远去,可是还是会想起曾经拥有的岁月,会是一种喜悦,会是一种遗憾…… 目前Android开发已经普遍使用Android Studio,开…

人工智能算法工程师(中级)课程1-Opencv视觉处理之基本操作

大家好,我是微学AI,今天给大家介绍一下人工智能算法工程师(中级)课程1-Opencv视觉处理之基本操作。OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习软件库。它提供了各种视觉处理函数,并…

红酒与电影经典:那些银幕上的醉人瞬间

在光影交织的银幕世界里,红酒不仅是品味生活的象征,更是情感与故事的催化剂。每当夜幕降临,一杯色泽深邃的红酒,便能带我们走进那些令人陶醉的影片瞬间,感受不同的人生百态。今天,就让我们一起回味那些银幕…

告别付费 API!使用 Ollama 和 MATLAB 玩转本地大模型

在“当MATLAB遇见ChatGPT?”一文中介绍了名为MatGPT的插件,该插件通过调用ChatGPT的API,实现了在MATLAB中与Chat GPT对话的功能。 虽然Open AI的GPT3.5和GPT4o可以免费使用,但调用API却需要收费,因此使用MatGPT这类插件…

mybatis 延迟加载

MyBatis的延迟加载(Lazy Loading)是一种优化技术,用于在需要时才加载关联对象或集合,从而提高性能和效率。以下是对MyBatis延迟加载的详细介绍: 延迟加载的基本概念 延迟加载是指在第一次访问对象的属性时才加载该对象…

阿一课代表随堂分享:红队反向代理之使用frp搭建反向代理

frp反向代理 frp简介 frp 是一个开源、简洁易用、高性能的内网穿透和反向代理软件,支持 tcp, udp, http, https等协议。 frp 是一个可用于内网穿透的高性能的反向代理应用,分为服务端frps和客户端frpc,支持 tcp, udp, http, https 协议。详…

修改服务器挂载目录

由于我们的项目通常需要挂载一个大容量的数据盘来存储文件数据,所以我们每台服务器都需要一个默认的挂载目录来存放这些数据,但是由于我们的误操作,导致挂载目录名字建错了,这时候后端就读不到挂载目录了,那我们我们的…

Java面经知识点汇总版

Java面经知识点汇总版 算法 14. 最长公共前缀(写出来即可) Java 计算机基础 数据库 基础 SQL SELECT first_name, last_name, salary FROM employees WHERE department Sales AND salary > (SELECT AVG(salary)FROM employeesWHERE department Sal…

德语中含“Augen”的惯用语表达-柯桥小语种学习德语考级

在我们的德语学习过程中,除了词汇的记忆,另一项重要的记忆任务就是惯用语的背诵啦。要知道,德语中有大量的Redewendung,他们以其言简意赅的表达,在日常用语中备受青睐。上一期我们已经学习了部分含有“Hand”的惯用语&…

去中心化时代的到来:区块链如何重新定义权力和控制

随着区块链技术的迅猛发展,我们正逐步进入一个去中心化的新时代。区块链不仅仅是一种技术,更是一种理念,它通过去除中心化的权威和控制节点,重新定义了数据管理、交易验证和权力分配的方式。本文将深入探讨区块链如何在去中心化时…

成都欣丰洪泰文化传媒有限公司电商服务领航者

在当今数字化浪潮中,电商行业正以前所未有的速度蓬勃发展。作为这片蓝海中的佼佼者,成都欣丰洪泰文化传媒有限公司凭借其专业的电商服务能力和对市场的敏锐洞察力,成为众多品牌信赖的合作伙伴。今天,就让我们一起走进成都欣丰洪泰…

CC5利用链分析

分析版本 Commons Collections 3.2.1 JDK 8u65 环境配置参考JAVA安全初探(三):CC1链全分析 分析过程 CC6是在CC1 LazyMap利用链(引用)的基础上。 CC5和CC6相似都是CC1 LazyMap利用链(引用)的基础上,改变了到LazyMap的入口类。 CC6是用TiedMapEntry的hashCode方…

Pinia 实战指南:轻松驾驭前端状态管理

前言 本文讲解一下在前端开发中经常使用的一个状态管理工具Pinia Pinia 是 Vue 的专属状态管理库,很值得我们深入去学习一下 Pinia是什么? Pinia是专门为Vue.js应用程序设计的一个状态管理库 主要特点: 简单性: Pinia的设计目标是提高开发效率和用户体验,因此…

gen_circle_contour_xld 创建XLD轮廓对应于圆或圆弧。

gen_circle_contour_xld (Operator)创建XLD轮廓对应于圆或圆弧。 Signature 签名 gen_circle_contour_xld( : ContCircle : Row, Column, Radius, StartPhi, EndPhi, PointOrder, Resolution : ) Description 描述 Gen_circle_contour_xld创建一个或多个圆弧或闭合的圆。圆…

全志A527 T527 android13支持usb摄像头

1.前言 我们发现usb摄像头在A527 android13上面并不能正常使用,需要支持相关的摄像头。 2.系统节点查看 我们查看系统是否有相关的节点生成,发现/dev/video相关的节点已经生成了。并没有问题,拔插正常。 3.这里我们需要查看系统层是否支持相关的相机, 我们使用命令进行…

鹦鹉智能财税系统:代账公司的智能化升级之路

随着新公司法的颁布与实施,财税政策的不断更新,以及大数据、人工智能等新技术的广泛应用,企业老板对于财税合规,以及企业资金安全的需求日益增加。乐财业-鹦鹉智能财税系统从企业老板视角出发,在助力企业合规经营的前提…