IPRally巧用Google Kubernetes Engine和Ray改善AI

专利检索平台提供商 IPRally 正在快速发展,为全球企业、知识产权律师事务所以及多个国家专利和商标局提供服务。随着公司的发展,其技术需求也在不断增长。它继续训练模型以提高准确性,每周添加 200,000 条可供客户访问的可搜索记录,并映射新专利。

随着每年发布数百万份专利文件,并且这些文件的技术复杂性不断增加,即使是经验最丰富的专利专业人士也可能需要花费几个小时的研究才能使用传统专利检索工具解决案件。 2018 年,芬兰公司 IPRally 开始采用基于图的方法来解决这个问题。

IPRally如何通过Google Kubernetes Engine 和 Ray利用AI?

“专利搜索引擎大多是复杂的布尔型搜索引擎,您需要花费数小时构建复杂的查询,”这家拥有 50 名员工的公司的首席技术官兼联合创始人 Juho Kallio 说道。 “我想打造一些重要且具有挑战性的东西。”

该公司利用机器学习 (ML) 和自然语言处理 (NLP),将超过 1.2 亿份全球专利文档的文本转换为嵌入可搜索向量空间的文档级知识图。现在,专利研究人员可以在几秒钟内收到相关结果,其中包括人工智能选择的关键信息亮点和可解释的结果。

为了满足这些需求,IPRally 使用Google Kubernetes Engine (GKE) 和开源 ML 框架Ray构建了一个定制的 ML 平台,平衡了效率、性能并简化了机器学习操作 (MLOps)。该公司使用开源KubeRay在 GKE 上部署和管理 Ray,这使他们能够利用经济高效的 NVIDIA GPU Spot 实例进行探索性 ML 研究和开发。它还使用 Google Cloud 数据构建块,包括Cloud Storage和Compute Engine永久性磁盘。接下来将扩展到 Ray Data 和BigQuery的大数据解决方案。

“Ray on GKE 有能力在未来支持我们任何规模和任何类型的分布式复杂深度学习,”Kallio 说。

专为提高性能和效率而构建的定制机器学习平台

IPRally 工程团队的主要关注点是研发以及如何继续改进其 Graph AI,以使技术知识更容易获取。只需两名 DevOps 工程师和一名 MLOps 工程师,IPRally 就能够以 GKE 和 Ray 作为关键组件构建自己的定制 ML 平台。

作为开源的大力支持者,IPRally 在计算需求增长时将所有内容都转移到了 Kubernetes。然而,他们不想自己管理 Kubernetes。这促使他们选择了 GKE,因为它具有可扩展性、灵活性、开放生态系统以及对各种加速器的支持。总而言之,这为 IPRally 提供了性能和成本之间的适当平衡,以及计算资源的轻松管理以及在不需要时有效缩减容量的能力。

“GKE 提供了我们满足这些复杂的培训和服务需求所需的可扩展性和性能,并且我们获得了对数据和计算的正确控制粒度,”Kallio 说。

Kallio 强调的一项特殊的 GKE 功能是容器镜像流,它显着加快了启动时间。

“我们已经看到 GKE 中的容器镜像流对于加快我们的应用程序启动时间具有重大影响。图像流帮助我们将提交后训练作业的启动时间缩短了 20%,”他分享道。 “而且,当我们能够重复使用现有的 Pod 时,我们可以在几秒钟而不是几分钟内启动。”

下一层是 Ray,该公司使用它来扩展用于机器学习的分布式并行 Python 和 Clojure 应用程序。为了更轻松地管理 Ray,IPRally 使用 KubeRay,这是一种可以简化 Kubernetes 上的 Ray 集群管理的专用工具。 IPRally 使用 Ray 执行最高级的任务,例如大规模数据预处理和研发中的探索性深度学习。

“Ray 和 GKE 自动缩放之间的互操作性平稳且强大。我们可以不受任何限制地组合计算资源。”Kallio 说道。

最重的 ML 负载主要部署在配备 8 个 NVIDIA L4 GPU 的G2 虚拟机上,配备多达 8 个NVIDIA L4 Tensor Core GPU,为 AI 推理工作负载提供尖端的性价比。通过在 GKE 中利用它们,IPRally 有助于按需创建节点,根据需要扩展 GPU 资源,从而优化其运营成本。每个区域都有一个由 Terraform 提供的 Kubernetes 集群,用于 IPRally 搜索廉价的现货实例。然后,GKE 和 Ray 介入进行计算编排和自动扩展。

为了进一步简化 MLOps,IPRally 在 KubeRay 和 Ray 之上构建了自己的精简编排层 IPRay。该层为数据科学家提供了一个命令行工具,可以轻松配置模板化的 Ray 集群,该集群可以有效地向上和向下扩展,并且可以在 Ray 中运行作业,而无需了解 Terraform。这个自助服务层减少了摩擦,让工程师和数据科学家能够专注于他们更高价值的工作。

技术为强劲增长铺平道路

通过选择 Google Cloud 和开源框架,IPRally 表明初创公司无需花费数百万美元即可构建企业级 ML 平台。从一开始就专注于提供强大的 MLOps 和自动化基础,这在效率和团队专注于研发的能力方面带来了回报。

IPRally 的 ML 工程师 Jari Rosti 表示:“用最好的部件打造灵活的 ML 基础设施是非常值得的。” “现在,随着我们调整基础设施以适应不断发展的现代机器学习理念,我们看到这项投资的好处成倍增加。其他年轻公司也可以通过利用 Google Cloud 和 Ray 来实现这一目标。”

此外,该公司通过使用Spot 实例节省了 70% 的 ML 研发成本。这些经济实惠的实例提供与按需实例相同质量的虚拟机,但可能会出现中断。但由于 IPRally 的研发工作负载具有容错能力,因此非常适合 Spot 实例。

IPRally去年完成了 1000 万欧元的 A 轮投资,目前正在不断吸收和处理来自全球的知识产权文档,重点是改进其图神经网络模型并构建用于专利检索的最佳人工智能平台。到2022 年,专利申请量将达到 340 万件(连续第三年增长),数据将持续流动,IPRally 可以继续帮助知识产权专业人士找到每一条相关信息。

“通过 GKE 上的 Ray,我们建立了 ML 基础,这证明了 Google Cloud 在 AI 方面的强大功能,” Kallio 说道。 “现在,我们准备探索更先进的深度学习并不断发展。”

完整原文传送门:IPRally如何通过Google Kubernetes Engine和Ray利用AI?-国外VPS网站icon-default.png?t=N7T8https://www.vps911.com/gwvpstj/1506.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/2287.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux之 USB驱动框架-USB总线(2)

一、linux 下,通过系统查看usb 总线 ls /sys/bus/usb/devices/也包含了很多信息: 其中usb1、usb2代表系统注册了2条usb总线,即有2个USB主机控制器,1和2用于区分不同总线,是USB的总线号。 每插入一个usb设备&#xff…

深度学习-数据操作

目录 张量通过shape属性访问张量的形状通过shape属性访问张量中元素的总数reshape改变张量的形状(不改变元素数量和元素值)使用全0、全1、其他常量或者从特定分布中随机采样的数字通过提供包含数值的Python列表为所需张量中的每个元素赋予确定值。张量的…

半导体存储器整理

半导体存储器用来存储大量的二值数据,它是计算机等大型数字系统中不可缺少的组成部分。按照集成度划分,半导体存储器属于大规模集成电路。 目前半导体存储器可以分为两大类: 只读存储器(ROM,Read Only Memory&#xff…

如何判断客户需求能不能做出来产品?

在做G端产品的过程中,为了让产品可以符合客户实际需求,我们需要经历客户需求调研的这个环节。那么,需求收集后,我们要从什么维度判断客户的需求是否真的可以产品化呢? 我们做G端产品,新产品的方向几乎100%来自于政策。所以才会有“政策带来产品,产品催生政绩”。 可就算…

解锁ApplicationContext vs BeanFactory: 谁更具选择性?

目录 一、聚焦源码回顾 (一)源码分析和理解 (二)简短的回顾对比建议 二、ApplicationContext vs BeanFactory特性对比 (一)主要特性总结 (二)直接建议 三、案例简单说明 &am…

OpenTelemetry-1.介绍

目录 1.是什么 2.为什么使用 OpenTelemetry 3.数据类型 Tracing Metrics Logging Baggage 4.架构图 5.核心概念 6.相关开源项目 ​编辑 7.分布式追踪的起源 8.百花齐放的分布式追踪 Zipkin Skywalking Pinpoint Jaeger OpenCensus OpenTracing 9.Openteleme…

虚假新闻检测——Adapting Fake News Detection to the Era of Large Language Models

论文地址:https://arxiv.org/abs/2311.04917 1.概论 尽管大量的研究致力于虚假新闻检测,这些研究普遍存在两大局限性:其一,它们往往默认所有新闻文本均出自人类之手,忽略了机器深度改写乃至生成的真实新闻日益增长的现…

【北京迅为】《iTOP-3588开发板系统编程手册》-第20章 socket 应用编程

RK3588是一款低功耗、高性能的处理器,适用于基于arm的PC和Edge计算设备、个人移动互联网设备等数字多媒体应用,RK3588支持8K视频编解码,内置GPU可以完全兼容OpenGLES 1.1、2.0和3.2。RK3588引入了新一代完全基于硬件的最大4800万像素ISP&…

TI_DSP_F2808学习笔记1: GPIO

1. 初始化设置 1.1 控制寄存器 GPxMUX功能选择寄存器/多功能复用选择 GPxDIR 方向选择寄存器/输入输出选择 0 输入 1 输出GPxPUD 上拉功能选择寄存器/是否启用内部上拉 0 有上拉,1禁止上拉GPxQSeln输入限定选择寄存器 输入n次为0或1才有效,滤波 1.2 数…

PDF 书签制作与调整

本文是对以前发表的旧文拆分,因为原文主题太多,过长,特另起一篇分述。 第一部分 由可编辑 PDF 文档创建书签 方法 1. Adobe Acrobat Pro autobookmark AutoBookmark 是一个可用于 Adobe Acrobat 自动生成书签的插件。 官方下载地址&…

corona渲染器锐化模糊设置,corona高效出图方法

​在使用Corona渲染器进行效果图渲染时,锐化和模糊是两种常用的设置,它们主要用于调整图像的清晰度和柔化效果。锐化参数可以增强图像中的细节,使画面看起来更加清晰锋利;而模糊参数则可以用来柔化图像边缘,减少图像噪…

Etsy多账号关联怎么办?Etsy店铺防关联解决方法

Etsy虽然相对于其他跨境电商平台来说比较小众,但因为平台是以卖手工艺品为主的,所以成本较低,利润很高。许多跨境卖家都纷纷入驻,导致平台规则越发严格,操作不当就会封号,比如一个卖家操作多个账号会出现关…

10.接口自动化测试学习-Pytest框架(2)

1.mark标签 如果在每一个模块,每一个类,每一个方法和用例之前都加上mark标签,那么在pytest运行时就可以只运行带有该mark标签的模块、类、接口。 这样可以方便我们执行自动化时,自主选择执行全部用例、某个模块用例、某个流程用…

二分查找知识点及练习题

知识点讲解 一、没有相同元素查找 请在一个有序递增数组中(不存在相同元素),采用二分查找,找出值x的位置,如果x在数组中不存在,请输出-1! 输入格式 第一行,一个整数n,代…

家用洗地机买什么牌子的好?四大业内顶尖品牌推荐

家庭清洁一直是必不可少的,但用传统的手动拖地清洁,费时又费力。现在出现了洗地机,确实改变了我们对家庭清洁的看法。它不仅能扫地、拖地,还能吸水,甚至能够自动清洁滚刷解放我们双手,提供高效清洁的同时还…

【Linux系列】 离线安装vnc 可视化桌面

离线安装vnc 可视化桌面 缘下载安装vnc初始化链接 缘 项目需要下载 下载地址: http://mirror.centos.org/centos/7/updates/x86_64/Packages/tigervnc-license-1.8.0-31.el7_9.noarch.rpm http://mirror.centos.org/centos/7/os/x86_64/Packages/libXfont2-2.0.…

【Day 6】MySQL 基础

1 MySQL DataBase(DB)是存储和管理数据的仓库 DataBaseManagementSystem(DBMS)数据库管理系统,操纵和管理数据库的大型软件 SOL(Structured QueryLanguage)操作关系型数据库的编程语言&#…

C++/Qt 小知识记录5

工作中遇到的一些小问题,总结的小知识记录:C/Qt 小知识5 Windows下查看端口占用情况C调用Python三方库测试库有没有被加上的测试方法初始化使用Python的env环境,用Py_SetPythonHome设置GDAL相关的,需要把osgeo、rasterio的路径加入…

【iOS开发】(一)2024 从一无所有开始,到ios开发(react Native)

​ 2024 从一无所有开始,到ios开发(react Native) 目录标题 1 工具简介2 基础环境搭建1 安装 brew2 安装 Node.js3 安装 Yarn4 安装 React Native 脚手架 3 ios环境搭建4创建并启动一个app 在这里插入图片描述 1 工具简介 Homebrew (brew)&a…

OpenHarmony实战开发-页面布局检查器ArkUI Inspector使用指导

DevEco Studio内置ArkUI Inspector工具,开发者可以使用ArkUI Inspector,在DevEco Studio上查看应用在真机上的UI显示效果。利用ArkUI Inspector工具,开发者可以快速定位布局问题或其他UI相关问题,同时也可以观察和了解不同组件之间…