法律行业案例法模型出现,OPenAI公布与法律AI公司Harvey合作案例


c976dc89e5ea3069afac552c7d48ce9c.jpeg

Harvey与OpenAl合作,为法律专业人士构建了一个定制训练的案例法模型。该模型是具有复杂推理广泛领域知识以及超越单一模型调用能力的任务的AI系统,如起草法律文件、回答复杂诉讼场景问题以及识别数百份合同之间的重大差异。

Harvey公司由具有反垄断和证券诉讼背景的律师温斯顿-温伯格(Winston weinberg)和人工智能研究员加布-佩雷拉(Gabe Pereyra)共同创立,加布-佩雷拉曾为谷歌大脑(Google Brain)和 Meta 公司开发大语言模型(LLMs)。他们看到了使用LLMs综合信息并呈现给律师审查的机会。

在案例法研究方面,Harvey的团队设想了这样一种体验:你可以将客户问题复制粘贴进一个案例法模型,它会彻底回答这个问题并引用所有来源。他们首先尝试了明显的技术,如通过公共API微调基础模型和构建检索增强生成(RAG)系统。但他们遇到了独特的复杂、开放式用例的限制。

Harvey决定与OpenAI合作,建立一个定制训练模型,使他们能够将新知识和关于这些知识的推理方式注入基础模型。他们从德拉瓦州的案例法开始,然后扩展到包括所有美国案例法。他们向定制训练的案例法模型中添加了相当于100亿令牌的数据。

过去一年里,Harvey已经成为法律、税务和金融专业人士的安全生成式AI平台。他们的团队增长到100多人,2023年的收入增长了10倍以上,他们刚刚获得 Elad Gil、Kleiner Perkins、openAl和红杉8000 万美元 B轮融资,估值7.5亿美金。

4352a3c07c969fbb4a50fa0dd94a78bf.jpeg

功能特点

1.复杂推理能力: 模型具备处理需要复杂推理的任务的能力,这对于法律专业人士尤为重要,因为他们的工作经常涉及解决高度复杂的问题。

2.广泛的领域知识: 通过定制训练,模型获得了覆盖广泛法律领域的知识,能够理解和处理与法律相关的各种查询和任务。

3.文档起草和审查: 模型帮助法律专业人士起草和审查法律文档,显著提高了工作效率。

4.复杂诉讼场景分析: 能够回答关于复杂诉讼场景的问题,包括识别合同间的重大差异等。

5.高度准确且相关的结果: 相比传统模型,该定制模型能够提供更准确、更相关的法律信息和解决方案,并确保每个句子都有明确的来源引用。

训练方法

1.合作与知识共享: Harvey与OpenAl紧密合作,结合法律专业知识与AI技术。Harvey的律师和研究人员与OpenAl的团队共同探讨案例法研究的工作方式,并将这些知识应用于型训练。

2.数据注入: 从德拉瓦州案例法开始,最终扩展到全美案例法,向模型注入了相当于100亿令牌的数据量,帮助模型深入理解法律领域的知识和逻辑。

3.定制训练: 采用定制训练方法,超越了传统的检索增强生成系统(RAG)和通过公共API进行的基础模型微调,使模型能够整合新的知识和推理方式。

评估结果

为了测试案例法模型,Harvey与十家最大的律师事务所合作。他们向律师提供了定制案例法模型输出与相同问题的GPT-4输出的并排比较。结果,律师们对案例法模型的输出更加青睐,这是因为它提供了更长、更完整的答案,更深入地探讨了问题的细节,并涵盖了更多相关的案例法。

通过建立定制模型,Harvey减少了幻觉问题,并实现了与来源引用相关的高度准确结果。他们渴望将这一模型推广给更多用户,并探索如起草简报和动议,或帮助律师理解不同司法管区案例法如何变化等其他应用。

1.强烈的偏好选择: 当Harvey与十家最大的律师事务所合作进行模型测试时,律师们对比了定制案例法模型的输出与GPT-4对相同问题的输出。结果显示,在97%的情况下,律师们更倾向于选择定制案例法模型的输出。这一强烈偏好主要是因为定制模型提供的答案更长、更完整,更深入地探讨了问题的细节,并覆盖了更多相关的案例法。

2.答案的深度和完整性: 定制模型的输出不仅仅是回答问题,而是提供了长篇、完整的解答,深入到问题的各个细节,并广泛涵盖相关的案例法,这对法律专业人士来说极具价值。

3.减少幻觉(Hallucination): 减少幻觉是Harvey建立定制模型的一个主要动机。测试结果证明,定制模型不会编造案例,每一句话都有确切的案例引用支持,这大大提高了信息的可靠性和准确性。

Harvey的下一步重点是代理,或者如何将多个模型调用组合成一个单一的工作输出。这将简化用户体验,减少用户需要进行的提示工程和打字。Harvey的愿景是成为团队的支持成员,随着法律工作量的增长,助理们在复杂但常规的任务上花费了无数小时,我们拥有的机会不仅仅是法律,而是所有专业服务,即处理常规任务,以便专业人士可以将时间集中在客户互动上。

详细:https://openai.com/customer-stories/harvey

Harvey官网:harvey.ai


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/791292.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Git的简单入门使用

文章目录 拷贝项目的步骤创建项目的步骤提交项目或项目文件的步骤恢复项目文件的步骤 拷贝项目的步骤 找到需要用来存放项目的文件夹;在文件夹页面空白处右键点击,然后再菜单中选择“Open Git Bash here”。在Github上找到需要进行拷贝的项目&#xff0…

CVAE——生成0-9数字图像(Pytorch+mnist)

1、简介 CVAE(Conditional Variational Autoencoder,条件变分自编码器)是一种变分自编码器(VAE)的变体,用于生成有条件的数据。在传统的变分自编码器中,生成的数据是完全由潜在变量决定的&…

Rust---复合数据类型之枚举、数组

目录 枚举的使用Option 枚举数组的使用输出结果 枚举(Enum):表示一个类型可以有多个不同的取值。枚举类型可以包含不同的变体(variants),每个变体可以有不同的数据类型。 枚举的使用 enum Direction {Up,…

波士顿房价预测案例(python scikit-learn)---多元线性回归(多角度实验分析)

波士顿房价预测案例(python scikit-learn)—多元线性回归(多角度实验分析) 这次实验,我们主要从以下几个方面介绍: 一、相关框架介绍 二、数据集介绍 三、实验结果-优化算法对比实验,数据标准化对比实验&#xff0…

Head First Design Patterns -代理模式

什么是代理模式 代理模式为另一个对象提供替身或者占位符,以便控制客户对对象的访问,管理访问的方式有很多种。例如远程代理、虚拟代理、保护代理等。 远程代理:管理客户和远程对象之间的交互。 虚拟代理:控制访问实例化开销大的对…

Docker实战教程 第3章 Dockerfile

4-2 通过dockerfile制作镜像 需求 制作一个具有ping ip ifconfig vim 这些命令工具的一个nginx镜像,通过dockerfile完成STEP1 : 写一个Dockerfile FROM nginx # 基于一个基础镜像 RUN lsstep2 docker build . -f 指定使用的dockerfile来生成镜像-t 指定镜像名…

算法基础--二分

😀前言 二分查找是一种常见的算法技巧,通过不断缩小搜索范围,快速找到目标值的算法。在实际应用中,二分查找可以应用于有序数组中的查找、求上界、求下界等问题,具有较高的效率和广泛的应用价值。 🏠个人主…

pdf图片识别分类

文章目录 解析pdf数据ocr识别分类方法分类完提示 解析pdf数据 试了几种方法 fitz-get_image后面方法不适用,用pixmap分辨率低 用pypdf2版本低方法用不了 用pdf2image还要下依赖工具 用spire.pdf的SaveAsImage分辨率低,ExtractImages可以但运行慢 先用sp…

动手做一个最小Agent——TinyAgent!

Datawhale干货 作者:宋志学,Datawhale成员 前 言 大家好,我是不要葱姜蒜。在ChatGPT横空出世,夺走Bert的桂冠之后,大模型愈发地火热,国内各种模型层出不穷,史称“百模大战”。大模型的能力是毋…

非阻塞connect的正确使用方式

问题 在使用非阻塞connect时,发现在服务端没有运行时,连接成功,发现是对于connect返回为-1时,对错误码没有做正确的处理,只是对于errno为EINTR做了处理,其它错误码时使用select判断是否可写,可…

字符分类函数

字符分类函数 C语言中有⼀系列的函数是专门做字符分类的,也就是⼀个字符是属于什么类型的字符的。这些函数的使用都需要包含⼀个头文件是 ctype.h 这些函数的使用方法非常类似,我们就讲解⼀个函数的事情,其他的非常类似: int i…

图的应用解析

01.任何一个无向连通图的最小生成树(B )。 A.有一棵或多棵 B.只有一棵 C.一定有多棵 D.可能不存在 02.用Prim算法和Kruskal算法构造图的最小生成树&#xff0c…

内存和网卡压力测试

1.内存压力测试 1.1测试目的 内存压力测试的目的是评估开发板中的内存子系统性能和稳定性,以确保它能够满足特定的应用需求。开发板通常用于嵌入式系统、物联网设备、嵌入式智能家居等场景,这些场景对内存的要求通常比较高。 其内存压力测试的主要目的…

开发板通过Ethernet(以太网口)与笔记本相连,并通过笔记本wifi连接手机热点来访问外网

文章目录 1、连接开发板与笔记本:2、配置笔记本的网络共享:3、配置开发板的网络设置:4、验证网络连接: 1、连接开发板与笔记本: 使用一根网线将开发板的Ethernet接口与笔记本的以太网口相连。 2、配置笔记本的网络共…

【深度学习】sdwebui的token_counter,update_token_counter,如何超出77个token的限制?对提示词加权的底层实现

文章目录 前言关于token_counter关于class StableDiffusionProcessingTxt2Img(StableDiffusionProcessing)如何超出77个token的限制?对提示词加权的底层实现Overcoming the 77 token limit in diffusers方法1 手动拼方法2 compel 问询、帮助请看: 前言 …

Linux系统切割文件和合并文件介绍

split 和 cat 是 Linux 系统中用于文件切割和合并的命令。它们可以用于将大文件分割成多个小文件,或者将多个小文件合并成一个大文件。 1. split 命令用于将一个大文件切割成多个小文件。它的基本语法如下: split [-a num][-d][-l num][file][prefix] 其…

JS 数组方法 slice 和 splice 的区别

1. slice 概述 slice 方法用于提取数组中的一部分,返回提取结果,不会改变原数组 语法 array.slice(start, end)start 起始位置 end 可选参数,结束位置返回值: 起始位置到结束位置之间的数据,包含起始位置,但是不包含…

动规训练2

一、最小路径和 1、题目解析 就是一个人从左上往做下走,每次只能往右或者往下,求他到终点时,路径上数字和最小,返回最小值 2、算法原理 a状态表示方程 小技巧:经验题目要求 用一个二维数组表示,创建一个…

Flask Python:数据库多条件查询,flask中模型关联

前言 在上一篇Flask Python:模糊查询filter和filter_by,数据库多条件查询中,已经分享了几种常用的数据库操作,这次就来看看模型的关联关系是怎么定义的,先说基础的关联哈。在分享之前,先分享官方文档,点击查看 从文档…

蓝桥杯算法基础(36)动态规划dp经典问题详解

动态规划 -动态规划方法方法代表了这一类问题(最优子结构or子问题最优性)的有一半解法,是设计方法或者策略,不是具体算法 -本质是递推,核心是找到状态转移的方式,写出dp方程 -形式:记忆性递归递推01背包问题…