小红书 X WSDM 2024「对话式多文档问答挑战赛」火热开赛!

基于大语言模型(LLM)的对话问答机器人,已经成为当前人工智能领域学术界和工业界共同关注的的热门研究方向之一。在对话过程中,为大模型引入搜索结果,进行检索增强的生成(Retrieval Augmented Generation,RAG),能够有效缓解大模型的幻觉问题,提升回答质量。尽管 RAG 大幅提升了对话问答的准确率,但是依然存在对检索结果利用不充分,上下文理解错误等具有挑战的问题。

作为中国最具标志性的社交媒体平台之一,小红书集结图片、文字、视频和直播等多种内容形式于一体,一直致力于不断提升用户的搜索体验。2024 年,小红书技术团队联合数据挖掘顶会 WSDM (ACM International Conference on Web Search and Data Mining),共同发起「WSDM Cup 2024 : 对话式多文档问答挑战赛」,期待各位技术豪杰前来挑战!

本次挑战赛采取线上参与形式,组委会将提供一系列与真实世界数据相关的文档,并根据模型在语义和词汇相关性方面的表现来评估。前三名获胜团队将分别获得 2000 美元、1000 美元和 500 美元的奖金,并被邀请至墨西哥参会,展示其解决方案。

图片

关于 WSDM

WSDM 是信息检索与数据挖掘领域的国际顶级会议,由国际计算机学会(ACM)下属的信息检索(SIGIR)、数据挖掘(SIGKDD)、数据库(SIGMOD)与网络信息处理(SIGWEB)等四个专委会共同举办,涵盖信息检索、数据挖掘、Web 搜索、社交媒体、推荐系统等领域的前沿研究,在互联网搜索和数据挖掘领域拥有极高的学术声誉。第17 届 ACM 国际 WSDM 会议于 2024 年 3 月 4 日至 3 月 8 日在墨西哥举行,WSDM Cup 2024 旨在为全球参赛者提供真实工业环境下开展算法评测和研究的平台。

「对话式多文档问答」挑战赛

Conversational Multi-Doc QA

 赛题任务

每个月有数以亿计的用户在小红书上分享和发现生活的美好,并在小红书海量笔记中获取相关信息和实用的生活经验。小红书利用先进的 AI 技术,如深度学习及时下流行的大语言模型等,提升用户个性化的互动体验,更好地满足他们对高效、准确信息获取的需求。


在多轮对话场景中,为用户的查询提供准确且全面的回答是一项充满挑战的任务,在本次比赛中,我们将模拟真实的多轮对话场景,提供对话历史、当前查询 query、以及搜索系统检索到的相关笔记。参赛者的系统被要求依据这些输入信息,理解用户查询意图并输出面向查询 query 的文本回答。我们将评估回答的准确性与完善性。通过这个挑战,期待能探索和提高对话系统在面对多轮上下文和多样化搜索结果时,生成更准确,完善回答的能力,更好地理解和满足用户的需求,获取更加高效、准确的信息。

 特别说明

模型需要根据对话历史和提供的参考文档来回答用户问题。

输入:历史记录,参考文档,问题。输出:回答。

模型规模要求:确保模型大小不超过 140 亿(14B)参数。整体解决方案将在提交截止日期后进行审查。

 赛题议程

● 2023 年 12 月 25 日

赛事启动第一阶段(评估集),开放报名组队。

 2024 年 2 月 1 日

转入第二阶段(测试集),在该阶段获得的排名将用于确定最终奖项名单。同时,关闭竞赛注册通道。

● 2024 年 2 月 15 日(太平洋时间 23:59)

第二阶段停止提交结果。

● 2024 年 3 月 4 日至 8 日

在墨西哥举办 WSDM 2024「对话式多文档问答挑战赛」研讨会,期待前三名获胜团队的分享。

奖项设置

冠军队伍: 一支 ( $2000 )

亚军队伍: 一支 ( $1000 )

季军队伍: 一支 ( $500 )

报名参赛

  • 本次大赛面向全社会开放,不限年龄、身份、国籍,相关领域的个人、高等院校、科研机构、企业单位、初创团队等均可报名参赛。
  • 大赛主办单位中有机会提前接触赛题和数据的人员不得参加比赛,其他员工可以参与比赛排名,但不可领取任何奖项。
  • 评审规则、赛题 Demo、结果提交要求等更多信息可见大赛官网。
  • 大赛官网:https://sites.google.com/view/wsdm24-docqa/home
  • WSDM 2024:https://www.wsdm-conference.org/2024/wsdm-cup/

图片

                                       

欢迎各路高手同台竞技,期待你的参与!

图片

WSDM Cup 2024 : 对话式多文档问答挑战赛」由小红书社区搜索团队倾力呈现!社区搜索团队负责小红书搜索效果的优化和前沿技术的探索,致力于打造中国最大的生活搜索引擎。

团队利用最先进的生成式大模型、问答对话、多模态、大规模CTR 预估、海量 ANN 索引、流式机器学习框架等技术,通过优化 Query 分析、内容理解、召回排序、相关性、预估等方向,为海量用户提供精准、快捷、智能化、个性化的搜索体验。我们期待具有探索精神的你,加入我们,并肩面对挑战性拉满的新一代搜索引擎优化任务。

小红书社区搜索算法工程师

岗位职责:

1、对小红书搜索效果进行优化,包括搜索算法和策略的调研、设计、开发、评估等环节,提升用户体验;

2、发现并解决搜索场景中在查询分析、意图识别、排序模型、去重等方向的问题;

3、解决小红书搜索实际问题,更好地满足用户的搜索需求;

4、跟进业内搜索相关模型和算法的前沿进展,并在实际业务中进行合理应用。

任职资格:

1、本科及以上学历,计算机相关专业背景;

2、有搜索、推荐、广告、图像识别等相关背景优先;

3、熟悉机器学习、NLP、数据挖掘、知识工程的经典算法,并能在业务中灵活解决实际问题;

4、在国际顶级会议(KDD、SIGIR、WSDM、ICML、ACL等)以第一作者发表过高水平论文者、知名数据挖掘比赛(例如 KDD Cup 等)中取得领先名次者优先;

5、积极向上,踏实勤奋,自我驱动,善于沟通,解决问题优先。

欢迎感兴趣的同学发送简历至REDtech@xiaohongshu.com,并抄送至luyun2@xiaohongshu.com。

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/602364.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Go语言并发模式视角思考

犹记得2019年中旬进行知识点的学习和demo的练习,熟悉各种语法和并发调度的场景, 在2019年末开始参与项目实战开发和逻辑梳理 Go语言的接触也是更多探索和业务的拆件,做一些雏形工具,来慢慢的孵化业务生态 后来陆陆续续&#xff…

时间序列预测 — LSTM实现多变量多步负荷预测(Tensorflow):多输入多输出

目录 1 数据处理 1.1 导入库文件 1.2 导入数据集 ​1.3 缺失值分析 2 构造训练数据 3 LSTM模型训练 4 LSTM模型预测 4.1 分量预测 4.2 可视化 1 数据处理 1.1 导入库文件 import time import datetime import pandas as pd import numpy as np import matplotlib.p…

软件测试|教你如何使用UPDATE修改数据

简介 在SQL(Structured Query Language)中,UPDATE语句用于修改数据库表中的数据。通过UPDATE语句,我们可以更新表中的特定记录或多条记录,从而实现数据的修改和更新。本文将详细介绍SQL UPDATE语句的语法、用法以及一…

【AI视野·今日Robot 机器人论文速览 第六十七期】Mon, 1 Jan 2024

AI视野今日CS.Robotics 机器人学论文速览 Mon, 1 Jan 2024 Totally 16 papers 👉上期速览✈更多精彩请移步主页 Daily Robotics Papers MURP: Multi-Agent Ultra-Wideband Relative Pose Estimation with Constrained Communications in 3D Environments Authors A…

【高效视频处理】BMF 项目安装与老视频修复体验全流程及总结

一、BMF简介 BMF(Babit Multimedia Framework)是字节跳动开发的跨平台、多语言、可定制的多媒体处理框架。经过 4 年多的测试和改进,BMF 已经过量身定制,能够熟练地应对我们现实生产环境中的挑战。目前广泛应用于字节跳动的视频串…

主流大语言模型从预训练到微调的技术原理

引言 本文设计的内容主要包含以下几个方面: 比较 LLaMA、ChatGLM、Falcon 等大语言模型的细节:tokenizer、位置编码、Layer Normalization、激活函数等。大语言模型的分布式训练技术:数据并行、张量模型并行、流水线并行、3D 并行、零冗余优…

机器学习--回归算法

🌳🌳🌳小谈:一直想整理机器学习的相关笔记,但是一直在推脱,今天发现知识快忘却了(虽然学的也不是那么深),但还是浅浅整理一下吧,便于以后重新学习。 &#x1…

IOS:Safari无法播放MP4(H.264编码)

一、问题描述 MP4使用H.264编码通常具有良好的兼容性,因为H.264是一种广泛支持的视频编码标准。它可以在许多设备和平台上播放,包括电脑、移动设备和流媒体设备。 使用caniuse查询H.264兼容性,看似确实具有良好的兼容性: 然而…

【响应式编程-05】Lambda方法引用

一、简要描述 Lambda的方法引用也叫引用方法 方法引用初体验方法引用的底层实现方法引用的语法格式方法引用举例 静态方法引用构造方法引用普通方法引用super和this方法引用数组的方法引用 二、方法引用初体验 为什么出现方法引用? 引用已存在方法,避免重…

四则运算 C语言xdoj20

问题描述: 输入两个整数和一个四则运算符,根据运算符计算并输出其运算结果(和、差、积、商、余之一)。注意做整除及求余运算时,除数不能为零。 输入说明: 使用scanf()函数输入两个整数和一个运算符&#xf…

政府采购变数大,AI PC是联想的“新希望”?

文|新熔财经 作者|余一 发布两款AI PC,并预热CES将有AI PC大动作后,联想似乎找到了计算机终端的新思路。 而在这之前,联想终端业务面临的挑战不可谓不严重。 “事业单位更换纯国产电脑”、“联想被排除在大订单之外…

前端面试题-nodejs

1.什么是nodejs,它与传统的网页服务器有什么不同? 是什么?nodejs是基于Chrome V8引擎的JavaScript运行环境,它可以使JavaScript代码在服务器上运行。 有什么不同?第一,nodejs采用事件驱动、非阻塞式I/O模型…

汽车电子行业的 C 语言编程标准

前言 之前分享了一些编程规范相关的文章,有位读者提到了汽车电子行业的MISRA C标准,说这个很不错。 本次给大家找来了一篇汽车电子行业的MISRA C标准的文章一同学习下。 什么是MISRA? MISRA (The Motor Industry Software Reliability Ass…

微型导轨在设备中起什么作用

微型导轨精度高,摩擦系数小,自重轻,结构紧凑,可以用于电子制造设备、半导体制造设备、医疗设备、光学设备和机器人等各种工业机械设备中,那么微型导轨在设备中起什么作用呢? 1、导向与定位:为机…

G4周:CGAN,手势生成

本文为🔗365天深度学习训练营 中的学习记录博客 原作者:K同学啊|接辅导、项目定制 我的环境: 1.语言:python3.7 2.编译器:pycharm 3.深度学习框架Pytorch 1.8.0cu111 一、CGAN介绍 条件生成对抗网络(…

Visio导出eps格式图片

Visio导出eps格式图片 文章目录 Visio导出eps格式图片1. Visio中使用Adobe Acrobat虚拟打印2. Adobe Acrobat中裁剪并另存为eps格式 如何使用Visio绘图然后导出.eps格式的图片呢?这个过程需要用到Adobe Acrobat,使用Adobe Acrobat的虚拟打印功能&#xf…

ssm基于JAVA的驾校信息管理系统设计论文

摘 要 信息数据从传统到当代,是一直在变革当中,突如其来的互联网让传统的信息管理看到了革命性的曙光,因为传统信息管理从时效性,还是安全性,还是可操作性等各个方面来讲,遇到了互联网时代才发现能补上自古…

Java HashMap 面试题(一)

HashMap 面试题(一) 文章目录 HashMap 面试题(一)3.3 面试题-说一下HashMap的实现原理?面试题-HashMap的put方法的具体流程hashMap常见属性源码分析 3.3 面试题-说一下HashMap的实现原理? HashMap的数据结…

篇三:让OAuth2 server支持密码模式

由于Spring-Security-Oauth2停止维护&#xff0c;官方推荐采用 spring-security-oauth2-authorization-server&#xff0c;而后者默认不支持密码授权模式&#xff0c;本篇实战中采用的版本如下&#xff1a; <dependency><groupId>org.springframework.security<…

1-02VS的安装与测试

一、概述 对于一名C语言程序员而言&#xff0c;进行C语言程序的开发一般需要一个文本编辑器加上一个编译器就足够了。但为了方便起见&#xff0c;我们选择使用集成开发环境——Visual Studio&#xff08;简称VS&#xff09;。安装Visual Studio 下面讲一下如何安装VS&#xff0…