TREC 2023 Deep Learning Track Guidelines

先看看TREC是什么

TREC 是 Text REtrieval Conference(文本检索会议)的缩写。它是一个由美国国家标准技术研究所(NIST)主办的年度会议,旨在推动信息检索领域的研究和发展。TREC 于 1992 年开始举办,是一个国际性的会议,每年都吸引着来自学术界、工业界和政府机构的研究人员参与。

TREC 的主要目标之一是提供一个平台,让研究人员能够评估和比较不同信息检索系统的性能。为此,TREC 组织了一系列任务和评测,参与者必须根据特定的数据集和评估标准来设计和评估他们的信息检索系统。这些任务通常涉及文本检索、文档分类、信息抽取等相关领域。

通过 TREC,研究人员可以共享他们的方法、工具和经验,促进信息检索技术的进步,并提高信息检索系统的性能和效果。

TREC 2023 深度学习赛道指南

今年,我们庆祝 TREC 深度学习课程的五周​​年纪念日和最终版本!🙏🏽

概述论文: https://trec.nist.gov/pubs/trec32/papers/Overview_deep.pdf

以前的版本

  • 2019年网站和概述文件
  • 2020 年网站和概述文件
  • 2021 年网站和概述文件
  • 2022 年网站和概述文件

时间表(暂定)

  • 7 月 10 日:发布测试查询
  • 7 月 31 日:提交段落和文档排名任务的截止日期

登记

要参加 TREC,请在以下网站预先注册:Text REtrieval Conference (TREC) Application

介绍

深度学习轨道研究大型训练数据体系中的信息检索。在这种情况下,具有至少一个正标签的训练查询的数量即使不是数十万或更多,也至少为数万。这对应于现实场景,例如基于点击日志的训练和基于浅池标签的训练(例如TREC Million Query Track中的池化或基于早期精度的搜索引擎评估)。

已知某些基于机器学习的方法,例如基于深度学习的方法,需要非常大的数据集来进行训练。缺乏如此大规模的数据集一直是开发用于常见信息检索任务(例如文档排名)的方法的限制。前几年组织的深度学习赛道旨在为 TREC 提供大规模数据集,并通过对段落排名和文档排名任务的排名器进行严格的盲评估来创建重点研究工作。

与前几年类似,2023 年该赛道的主要目标之一是研究在有大量训练数据可用时哪些方法效果最好。例如,适用于小数据的相同方法是否也适用于大数据?当提供更多训练数据时,方法会改进多少?在这个场景中可以引入哪些外部数据和模型,全面监管与其他形式的监管相结合有何用处?

深度学习跟踪任务

2023年深度学习赛道继续有段落排序和文档排序任务;每种情况都有两个子任务:完整排名和重新排名。您可以为每个子任务提交最多三个正式运行,这些子任务将由 NIST 评估并在汇集/评审过程中使用。参赛团体可以提交最多五轮额外的比赛进行评估,这些比赛不会包含在汇集/评审过程中。如果您为某个子任务提交了超过 3 次运行,请在提交过程中选择“Unpooled”作为额外运行的判断优先级。如果参赛小组提交的评审顺序不明确,NIST 将单方面选择评审哪个运行。与去年类似但与往年不同的是,该赛道的主要重点将放在文章排名任务上,而将文档排名任务保留为次要任务。文档排名任务的定义和评估的详细信息可以在本页后面找到。

每个任务都使用来自 MS MARCO 数据集的大量人工生成的训练标签。这两个任务使用相同的测试查询。他们还使用相同形式的训练数据,每个训练查询通常有一个积极的训练文档/段落。在段落排名的情况下,有一个直接的人工标签表明该段落可用于回答查询,而为了训练文档排名任务,我们从段落级别标签推断文档级别标签。

对于这两项任务,鼓励参与者研究迁移学习方法的有效性。我们当前的训练标签(来自 MS MARCO)的生成方式与测试标签(由 NIST 生成)不同,尽管过去几年的一些标签(映射到新语料库)也可能可用。参与者还可以(并被鼓励)使用外部语料库进行大规模语言模型预训练,或将针对轨道中一项任务(例如段落排名)构建的算法调整为另一项任务(例如文档排名)。这使得参与者能够研究各种迁移学习策略。下面更详细地描述这两个任务。

今年我们的查询包括“综合查询”,这些查询不适用于官方 NIST 评估。我们将使用综合数据评估提交的运行,以了解综合评估与官方评估的匹配程度。目标是开发一个综合评估,可以作为官方结果的领先指标(“开发集”)。官方评估不会使用合成查询或 qrel。

段落排序任务

今年深度学习赛道的主要焦点仍然是文章排名任务。我们有两个与此任务相关的子任务:完整排名和前 100 名重新排名。

在完整排名(检索)子任务的背景下,给定一个问题,您需要根据包含问题答案的可能性对完整集合中的段落进行排名。它模拟了一个场景,您正在构建一个用于检索段落的端到端检索系统。对于此端到端检索任务,您最多可以提交100 个段落。

在重新排名子任务中,我们为您提供来自简单 IR 系统的 100 篇文章的初始排名,您需要根据文章包含问题答案的可能性对文章进行重新排名。这是一个非常常见的现实场景,因为许多端到端系统都是通过检索和 top-k 重新排名来实现的。重新排名子任务允许参与者仅专注于重新排名,而不需要实施端到端系统。它还使这些重新排名运行更具可比性,因为它们都是从同一组 100 个候选者开始的。

文档排序任务

虽然文章排序任务再次成为今年深度学习赛道的主要焦点,但该赛道将继续有文档排序任务。与去年一样,文档排名任务的定义和评估与往年有所不同。前几年,文档排序任务的期望是根据文档与问题的相关性对文档进行排序。然而,与去年一样,今年的期望是根据文档包含与问题相关的段落的可能性对文档进行排名

与段落排序任务类似,文档排序任务也有完整排序和重新排序子任务。在完整排名(检索)子任务中,可以从提供的完整文档集合中检索文档。您最多可以为此任务提交100 个文档。

在前 100 个重新排名子任务中,我们为您提供 100 个文档的初始排名,您需要根据这些文档包含与问题相关的段落的可能性对这些文档进行重新排名。在此子任务中,我们可以基于相同的 100 个候选候选集来比较不同的重新排序方法,其基本原理与段落重新排序子任务中描述的相同。

数据集

今年,我们将利用与去年赛道相同的数据集。

下载数据集

要更快、更可靠地下载大文件,请使用AzCopy(请参阅说明)。

azcopy copy https://msmarco.z22.web.core.windows.net/msmarcoranking/msmarco_v2_doc.tar msmarco_v2_doc.tar

我们还看到了一个在不使用 azcopy 的情况下加快下载速度的建议:

wget --header "X-Ms-Version: 2019-12-12" https://msmarco.z22.web.core.windows.net/msmarcoranking/msmarco_v2_doc.tar

通道排名数据集

TypeFilenameFile sizeNum RecordsFormat
Corpusmsmarco_v2_passage.tar20.3 GB138,364,198tar of 70 gzipped jsonl files
Trainpassv2_train_queries.tsv11.1 MB277,144tsv: qid, query
Trainpassv2_train_top100.txt.gz324.9 MB27,713,673TREC submission: qid, “Q0”, docid, rank, score, runstring
Trainpassv2_train_qrels.tsv11.1 MB287,889TREC qrels format
Dev 1passv2_dev_queries.tsv160.7 KB3,903tsv: qid, query
Dev 1passv2_dev_top100.txt.gz4.7 MB390,300TREC submission: qid, “Q0”, docid, rank, score, runstring
Dev 1passv2_dev_qrels.tsv161.2 KB4,074TREC qrels format
Dev 2passv2_dev2_queries.tsv175.4 KB4.281tsv: qid, query
Dev 2passv2_dev2_top100.txt.gz5.1 MB428,100TREC submission: qid, “Q0”, docid, rank, score, runstring
Dev 2passv2_dev2_qrels.tsv177.4 KB4,456TREC qrels format
Validation 1 (TREC test 2021)2021_queries.tsv24.0 KB477tsv: qid, query
Validation 1 (TREC test 2021)2021_passage_top100.txt.gz590.4 KB47,700TREC submission: qid, “Q0”, docid, rank, score, runstring
Validation 1 (TREC test 2021)2021.qrels.pass.final.txt424 KB10,828qid, “Q0”, docid, rating
Validation 2 (TREC test 2022)2022_queries.tsv21.0 KB500tsv: qid, query
Validation 2 (TREC test 2022)2022_passage_top100.txt.gz615.3 KB50,000TREC submission: qid, “Q0”, docid, rank, score, runstring
Validation 2 (TREC test 2022)2022.qrels.pass.withDupes.txt15 MB386,416qid, “Q0”, docid, rating
Test (TREC test 2023)2023_queries.tsv37.2 KB700tsv: qid, query
Test (TREC test 2023)2023_passage_top100.txt.gz868.1 KB70,000TREC submission: qid, “Q0”, docid, rank, score, runstring

 

段落语料库也是jsonl格式。每一段都有:

  • pid:段落标识符对语料库中段落的 jsonl 行的文件名和起始位置进行编码。例如,msmarco_passage_41_45753370位于文件msmarco_v2_passage/msmarco_passage_41中的位置45753370
  • 段落:段落的正文。
  • spans:原始文档中段落句子的位置,例如(17789,17900),(17901,18096)
  • docid:段落原始文档的文档 ID,例如msmarco_doc_35_1343131017

通过调整上面文档 ID 案例列出的 Python 代码,可以使用段落 id 访问段落语料库。

段落“spans”使用字节偏移量,但文档文本采用 UTF-8 格式,因此要从正文文本中提取跨度,(x,y)您需要使用:

doc_json['body'].encode()[x:y].decode()

文档排名数据集

TypeFilenameFile sizeNum RecordsFormat
Corpusmsmarco_v2_doc.tar32.3 GB11,959,635tar of 60 gzipped jsonl files
Traindocv2_train_queries.tsv12.9 MB322,196tsv: qid, query
Traindocv2_train_top100.txt.gz404.5 MB32,218,809TREC submission: qid, “Q0”, docid, rank, score, runstring
Traindocv2_train_qrels.tsv11.9 MB331,956TREC qrels format
Dev 1docv2_dev_queries.tsv187.5 KB4,552tsv: qid, query
Dev 1docv2_dev_top100.txt.gz5.6 MB455,200TREC submission: qid, “Q0”, docid, rank, score, runstring
Dev 1docv2_dev_qrels.tsv173.4 KB4,702TREC qrels format
Dev 2docv2_dev2_queries.tsv205.0 KB5,000tsv: qid, query
Dev 2docv2_dev2_top100.txt.gz6.1 MB500,000TREC submission: qid, “Q0”, docid, rank, score, runstring
Dev 2docv2_dev2_qrels.tsv190.9 KB5,178TREC qrels format
Validation 1 (TREC test 2019)msmarco-test2019-queries.tsv.gz4.2 KB200tsv: qid, query
Validation 1 (TREC test 2019)(currently not available)TREC submission: qid, “Q0”, docid, rank, score, runstring
Validation 1 (TREC test 2019)docv2_trec2019_qrels.txt.gz105 KB13,940qid, “Q0”, docid, rating
Validation 2 (TREC test 2020)msmarco-test2020-queries.tsv.gz8.2 KB200tsv: qid, query
Validation 2 (TREC test 2020)(currently not available)KBTREC submission: qid, “Q0”, docid, rank, score, runstring
Validation 2 (TREC test 2020)docv2_trec2020_qrels.txt.gz60.9 KB7,942qid, “Q0”, docid, rating
Validation 3 (TREC test 2021)2021_queries.tsv24.0 KB477tsv: qid, query
Validation 3 (TREC test 2021)2021_document_top100.txt.gz603.7 KB47,700TREC submission: qid, “Q0”, docid, rank, score, runstring
Validation 3 (TREC test 2021)2021.qrels.docs.final.txt468 KB13,058qid, “Q0”, docid, rating
Validation 4 (TREC test 2022)2022_queries.tsv21.0 KB500tsv: qid, query
Validation 4 (TREC test 2022)2022_document_top100.txt.gz627.7 KB50,000TREC submission: qid, “Q0”, docid, rank, score, runstring
Validation 4 (TREC test 2022)2022.qrels.docs.inferred.txt13.1 MB369,638qid, “Q0”, docid, rating
Test (TREC test 2023)2023_queries.tsv37.2 KB700tsv: qid, query
Test (TREC test 2023)2023_document_top100.txt.gz881.0 KB70,000TREC submission: qid, “Q0”, docid, rank, score, runstring

 

文档语料库采用jsonl格式。每个文档都有:

  • docid:文档标识符对语料库中文档的 jsonl 行的文件名和起始位置进行编码。例如,msmarco_doc_31_726131位于文件msmarco_v2_doc/msmarco_doc_31中的位置726131
  • url:文档的 URL
  • title:文档的标题
  • headers:从文档中提取的以换行符分隔的标题列表,其中第一个标题可能是描述整个文档的生成标题(备用标题)。
  • body:文档的正文

如果解压缩语料库,您可以使用以下命令快速访问文档:

import jsondef get_document(document_id):(string1, string2, bundlenum, position) = document_id.split('_')assert string1 == 'msmarco' and string2 == 'doc'with open(f'./msmarco_v2_doc/msmarco_doc_{bundlenum}', 'rt', encoding='utf8') as in_fh:in_fh.seek(int(position))json_string = in_fh.readline()document = json.loads(json_string)assert document['docid'] == document_idreturn documentdocument = get_document('msmarco_doc_31_726131')
print(document.keys())

生产输出:

dict_keys(['url', 'title', 'headings', 'body', 'docid'])

使用外部信息

通常允许您在开发运行时使用外部信息。当您提交运行时,请填写一份表格,列出您使用的资源。这可能包括外部语料库,例如维基百科或预训练模型(例如词嵌入、BERT)。这还可以包括提供的文档排名训练数据集,但也可以包括其他数据,例如段落排名任务标签或外部标签或预训练模型。这将使我们能够分析运行并将它们分解为类型。

重要提示:我们现在正在处理多个版本的 MS MARCO 排名数据以及所有其他 MS MARCO 任务。这个新的数据发布改变了可用和可用的内容。参与者应谨慎使用这些数据集,并且必须遵守以下准则:

  • 现在您可以在运行中使用段落文档映射。例如,可以通过首先对文档进行排名,然后从前 k 个文档中识别所有段落,然后应用段落重新排名算法来生成段落排名。在以前的 MS MARCO 数据中,没有可用的段落-文档映射,并且我们不鼓励参与者生成此类映射,因此这种方法是不可能的。
  • 今年禁止您再次使用ORCAS 数据。您还禁止使用任何其他信息来告诉我们今年的哪些文档(或段落)也出现在语料库的先前版本中。我们将研究使用此类信息是否会导致一些偏见或泄露真实情况,但目前是禁止的。我们可能会发布 OCAS 更新。
  • 除了 ORCAS 之外,您还可以使用上面列出的任何数据以及该赛道前几年(2019 年、2020 年、2021 年和2022 年)的任何数据。
  • 可以使用下面“其他资源”部分列出的任何数据。
  • 禁止您在提交的内容中使用来自msmarco.org的任何其他数据集,例如原始 QnA 和 NLGEN 任务。原始的 MS MARCO 数据集揭示了它们如何构建的一些小细节,而这些细节在现实世界的搜索引擎中是不可用的;因此,应该避免。

提交、评估和评审

请在以下位置提交您的运行: https: //ir.nist.gov/trecsubmit/deep.html

我们将遵循与大多数 TREC 提交所使用的类似格式,如下重复。空白用于分隔列。格式中列的宽度并不重要,但重要的是每行恰好有六列,并且列之间至少有一个空格。

1 Q0 pid1    1 2.73 runid1
1 Q0 pid2    2 2.71 runid1
1 Q0 pid3    3 2.61 runid1
1 Q0 pid4    4 2.05 runid1
1 Q0 pid5    5 1.89 runid1

, 在哪里:

  • 第一列是主题(查询)编号。
  • 第二列当前未使用,应始终为“Q0”。
  • 第三列是在段落排序任务中检索到的段落的官方标识符,以及在文档排序任务中检索到的文档的标识符。
  • 第四列是检索到的段落/文档的排名。
  • 第五列显示生成排名的分数(整数或浮点)。该分数必须按降序(非递增)顺序排列。
  • 第六列是您要提交的运行的 ID。

作为官方评估集,我们提供了一组测试查询,其中的一个子集将用于最终评估。相同的测试查询用于段落检索和文档检索。与前几年不同的是,将使用不同的方法来构建段落排名和文档排名任务的测试集。

用于段落检索任务的测试集构建的方法将与前几年相同:NIST 将使用深度池并为最终测试集中的查询构建池。然后,NIST 评估员将使用多级判断对这些池中的段落进行标记,使我们能够衡量 NDCG。

文档排名任务的评估将使用从段落排名任务推断出的标签来完成,不会为此任务收集 NIST 的额外判断。这与今年文档排名任务的定义一致,该任务的重点是根据文档包含相关段落的可能性对文档进行排名。

TREC 提交的主要类型是自动,这意味着运行测试查询时不需要手动干预。这意味着您不应在看到测试查询后调整运行、重写查询、重新训练模型或进行任何其他类型的手动调整。理想的情况是,您只查看测试查询以检查它们是否正常运行(即没有错误),然后提交自动运行。但是,如果您希望有人参与您的运行循环,或者执行任何其他使用测试查询来调整模型或排名的操作,您可以将运行标记为手动。手动运行很有趣,我们可能会学到很多东西,但这些与我们的主要场景不同,我们的主要场景是自动响应未见过的查询的系统。

其他资源

我们正在分享以下额外资源,希望这些资源对社区有用。

数据集文件名文件大小记录数格式
分段文档集合msmarco_v2_doc_segmented.tar25.4GB124,131,414柏油
增强的段落集合msmarco_v2_passage_augmented.tar20.0GB138,364,198柏油

协调员

  • 尼克·克拉斯韦尔(微软)
  • 巴斯卡·米特拉(微软)
  • Emine Yilmaz(伦敦大学学院、亚马逊)
  • 丹尼尔·坎波斯(伊利诺伊大学厄巴纳-香槟分校)
  • 吉米·林(滑铁卢大学)

条款和条件

MS MARCO 和 ORCAS 数据集仅用于非商业研究目的,旨在促进人工智能和相关领域的进步,并且免费提供,无需扩展任何许可或其他知识产权。数据集“按原样”提供,没有任何保证,并且数据的使用存在风险,因为我们可能不拥有文档中的基本权利。对于与使用数据集相关的任何损害,我们不承担任何责任。反馈是自愿提供的,并且可以在我们认为合适的情况下使用。通过使用任何这些数据集,您将自动同意遵守这些条款和条件。一旦违反任何这些条款,您使用数据集的权利将自动终止。

如果您拥有任何可用文档,但不希望它们出现在此数据集中,请通过 ms-marco@microsoft.com 与我们联系。我们将相应地删除数据。如果您对数据集的使用或您的产品或服务中的任何研究成果有疑问,我们鼓励您自行进行独立的法律审查。如有其他问题,请随时与我们联系。

贡献

该项目欢迎贡献和建议。大多数贡献都要求您同意贡献者许可协议 (CLA),声明您有权并且实际上授予我们使用您的贡献的权利。有关详细信息,请访问 https://cla.opensource.microsoft.com。

当您提交拉取请求时,CLA 机器人将自动确定您是否需要提供 CLA 并适当地修饰 PR(例如,状态检查、评论)。只需按照机器人提供的说明进行操作即可。您只需使用我们的 CLA 在所有存储库中执行一次此操作。

该项目采用了微软开源行为准则。有关详细信息,请参阅行为准则常见问题解答或联系opencode@microsoft.com提出任何其他问题或意见。

Microsoft 和任何贡献者根据知识共享署名 4.0 国际公共许可证 向您授予此存储库中的 Microsoft 文档和其他内容的许可证,请参阅许可证文件,并根据MIT 许可证向您授予对存储库中任何代码的许可证,请参阅许可证代码文件 。

Microsoft 按“原样”许可 MS MARCO 标志,并且不就不侵权做出任何明示或暗示的陈述或保证。您必须根据 Microsoft 的要求立即删除对该标记的所有使用。

文档中引用的 Microsoft、Windows、Microsoft Azure 和/或其他 Microsoft 产品和服务可能是 Microsoft 在美国和/或其他国家/地区的商标或注册商标。此项目的许可证不授予您使用任何 Microsoft 名称、徽标或商标的权利。Microsoft 的一般商标指南可在http://go.microsoft.com/fwlink/?LinkID=254653上找到。

隐私信息可在https://privacy.microsoft.com/en-us/找到。

Microsoft 和任何贡献者保留所有其他权利,无论是根据其各自的版权、专利或商标,无论是通过暗示、禁止反言还是其他方式。

该网站是开源的。改进此页面。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/728170.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[LeetCode][8]【学习日记】实现字符串转换整数 (atoi)函数

题目 8. 字符串转换整数 (atoi) 请你来实现一个 myAtoi(string s) 函数,使其能将字符串转换成一个 32 位有符号整数(类似 C/C 中的 atoi 函数)。 函数 myAtoi(string s) 的算法如下: 读入字符串并丢弃无用的前导空格检查下一个字…

nginx代理minio客户端

错误方式 在点击桶名查看文件时, 会一直处于loading加载中 worker_processes 1; #设置 Nginx 启动的工作进程数为 1。events {worker_connections 1024; ##设置每个工作进程的最大并发连接数为 1024。 }http {include mime.types; #该文件定义了文件扩展名和 MIME 类型…

WPF中的DataContext

在WPF(Windows Presentation Foundation)中,DataContext是一个非常关键的概念,它是实现数据绑定的基础。DataContext是所有WPF控件都具有的一个依赖属性,它属于System.Windows.FrameworkElement类,这意味着…

PHP页面重定向

需要注意的是,在调用 header 函数进行重定向之前,确保没有输出任何内容,包括空格、换行符等。这行代码通常用于在处理表单提交或其他逻辑后,将用户引导到另一个页面。 一、指定几秒后进行重定向 例:表示1秒后页面重…

47. 全排列 II(力扣LeetCode)

文章目录 47. 全排列 II题目描述回溯算法 47. 全排列 II 题目描述 给定一个可包含重复数字的序列 nums ,按任意顺序 返回所有不重复的全排列。 示例 1: 输入:nums [1,1,2] 输出: [[1,1,2], [1,2,1], [2,1,1]] 示例 2&#xff…

Linux文件描述符剖析

文章目录 文件描述符文件描述符分配规则重定向软硬链接软链接(Symbolic Link):硬链接(Hard Link): 文件描述符 文件描述符(File Descriptor)是一个非负整数,用于标识打开…

Java开发从入门到精通(一):Java的基础语法高阶

Java大数据开发和安全开发 (一)Java的流程控制1.1 分支语句1.1.1 IF分支语句第一种IF语句第二种IF-ELSE语句第三种IF-ELSE IF-ELSE语句if语句使用的几个常见问题 1.1.2 switch分支语句switch分支的执行流程switch分支的导学案例:电子备忘录if、switch的比较&#xf…

从一个问题开始聊聊clickhouse的物化视图

【问题】 今天有A问我一个问题,我明明创建了一个物化视图,源表是有数据的,为什么查询物化视图就没有数据? 创建物化视图的SQL示意如下: CREATE MATERIALIZED VIEW schema1.test_mvon cluster clusterNameTO schema1…

Spring Mybatis Mapper 模糊查询的几种方法

在Spring结合Mybatis进行开发时,实现模糊查询是一个常见需求。在Mybatis中,LIKE查询可以通过多种方式实现,这取决于你的查询参数如何传递给Mybatis的SQL映射器。以下是实现模糊查询的几种常见方法: 1. 在Mapper接口中直接使用#{}…

【物联网应用案例】从0到N,智慧农业的数据价值

智慧农业全方位渗透到农业的每一个环节,云端解决方案更推动了研究人员、农艺师及农民间的密切协作,为研发企业提供了既经济又具扩展性的完美方案。 据IDC预计,到2036年,农场收集的数据量将增加800%以上,这凸显了农业数…

七.AV Foundation 视频播放 - 图片进度条

引言 播放器的功能功能已经十分完善了,接下来我们给它添加一些提升用户体验的功能。当前市面上的主流播放器几乎都有一个非常友善的功能,用户在退拽进度条的时候可以看见进度条所处进度的视频画面,这对于用户来说是一种直观而且便捷的体验。…

LeetCode刷题---二叉树展开为链表

官方题解:LeetCode官方题解 解题思想: 当根节点不为空时,从二叉树根节点开始遍历 判断当前节点是否有左节点,如果不存在左节点,则当前节点向右移一位 如果存在左节点,创建辅助节点指向左节点,判…

【Python】新手入门(9):数值和序列

🐍【Python】新手入门(9):数值和序列 🌈 个人主页:高斯小哥 🔥 高质量专栏:Matplotlib之旅:零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程&am…

百度智能云千帆大模型平台发布会定档3月21日,新模型已悄然上线

百度智能云官微日前宣布,百度智能云千帆产品发布会(AI Cloud Day)将于2024年3月21日在北京举行,届时将揭晓千帆ModelBuilder 和 AppBuilder 的最新产品进展,并发布系列新模型及开发工具组件。 记者在百度智能云官网上发…

O2O:Offline Meta-Reinforcement Learning with Online Self-Supervision

ICML 2022 paper Introduction 元强化学习(Meta RL)结合O2O。元RL需要学习一个探索策略收集数据,同时还需学习一个策略快速适应新任务。由于策略是在固定的离线数据集上进行元训练的,因此在适应探索策略收集的数据时,它可能表现得不可预测&…

97、我对 AI 模型调优的经验和认识

做 AI 算法调优一些年了,这些年中接触了不少模型,也做过不少在 ASIC 芯片进行模型加速的案例。 在接触的模型中,有一些模型有着非常奇怪的分支结构,有的还有奇怪的 tensor shape,还有的有这奇怪的自定义算法。但在模型优化时,为了将一个 AI 模型性能调到最优,也是无所不…

代码随想录三刷 day16 | 二叉树之104.二叉树的最大深度 559.n叉树的最大深度 111.二叉树的最小深度 222.完全二叉树的节点个数

三刷day16 104.二叉树的最大深度559.n叉树的最大深度111.二叉树的最小深度222.完全二叉树的节点个数 104.二叉树的最大深度 题目链接 解题思路: 本题中根节点的高度就是最大深度 二叉树节点的深度: 指从根节点到该节点的最长简单路径边的条数或者节点数…

飞桨AI框架安装和使用示例

飞桨AI框架安装和使用示例 飞桨PaddlePaddle是非常流行的国产AI框架,让我们一起来动手实践吧! 安装 飞桨安装参考页面:https://www.paddlepaddle.org.cn/install/quick?docurl/documentation/docs/zh/install/pip/linux-pip.html 在这个安…

AttributeError: ‘SFTPClient‘ object has no attribute ‘exists‘问题解决

在使用paramiko库进行SFTP操作时,如果遇到AttributeError: SFTPClient object has no attribute exists错误,这意味着你尝试调用的.exists()方法并不直接存在于paramiko.SFTPClient对象中。 虽然SFTPClient类没有内置的.exists()方法,但你可…

【S32K3 MCAL配置】-1.2-GPIO配置及其应用-DIO之高低电平输入-按键(基于MCAL)

"><--返回「Autosar_MCAL高阶配置」专栏主页--> 目录(共11页精讲,基于评估板: NXP S32K312EVB-Q172,手把手教你S32K3从入门到精通) 实现的架构:基于MCAL层 前期准备工作: