【第十二届“泰迪杯”数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索—更新(正式比赛)

【第十二届“泰迪杯”数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索—更新(正式比赛)

往期链接:

【第十二届“泰迪杯”数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索—解题全流程(持续更新)
【第十二届“泰迪杯”数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索—解题全流程(论文更新)

全家桶更新内容:

全部代码,制作数据、训练权重,结果,视频:

在这里插入图片描述

其中,LXS文件夹,代表所有的jupyter代码以及Chinese clip模型代码,基于服务器就可以直接运行,(找我分享服务器镜像,不用再配置环境了)

视频为边做边录制,全程记录训练预测、验证过程。

在这里插入图片描述

全家桶获取

可以微信:zgr421136咨询 (微信优惠-5)
可以QQ交流群:458351399可以直接爱发电平台:
https://afdian.net/item/8cc7f3dae8d111eeb7b05254001e7c00

良心制作,质量保证,售后解答。

单品一:

单品一包含全套代码(找我分享服务器镜像,无需配置环境,一键运行),教程视频,训练的权重与提交结果
获取链接:

https://afdian.net/item/e579256ceead11ee9b7352540025c377

单品二:

单品二包含需要提交结果(28号的提交测试结果csv也会更新)与完结论文
获取链接:

https://afdian.net/item/4a9d076aeeae11ee908b52540025c377

训练、预测展示:

训练,

(基于小的base16,预训练权重模型训练的,4w条为训练集,1w条为验证集)

只训练了44轮,一轮训练花费15分钟,显存只占6GB左右。

在这里插入图片描述

预测结果:

说明:这是训练了44轮,验证效果不算太理想的第一版模型的预测结果。

(对问题二,文本预测检索图片,问题三,图片预测检索文本的部分结果展示),此时验证集的召回验证recall@k5值为60。

在这里插入图片描述

在这里插入图片描述

图片检索文本结果部分展示:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

后续计划:

今晚将进行选择最大最全面的中文预训练模型,对正式数据再进行训练(很费时间,很费资源。本地电脑是一定搞不了的,或服务器或者学校实验室服务器。)

  1. 选择最大预训练权重文件进行训练
  2. 训练50轮
  3. 论文编写改进方向优化指导.txt

第二版更新将直接上传售后群qq文件夹里,以及百度网盘链接的方式。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/824123.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

设计模式-访问者模式(Visitor)

1. 概念 访问者模式(Visitor Pattern)是一种行为型设计模式。是一种将数据操作与数据结构分离的设计模式,其主要目的是将数据结构与数据操作解耦。 2. 原理结构图 图1 Visitor(访问者):接口或抽象类&am…

47.基于SpringBoot + Vue实现的前后端分离-校园外卖服务系统(项目 + 论文)

项目介绍 本站是一个B/S模式系统,采用SpringBoot Vue框架,MYSQL数据库设计开发,充分保证系统的稳定性。系统具有界面清晰、操作简单,功能齐全的特点,使得基于SpringBoot Vue技术的校园外卖服务系统设计与实现管理工作…

【前端Vue】Vue从0基础完整教程第7篇:组件化开发,组件通信【附代码文档】

Vue从0基础到大神学习完整教程完整教程(附代码资料)主要内容讲述:vue基本概念,vue-cli的使用,vue的插值表达式,{{ gaga }},{{ if (obj.age > 18 ) { } }},vue指令,综合…

Python基于Django搜索的目标站点内容监测系统设计,附源码

博主介绍:✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇…

全国产化无风扇嵌入式车载电脑在车队管理嵌入式车载行业应用

车队管理嵌入式车载行业应用 车队管理方案能有效解决车辆繁多管理困难问题,配合调度系统让命令更加精确有效执行。实时监控车辆状况、行驶路线和位置,指导驾驶员安全有序行驶,有效降低保险成本、事故概率以及轮胎和零部件的磨损与损坏。 方…

【算法刷题day25】Leetcode:216.组合总和III 17.电话号码的字母组合

216.组合总和III 文档链接:[代码随想录] 题目链接:216.组合总和III 题目: 找出所有相加之和为 n 的 k 个数的组合,且满足下列条件: 只使用数字1到9 每个数字 最多使用一次 返回 所有可能的有效组合的列表 。该列表不能…

关于DDD设计模式的各种疑问:什么是DDD架构?

关于DDD架构中的各种概念,请先参考一篇文章:什么是DDD(领域驱动设计)? 这是我见过最容易理解的一篇关于DDD 的文章了 下面是关于这个架构的各种说明。 1 DDD和其他架构模式的区别(建议看完文章再看此问题…

C语言程序设计每日一练(4)

完全平方数 首先,我们需要明确什么是完全平方数。完全平方数是指一个整数,它可以表示为另一个整数的平方。例如,1、4、9、16等都是完全平方数,因为它们分别是1、2、3、4的平方。 现在,让我们回到这个问题。我们知道这…

LeetCode刷题总结 | 图论3—并查集

并查集理论基础 1.背景 首先要知道并查集可以解决什么问题呢? 并查集常用来解决连通性问题。大白话就是当我们需要判断两个元素是否在同一个集合里的时候,我们就要想到用并查集。 并查集主要有两个功能: 将两个元素添加到一个集合中。判…

安装GPT 学术优化 (GPT Academic)@FreeBSD

GPT 学术优化 (GPT Academic)是一个非常棒的项目 可以帮助我们完成中科院的一些日常工作。 官网:GitHub - binary-husky/gpt_academic: 为GPT/GLM等LLM大语言模型提供实用化交互接口,特别优化论文阅读/润色/写作体验,模块化设计,…

【Linux系列】Ctrl + R 的使用

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

EelasticSearch的docker安装-----》es客户端使用!!!

1.Docker安装 docker run -d --name es7 -e ES_JAVA_POTS"-Xms256m -Xmx256m" -e "discovery.typesingle-node" -v /opt/es7/data/:/usr/share/elasticsearch/data -p 9200:9200 -p 9300:9300 elasticsearch:7.14.02.客户端UI工具,Edge浏览器…

STM32之HAL开发——CubeMX串行Flash文件系统源码讲解

前提 本次源码讲解是根据FatFS文件系统使用的流程进行 注册设备函数 uint8_t FATFS_LinkDriver(Diskio_drvTypeDef *drv, char *path) {return FATFS_LinkDriverEx(drv, path, 0); } ------------------------------------------------------------------------------------…

MySQL学习-非事务相关的六大日志、InnoDB的三大特性以及主从复制架构

一. 六大日志 慢查询日志:记录所有执行时间超过long_query_time的查询,方便定位并优化。 # 查询当前慢查询日志状态 SHOW VARIABLES LIKE slow_query_log; #启用慢查询日志 SET GLOBAL slow_query_log ON; #设置慢查询文件位置 SET GLOBAL slow_query_log_file …

Linux(磁盘管理与文件系统)

目录 1. 磁盘基础 1.1 磁盘结构 1.2 MBR 1.3 磁盘分区结构 2. 文件系统类型 2.1 XFS文件系统 2.2 SWAP 2.3 fdisk命令 2.4 创建新硬盘 3.创建文件系统 3.1 mkfs 3.2 挂载、卸载文件系统 3.3 查看磁盘使用情况 1. 磁盘基础 1.1 磁盘结构 磁盘的物理结构 盘片:硬…

工业相机曝光、增益、自动曝光、自动增益参数功能介绍和设置指南

工业相机曝光、增益、自动曝光、自动增益参数功能介绍和设置指南 工业相机基本参数介绍工业相机曝光、增益、亮度等介绍工业相机如何设置曝光参数工业相机如何设置增益参数 工业相机基本参数介绍 在使用工业相机时,曝光、增益、亮度和信噪比之间有密切的相互关系。…

大数据:【学习笔记系列】flink和spark的区别

Apache Flink 和 Apache Spark 是两种流行的大数据处理框架,它们在架构、性能和使用场景等方面都有各自的特点和优势。下面是对 Flink 和 Spark 主要区别的详细对比: 1. 处理方式:流处理 vs 微批处理 Apache Flink: Flink 被设计…

35. UE5 RPG制作火球术技能

接下来,我们将制作技能了,总算迈进了一大步。首先回顾一下之前是如何实现技能触发的,然后再进入正题。 如果想实现我之前的触发方式的,请看此栏目的31-33篇文章,讲解了实现逻辑,这里总结一下: …

微服务拆分:打造高性能、高扩展的未来架构

目录 一、微服务介绍 二、主链路规划 2.1 业务完整性 2.2 转化率重因子 2.3 流量端占比 2.4 现金水库 三、如何识别主链路 3.1 导流端 3.2 转化端 3.3 漏斗中部:订单转化 3.4 漏斗底部:下单 四、总结 一、微服务介绍 单体应用将所有的功能都…

微服务架构与Dubbo

一、微服务架构 微服务架构是一种架构概念,旨在通过将功能分解到各个离散的服务中以实现对解决方案的解耦。 分布式系统式若干独立系统的集合,但是用户使用起来好像是在使用一套系统。 和微服务对应的是单体式开发,即所有的功能打包在一个WAR…