腾讯开源高质量人类运动视频的框架;通过音频指令修改图像;利用YOLO分析网球视频;Gemma-2中文微调模型

✨ 1: MimicMotion

MimicMotion 腾讯开源的通过姿态指导生成高质量任意长度人类运动视频的框架

在这里插入图片描述

MimicMotion 是一种可控视频生成框架,旨在生成高质量的任意长度人物动作视频,采用带有置信度的姿态引导,并通过区域损失放大来缓解图像失真。其主要特点包括丰富的细节、良好的时间连贯性和能够生成长视频。

地址:https://github.com/Tencent/MimicMotion

✨ 2: Tennis Analysis

该项目利用YOLO和CNN分析网球视频中的选手和球速。

在这里插入图片描述

网球分析项目通过分析视频中的网球选手来测量他们的速度、球拍击球速度以及击球次数。该项目使用YOLO技术检测选手和网球,并利用卷积神经网络(CNN)提取球场关键点。这个实践项目非常适合提升你的机器学习和计算机视觉技能。

地址:https://github.com/abdullahtarek/tennis_analysis

✨ 3: Gemma 2 9B Chinese Chat

Gemma-2-9B-Chinese-Chat是首个为中英文用户设计的指令微调语言模型,具备角色扮演等多种能力。

在这里插入图片描述

Gemma-2-9B-Chinese-Chat 是一个基于 Google/gemma-2-9b-it 构建的指令微调语言模型,专门为中英双语用户设计,具备角色扮演和工具使用等多种能力。它由王慎执和郑耀威开发,并采用了ORPO算法在超过10万条偏好数据集上进行训练,以改善原始模型在回答中文问题时使用英文回答和中英混合回答的问题。

这个模型支持 BF16 和 GGUF 格式,并提供了不同版本以便根据用户需求进行选择和使用。BF16 版本需要在Python环境中进行部署,而GGUF版本可以在 LM Studio 中使用。

Gemma-2-9B-Chinese-Chat在多个领域表现出色,例如角色扮演、函数调用和数学问题解决,同时也具备安全过滤功能,确保不会提供危害性的指导或信息。该模型在 Hugging Face 平台上有详细的使用指南和丰富的示例,展示其在写作、编程等方面的应用效果。用户若对模型感兴趣,可以通过具体代码片段和示例来体验模型的功能,并通过引用来标注使用权。

如果你喜欢这个模型,请在 Hugging Face 的仓库上赞一下,并在使用过程中引用相关信息。

地址:https://huggingface.co/shenzhi-wang/Gemma-2-9B-Chinese-Chat

✨ 4: Solos AirGo Vision

Solos AirGo Vision智能眼镜对抗Meta的Ray-Ban,通过支持ChatGPT-4o提供更先进的AI功能。

在这里插入图片描述

Solos AirGo Vision是Solos公司推出的一款智能眼镜,旨在挑战Meta的Ray-Ban智能眼镜。其主要特点包括:

先进的AI集成:AirGo Vision是首款使用ChatGPT-4o的智能眼镜,预计提供比竞争对手更先进的AI功能。用户还可以切换到Google的Gemini或Anthropic的Claude AI模型,增加灵活性和未来适应性。

摄像头和交互功能:内置前置摄像头,支持视觉搜索和互动功能,能够提供实时信息,如购物总结、导航和烹饪食谱建议等。虽然可以拍照,但暂不支持视频录制。

可换镜框系统:用户可以替换框架,去掉摄像头,仅保留扬声器和LED通知功能,或者将透明镜片换为太阳镜。

价格和上市时间:基本款(不含摄像头的版本)售价为249美元,含摄像头的版本价格尚未公布。额外的镜框起售价为89美元。预计将于2024年7月上市。

这款眼镜不仅在设计上与Meta的Ray-Ban有相似之处,还在价格上具有竞争优势,预示着Solos在智能眼镜市场上将获得更大的影响力。

地址:https://littwebsite.com/2024/07/01/solos-airgo-vision-launch-features-photos-price/

✨ 5: AAIELA

AAIELA允许用户通过音频指令修改图像,实现语言与视觉的无缝转换。

在这里插入图片描述

AAIELA项目旨在让用户通过简单的音频指令来修改图像。它结合了开放源码的AI模型,包括计算机视觉、语音转文本、大型语言模型(LLMs)和文本到图像的修复,创造了一种将口语与视觉转换无缝连接的编辑体验。

地址:https://github.com/ShaShekhar/aaiela



更多AI工具,参考国内AiBard123,Github-AiBard123 公众号:每日AI新工具

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/39071.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++视觉开发 三.缺陷检测

一.距离变换 1.概念和功能 距离变换是一种图像处理技术,用于计算图像中每个像素到最近的零像素(背景像素)的距离。它常用于图像分割、形态学操作和形状分析等领域。它计算图像中每个像素到最近的零像素(背景像素)的距…

苍穹外卖--sky-take-out(五)前端

大部分笔记都是写在语雀的,这是一次性从本人语雀复制过来的,可能结构有些错乱 基础创建 环境要求 node.js npm Vue CLI 创建前端工程 使用vue ui命令创建 项目结构 启动项目 打开命令行窗口 快捷键ctrlj 或者 运行 输入:npm run ser…

010-GeoGebra基础篇-动态验证三角形外接圆的圆心是否可以位于三角形的外部

接下来我们将进行一些稍微高级一点操作,一边学习新东西的同时,也开始对数学、物理等内容的研究。 目录 一、项目截图二、涉及内容三、问题设置1. 问题提出2. 验证方案 三、做图步骤1. 绘制定点A、B;2. 绘制动点C;(1&am…

万界星空科技铜管加工行业MES系统解决方案

一、行业背景与挑战 随着铜管加工行业的快速发展,传统的管理模式已难以满足日益增长的生产需求。为满足市场的高效率、高质量、低成本要求,企业急需一套智能化的管理系统来提升生产效率、优化资源配置和确保产品质量。因此,我们针对铜管加工行…

常用的限流算法有哪些?你听说过几种?

限流,就是指限制流量请求的频次。 在高并发情况下,它是一种保护系统的策略,避免了在流量高峰时系统崩溃,造成系统的不可用。 常见的限流算法有: 计数器限流算法滑动窗口限流算法漏桶限流算法令牌桶限流算法 1. 计数器…

【Python程序开发系列】教你使用Docker部署一个简单的Python应用程序(案例+源码)

这是我的第313篇原创文章。 一、引言 Docker 对于程序员来说,其实和Git差不多,基本上属于一个必备工具。如果你想使用这个工具,你就必须安装这个应用工具,至于在不同操作系统上安装Docker的方式网上有很多教程,这里不…

每天五分钟深度学习:解决for循环效率慢的关键在于向量化

本文重点 上一节课程中,我们学习了多样本的线性回归模型,但是我们的伪代码实现中使用了大量的for循环,这样代码的问题是效率很低。为了克服这一瓶颈,向量化技术应运而生,成为提升程序执行效率、加速数据处理速度的重要手段。 向量化技术概述 向量化(Vectorization)是…

MySQL-核心知识要点

1、索引的数据结构-Btree BTree的优势: B树的内节点无data,一个节点可以存储更多的K-V对。在构造树时,需要的内节点会更少,那么树的层级也会越低。查询一条数据时,1. 扫描的层级低,扫描过的节点更少&…

【netty系列-04】反应堆模式的种类和具体实现

Netty系列整体栏目 内容链接地址【一】深入理解网络通信基本原理和tcp/ip协议https://zhenghuisheng.blog.csdn.net/article/details/136359640【二】深入理解Socket本质和BIOhttps://zhenghuisheng.blog.csdn.net/article/details/136549478【三】深入理解NIO的基本原理和底层…

数字化转型中,数字化如何重塑中小企业发展力?

引言:当前,我国中小微企业数字化转型处于“不平衡、不充分、不规范”阶段,普遍面临“不会转”“不能转”“不敢转”的困境。数字化转型可以帮助企业突破这些困境,实现更大的发展。更进一步,数字化转型是中小企业高质量…

学习笔记——动态路由——IS-IS中间系统到中间系统(基本概念)

二、IS-IS基本概念 1、IS-IS概述 IS-IS是ISO定义的OSI协议栈中的无连接网络服务(ConnectionLess Network Service,CLNS)的一部分,IS-IS是一种链路状态路由协议,IS-IS与OSPF在许多方面非常相似,例如,运行IS-IS协议的直…

4.BeanFactory

可以看出BeanFactory表面上只有getBean相关的方法。 实际上控制反转、基本的依赖注入、Bean的生命周期的各种功能,都是由BeanFactory的实现类来实现的。(DefaultListableBeanFactory) DefaultListableBeanFactory管理单例对象DefaultSinglet…

杨万里,诚斋体的开创者

杨万里,字廷秀,号诚斋,生于南宋绍兴元年(公元1127年),卒于南宋庆元二年(公元1206年),享年79岁。在中国古代文学的璀璨星河中,南宋诗人杨万里以其清新脱俗、贴…

Android- Framework 非Root权限实现修改hosts

一、背景 修改system/etc/hosts,需要具备root权限,而且remount后,才能修改,本文介绍非root状态下修改system/etc/hosts方案。 环境:高通 Android 13 二、方案 非root,system/etc/hosts只有只读权限&…

机器学习python实践——关于管道模型Pipeline和网格搜索GridSearchCV的一些个人思考

最近在利用python跟着指导书进行机器学习的实践,在实践中使用到了Pipeline类方法和GridSearchCV类方法,并且使用过程中发现了一些问题,所以本文主要想记录并分享一下个人对于这两种类方法的思考,如果有误,请见谅&#…

【微服务】微服务之Feign 与 Ribbon

文章目录 强烈推荐引言优点Feign示例什么是Ribbon?Ribbon 的优点Netflix Feign 和 Ribbon整合Feign 与 Ribbon 的关系Feign 与 Ribbon 结合使用的示例配置文件(application.yml)说明: Feign 与 Ribbon 结合使用的应用场景1. 动态服…

物联网的技术和应用有哪些?

随着科技的飞速发展,物联网已经成为连接世界的重要纽带,塑造着我们未来的生活。我们一起深入探索物联网的前沿技术和前瞻性应用,一窥未来的可能性。 获取物联网解决方案,YesPMP平台一站式物联网开发服务。 提示:智慧家…

图形的搭建

例一: 输入描述: 多组输入,一个整数(2~20),表示输出的行数,也表示组成“X”的反斜线和正斜线的长度。 输出描述: 针对每行输入,输出用“*”组成的X形图案。 示例一&…

爬数据是什么意思?

爬数据的意思是:通过网络爬虫程序来获取需要的网站上的内容信息,比如文字、视频、图片等数据。网络爬虫(网页蜘蛛)是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。 学习一些爬数据的知识有什么用呢&#x…

IPIDEA代理IP助力高效数据采集

IPIDEA代理IP助力高效数据采集 文章目录 IPIDEA代理IP助力高效数据采集📑前言一、爬虫数据采集痛点二、代理IP解决爬虫痛点2.1 为什么可以2.2 选择代理IP的关键因素 三、IPIDEA海外IP代理的优势3.1 IPIDEA的显著优势3.2 IPIDEA的代理类型及应用 四、IPIDEA爬虫实战4…