腾讯开源高质量人类运动视频的框架;通过音频指令修改图像;利用YOLO分析网球视频;Gemma-2中文微调模型

✨ 1: MimicMotion

MimicMotion 腾讯开源的通过姿态指导生成高质量任意长度人类运动视频的框架

在这里插入图片描述

MimicMotion 是一种可控视频生成框架,旨在生成高质量的任意长度人物动作视频,采用带有置信度的姿态引导,并通过区域损失放大来缓解图像失真。其主要特点包括丰富的细节、良好的时间连贯性和能够生成长视频。

地址:https://github.com/Tencent/MimicMotion

✨ 2: Tennis Analysis

该项目利用YOLO和CNN分析网球视频中的选手和球速。

在这里插入图片描述

网球分析项目通过分析视频中的网球选手来测量他们的速度、球拍击球速度以及击球次数。该项目使用YOLO技术检测选手和网球,并利用卷积神经网络(CNN)提取球场关键点。这个实践项目非常适合提升你的机器学习和计算机视觉技能。

地址:https://github.com/abdullahtarek/tennis_analysis

✨ 3: Gemma 2 9B Chinese Chat

Gemma-2-9B-Chinese-Chat是首个为中英文用户设计的指令微调语言模型,具备角色扮演等多种能力。

在这里插入图片描述

Gemma-2-9B-Chinese-Chat 是一个基于 Google/gemma-2-9b-it 构建的指令微调语言模型,专门为中英双语用户设计,具备角色扮演和工具使用等多种能力。它由王慎执和郑耀威开发,并采用了ORPO算法在超过10万条偏好数据集上进行训练,以改善原始模型在回答中文问题时使用英文回答和中英混合回答的问题。

这个模型支持 BF16 和 GGUF 格式,并提供了不同版本以便根据用户需求进行选择和使用。BF16 版本需要在Python环境中进行部署,而GGUF版本可以在 LM Studio 中使用。

Gemma-2-9B-Chinese-Chat在多个领域表现出色,例如角色扮演、函数调用和数学问题解决,同时也具备安全过滤功能,确保不会提供危害性的指导或信息。该模型在 Hugging Face 平台上有详细的使用指南和丰富的示例,展示其在写作、编程等方面的应用效果。用户若对模型感兴趣,可以通过具体代码片段和示例来体验模型的功能,并通过引用来标注使用权。

如果你喜欢这个模型,请在 Hugging Face 的仓库上赞一下,并在使用过程中引用相关信息。

地址:https://huggingface.co/shenzhi-wang/Gemma-2-9B-Chinese-Chat

✨ 4: Solos AirGo Vision

Solos AirGo Vision智能眼镜对抗Meta的Ray-Ban,通过支持ChatGPT-4o提供更先进的AI功能。

在这里插入图片描述

Solos AirGo Vision是Solos公司推出的一款智能眼镜,旨在挑战Meta的Ray-Ban智能眼镜。其主要特点包括:

先进的AI集成:AirGo Vision是首款使用ChatGPT-4o的智能眼镜,预计提供比竞争对手更先进的AI功能。用户还可以切换到Google的Gemini或Anthropic的Claude AI模型,增加灵活性和未来适应性。

摄像头和交互功能:内置前置摄像头,支持视觉搜索和互动功能,能够提供实时信息,如购物总结、导航和烹饪食谱建议等。虽然可以拍照,但暂不支持视频录制。

可换镜框系统:用户可以替换框架,去掉摄像头,仅保留扬声器和LED通知功能,或者将透明镜片换为太阳镜。

价格和上市时间:基本款(不含摄像头的版本)售价为249美元,含摄像头的版本价格尚未公布。额外的镜框起售价为89美元。预计将于2024年7月上市。

这款眼镜不仅在设计上与Meta的Ray-Ban有相似之处,还在价格上具有竞争优势,预示着Solos在智能眼镜市场上将获得更大的影响力。

地址:https://littwebsite.com/2024/07/01/solos-airgo-vision-launch-features-photos-price/

✨ 5: AAIELA

AAIELA允许用户通过音频指令修改图像,实现语言与视觉的无缝转换。

在这里插入图片描述

AAIELA项目旨在让用户通过简单的音频指令来修改图像。它结合了开放源码的AI模型,包括计算机视觉、语音转文本、大型语言模型(LLMs)和文本到图像的修复,创造了一种将口语与视觉转换无缝连接的编辑体验。

地址:https://github.com/ShaShekhar/aaiela



更多AI工具,参考国内AiBard123,Github-AiBard123 公众号:每日AI新工具

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/39071.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++视觉开发 三.缺陷检测

一.距离变换 1.概念和功能 距离变换是一种图像处理技术,用于计算图像中每个像素到最近的零像素(背景像素)的距离。它常用于图像分割、形态学操作和形状分析等领域。它计算图像中每个像素到最近的零像素(背景像素)的距…

LeetCode 176, 289, 437

目录 176. 第二高的薪水题目链接表要求知识点思路代码 289. 生命游戏题目链接标签简单版思路代码 进阶版思路代码 437. 路径总和 III题目链接标签思路代码 176. 第二高的薪水 题目链接 176. 第二高的薪水 表 表Employee的字段为id和salary。 要求 查询并返回 Employee 表…

苍穹外卖--sky-take-out(五)前端

大部分笔记都是写在语雀的,这是一次性从本人语雀复制过来的,可能结构有些错乱 基础创建 环境要求 node.js npm Vue CLI 创建前端工程 使用vue ui命令创建 项目结构 启动项目 打开命令行窗口 快捷键ctrlj 或者 运行 输入:npm run ser…

010-GeoGebra基础篇-动态验证三角形外接圆的圆心是否可以位于三角形的外部

接下来我们将进行一些稍微高级一点操作,一边学习新东西的同时,也开始对数学、物理等内容的研究。 目录 一、项目截图二、涉及内容三、问题设置1. 问题提出2. 验证方案 三、做图步骤1. 绘制定点A、B;2. 绘制动点C;(1&am…

万界星空科技铜管加工行业MES系统解决方案

一、行业背景与挑战 随着铜管加工行业的快速发展,传统的管理模式已难以满足日益增长的生产需求。为满足市场的高效率、高质量、低成本要求,企业急需一套智能化的管理系统来提升生产效率、优化资源配置和确保产品质量。因此,我们针对铜管加工行…

常用的限流算法有哪些?你听说过几种?

限流,就是指限制流量请求的频次。 在高并发情况下,它是一种保护系统的策略,避免了在流量高峰时系统崩溃,造成系统的不可用。 常见的限流算法有: 计数器限流算法滑动窗口限流算法漏桶限流算法令牌桶限流算法 1. 计数器…

【Python程序开发系列】教你使用Docker部署一个简单的Python应用程序(案例+源码)

这是我的第313篇原创文章。 一、引言 Docker 对于程序员来说,其实和Git差不多,基本上属于一个必备工具。如果你想使用这个工具,你就必须安装这个应用工具,至于在不同操作系统上安装Docker的方式网上有很多教程,这里不…

每天五分钟深度学习:解决for循环效率慢的关键在于向量化

本文重点 上一节课程中,我们学习了多样本的线性回归模型,但是我们的伪代码实现中使用了大量的for循环,这样代码的问题是效率很低。为了克服这一瓶颈,向量化技术应运而生,成为提升程序执行效率、加速数据处理速度的重要手段。 向量化技术概述 向量化(Vectorization)是…

MySQL-核心知识要点

1、索引的数据结构-Btree BTree的优势: B树的内节点无data,一个节点可以存储更多的K-V对。在构造树时,需要的内节点会更少,那么树的层级也会越低。查询一条数据时,1. 扫描的层级低,扫描过的节点更少&…

最优化方法Python计算:标准型线性规划的轴转操作

标准型线性规划 { minimize c ⊤ x s.t. A x b x ≥ o ( 1 ) \begin{cases} \text{minimize}\quad\boldsymbol{c}^\top\boldsymbol{x}\\ \text{s.t.}\quad\quad\boldsymbol{Ax}\boldsymbol{b}\\ \quad\quad\quad\quad\boldsymbol{x}\geq\boldsymbol{o} \end{cases}\quad\quad…

【netty系列-04】反应堆模式的种类和具体实现

Netty系列整体栏目 内容链接地址【一】深入理解网络通信基本原理和tcp/ip协议https://zhenghuisheng.blog.csdn.net/article/details/136359640【二】深入理解Socket本质和BIOhttps://zhenghuisheng.blog.csdn.net/article/details/136549478【三】深入理解NIO的基本原理和底层…

Vue3认识Vue插件

通常我们向Vue全局添加一些功能时,会采用插件的模式,它有两种编写方式: 对象类型:一个对象,但是必须包含一个install 的函数,该函数会在安装插件时执行;函数类型:一个function,这个函数会在安装插件时自动执行; 插件…

大数据平台之CDH

Clouderas Distribution Including Apache Hadoop (CDH) 是 Cloudera 提供的企业级 Hadoop 发行版,包含了 Hadoop 及其生态系统中的各种组件,并进行了优化和增强,适合在生产环境中使用。以下是 CDH 版本 Hadoop 的详细介绍: 概述…

数字化转型中,数字化如何重塑中小企业发展力?

引言:当前,我国中小微企业数字化转型处于“不平衡、不充分、不规范”阶段,普遍面临“不会转”“不能转”“不敢转”的困境。数字化转型可以帮助企业突破这些困境,实现更大的发展。更进一步,数字化转型是中小企业高质量…

学习笔记——动态路由——IS-IS中间系统到中间系统(基本概念)

二、IS-IS基本概念 1、IS-IS概述 IS-IS是ISO定义的OSI协议栈中的无连接网络服务(ConnectionLess Network Service,CLNS)的一部分,IS-IS是一种链路状态路由协议,IS-IS与OSPF在许多方面非常相似,例如,运行IS-IS协议的直…

4.BeanFactory

可以看出BeanFactory表面上只有getBean相关的方法。 实际上控制反转、基本的依赖注入、Bean的生命周期的各种功能,都是由BeanFactory的实现类来实现的。(DefaultListableBeanFactory) DefaultListableBeanFactory管理单例对象DefaultSinglet…

压缩和混淆

随着Js文件体积的增大和前后端交互增多,为了加快http传输速度并提高接口的安全性,出现了很多的压缩工具和混淆加密工具。 **代码压缩:**在对用户体验造成影响的因素中,最重要的是“网页打开速度”,即资源加载速度和页…

杨万里,诚斋体的开创者

杨万里,字廷秀,号诚斋,生于南宋绍兴元年(公元1127年),卒于南宋庆元二年(公元1206年),享年79岁。在中国古代文学的璀璨星河中,南宋诗人杨万里以其清新脱俗、贴…

C#面:现有一个整数number,请写一个方法判断这个整数是否是2的N次方

要判断一个整数是否是2的N次方,可以使用位运算来实现。一个整数如果是2的N次方,那么它的二进制表示中只有一位是1,其余位都是0。可以通过将这个整数与它减去1的结果进行按位与运算,如果结果为0,则说明这个整数是2的N次…

Android- Framework 非Root权限实现修改hosts

一、背景 修改system/etc/hosts,需要具备root权限,而且remount后,才能修改,本文介绍非root状态下修改system/etc/hosts方案。 环境:高通 Android 13 二、方案 非root,system/etc/hosts只有只读权限&…