机器学习周刊 第4期:动手实战人工智能、计算机科学热门论文、免费的基于ChatGPT API的安卓端语音助手、每日数学、检索增强 (RAG) 生成技术综述

LLM开发者必读论文:检索增强(RAG)生成技术综述!

目录:

  • 1、动手实战人工智能 Hands-on Al
  • 2、huggingface的NLP、深度强化学习、语音课
  • 3、Awesome Jupyter
  • 4、计算机科学热门论文
  • 5、LLM开发者必读论文:检索增强 (RAG) 生成技术综述
  • 6、Apple 公布了多模态大型语言模型 Ferret
  • 7、免费的基于ChatGPT API的安卓端语音助手
  • 8、每日数学
  • 9、WhisperLive:接近实时的 Whisper 实现
  • 10、Unsloth:大模型训练速度和效率加速工具
  • 11、最后推荐三个AI工具

1、动手实战人工智能 Hands-on AI

地址:https://ai.huhuhang.com/intro

这个《动手实战人工智能 Hands-on AI》写的相当不错,作者用 Jupyter Notebook编写了这个教程,参考了《机器学习方法》,《深度学习入门》,西瓜书,花花书等,剖析和推导每一个基础算法的原理,将数学过程写出来了,同时基于 Python 代码对公式进行实现,做到公式和代码的一一对应。

我把章节简单整理成了这个思维导图,大家可以结合自身情况,挑选感兴趣的章节阅读。

动手实战人工智能 Hands-on AI

2、huggingface的NLP、深度强化学习、语音课

地址:https://huggingface.co/learn

HuggingFace开放了NLP、深度强化学习、基于transformer的语音框架三门课,看了每一课的结构,比较偏实践,蛮不错的。

我最近对语音比较感兴趣,加上正在学点前端,所以就把语音课拿出来,做了个文档型网页,准备一边学,一边翻译。

感兴趣的同学可以一起翻译:https://hf-audio.zhanglearning.com/

3、Awesome Jupyter

地址:https://github.com/markusschanta/awesome-jupyter

这个项目收录了精选的Jupyter项目、库和资源列表,已经更新了很多年,我比较喜欢可视化部分,认识了很多好玩的库。

4、计算机科学热门论文

地址https://trendingpapers.com/

trendingpapers这个网站每日更新计算机科学最新、最火的论文,分门别类,查找起来非常方便。打开感兴趣的论文,可以直接跳转到arxiv查看pdf,也可以点击Find similar找到该方向类似的论文。

5、LLM开发者必读论文:检索增强(RAG)生成技术综述

论文:https://arxiv.org/abs/2312.10997

检索增强利用外部知识库来丰富大语言模型的上下文并生成答案,从而提升了答案的准确度。论文深入探讨并梳理了检索增强型生成( RAG)技术,非常全面。RAG是LLM领域最火爆的方向了,我在公众号中曾推荐过吴恩达老师最近的一个短课:吴恩达最新短课,构建和评估高级 RAG 应用程序,附中英字幕,感兴趣想要学习RAG,这个短课,建议作为首选。

6、 Apple 公布了多模态大型语言模型 Ferret

地址:github.com/apple/ml-ferret

苹果最新公布的 Ferret 是一种新的多模态大型语言模型(MLLM),能够理解图像中任何形状或粒度的空间参考,并准确地理解词汇描述。

苹果开源了训练、微调、模型代码和模型权重:https://github.com/apple/ml-ferret/

可以下载、安装后一个命令运行gradio前端

python -m ferret.serve.gradio_web_server --controller http://localhost:10000 --model-list-mode reload --add_region_feature

7、免费的基于ChatGPT API的安卓端语音助手

地址:https://github.com/Skythinker616/gpt-assistant-android

这个项目是免费的、基于ChatGPT API的安卓端语音助手,可通过音量键唤起并进行语音交流,支持联网、Vision拍照识图、连续对话、提问模板、3.5/4.0接口、Markdown渲染等功能

8、每日数学

地址:https://www.theoremoftheday.org/

这个网站每天更新一个数学定理(或引理、法则、公式或恒等式),每一个都足以装饰数学殿堂的墙壁。

每个定理都被设计得尽可能让广大观众能够欣赏,如果某个定理的表述看起来难以理解,可以继续查看附带的图形解释、巧妙的动画。

9、WhisperLive:接近实时的 OpenAI Whisper 实现

地址:https://github.com/collabora/WhisperLive

这个项目是一个实时转录应用程序,它使用 OpenAI Whisper 模型将语音输入(来自麦克风的现场音频输入 or预先录制的音频文件 )转换为文本输出。

10、Unsloth

地址:https://github.com/unslothai/unsloth

训练大语言模型往往会消耗大量算力和时间,Unsloth开源的这个项目可以加快训练速度和效率。

  • 支持 Llama 7b、13b、70b、CodeLlama 34b、Mistral 7b、TinyLlama 以及所有 Llama 架构!
  • Llama 7b Colab T4 实例在 1 T4 上比原来快 2 倍,使用的 VRAM 减少了 43%(8.4GB)LAION 数据集。Alpaca T4 实例在 1 T4 上也是快了 2 倍,使用了 6.4GB VRAM。
  • Mistral 7b Colab A100 实例在 1 A100 上快了 2.2 倍,使用的 VRAM 减少了 62%(12.4GB)。Colab T4 实例
  • CodeLlama 34b Colab 实例不会出现 OOM,速度提升了 1.9 倍,使用的 VRAM 减少了 32%(27GB)。
  • Kaggle 上使用 2 Tesla T4 的 Alpaca 训练速度提高了 5.28 倍。Kaggle 实例
  • 所有内核均使用 OpenAI 的 Triton 语言编写。
  • 准确率无损失 - 没有使用近似方法 - 全部精确。
  • 无需更换硬件。支持自 2018 年以来的 NVIDIA GPU。最低 CUDA 计算能力 7.0(V100、T4、Titan V、RTX 20、30、40x、A100、H100、L40 等)检查您的 GPU
  • 在 Linux 和 Windows 通过 WSL 上运行。
  • 实验性支持 DPO(直接偏好优化)!
  • 支持通过 bitsandbytes 进行 4bit 和 16bit QLoRA / LoRA 微调。
  • 开源版本的训练速度提高了 5 倍,或者您可以查看 Unsloth Pro 和 Max 代码路径,以获得高达 30 倍的训练速度提升!

11、最后推荐三个AI工具

PIA:照片转动漫风格工具,可线上试用

地址:https://huggingface.co/spaces/Leoxing/PIA

带web界面的声音克隆工具

地址:https://github.com/jianchang512/clone-voice

cloudflare-ai-web

地址:https://github.com/Jazee6/cloudflare-ai-web

支持GeminiPro Vision / Cloudflare Workers AI / ChatGPT的融合Web平台

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/613380.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python基础(二十四、JSON和pyecharts)

文章目录 一、JSON1.JSON介绍2.JSON格式数据转化3.示例 二、pyecharts1.安装pyecharts包2.查看官方示例 三、开发示例 一、JSON 1.JSON介绍 JSON是一种轻量级的数据交互格式,采用完全独立于编程语言的文本格式来存储和表示数据(就是字符串)…

探索未来餐饮:构建创新连锁餐饮系统的技术之旅

随着数字化时代的发展,连锁餐饮系统的设计和开发不再仅仅关乎订单处理,更是一场充满技术创新的冒险。在本文中,我们将深入研究连锁餐饮系统的技术实现,带你探索未来餐饮业的数字化美食之旅。 1. 构建强大的后端服务 在设计连锁…

计算机网络-2021期末考试解析

【前言】 这个是计算机网络的正式试卷了。从形式上基本上跟今年考的一致。很具有参考性。 一、 简答题(30 分,每题 5 分) 1 、电路交换与分组交换各有什么优缺点?第 4 代蜂窝系统 -4G 采用的是全 IP 体系,这说明…

iPad Pro如何使用SSH远程连接服务器云端编程开发【内网穿透】

文章目录 1. 在iPad下载Code APP2.安装cpolar内网穿透2.1 cpolar 安装2.2 创建TCP隧道 3. iPad远程vscode4. 配置固定TCP端口地址4.1 保留固定TCP地址4.2 配置固定的TCP端口地址4.3 使用固定TCP地址远程vscode 正文开始前给大家推荐个网站,前些天发现了一个巨牛的 …

HubSpot能不能对接Facebook?

在数字化时代,企业如何更有效地整合关键平台,实现全面运营是业务发展的重要议题。今天将聚焦于探讨HubSpot与Facebook的整合可能性,通过强调MessageBox对接各大系统的能力,揭示这一整合如何解锁商业潜力。 HubSpot与Facebook的数字…

生成学习全景:从基础理论到GANs技术实战

本文全面探讨了生成学习的理论与实践,包括对生成学习与判别学习的比较、详细解析GANs、VAEs及自回归模型的工作原理与结构,并通过实战案例展示了GAN模型在PyTorch中的实现。 关注TechLead,分享AI全维度知识。作者拥有10年互联网服务架构、AI产…

低代码的应用场景

Gartner 在 2019 年的低代码调研报告中,曾经绘制过一张用来阐述低代码适用场景的“应用金字塔”,如下图所示: 应用级别划分:从下往上,分别为工作组级(Workgroup Class)、部门级(Departmental Class)、企业级(Enterpris…

新书速览||数字空间驱动智能建造

聚焦建筑企业高涨的数字化需求,探讨数字化转型背景下的智能建造与数据要素工程化应用 本书内容 面对复杂的内外部环境与百年未有的大变局,个性化制造特征突出又规模巨大的中国建筑业,亟待充分利用数据资源这一生产要素,优化资源配…

重建传播网络并识别隐藏来源

1.摘要 我们从数据中揭示复杂网络结构和动态的能力,对于理解和控制复杂系统中的集体动态至关重要。尽管在这一领域已有近期进展,但如何从有限的时间序列中重建具有随机动态过程的网络仍然是一个突出问题。在这里,我们开发了一个基于压缩感知的…

用于生成信息提取的大型语言模型综述

论文地址:https://arxiv.org/pdf/2312.17617.pdf 代码仓库:https://github.com/quqxui/Awesome-LLM4IE-Papers 信息抽取(IE)旨在从纯自然语言文本中提取结构化知识(如实体、关系和事件)。最近&#xff0c…

JSON Crack数据可视化工具结合内网穿透实现公网访问

文章目录 1. 在Linux上使用Docker安装JSONCrack2. 安装Cpolar内网穿透工具3. 配置JSON Crack界面公网地址4. 远程访问 JSONCrack 界面5. 固定 JSONCrack公网地址 JSON Crack 是一款免费的开源数据可视化应用程序,能够将 JSON、YAML、XML、CSV 等数据格式可视化为交互…

什么是多态?

多态是方法的多态,属性没有多态 多态存在父子之间 父类与子类之间要有联系,没有联系则会出现异常 --- String 与 Person 本质:父类引用指向子类对象 --- Person son new Son(); 如何构成多态? 建立父子类 子类重写父类方法…

Redis:原理速成+项目实战——Redis实战7(优惠券秒杀+细节解决超卖、一人一单问题)

👨‍🎓作者简介:一位大四、研0学生,正在努力准备大四暑假的实习 🌌上期文章:Redis:原理速成项目实战——Redis实战6(封装缓存工具(高级写法)&&缓存总…

【数据库学习】ClickHouse(ck)

1,ClickHouse(CK) 是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。 1)特性 按列存储,列越多速度越慢; 按列存储,数据更容易压缩(类型相同、区分度)&#xff1b…

Python如何使用Excel文件

使用Python操作Office——EXCEL 首先介绍下office win32 com接口,这个是MS为自动化提供的操作接口,比如我们打开一个EXCEL文档,就可以在里面编辑VB脚本,实现我们自己的效果。对于这种一本万利的买卖,Python怎么能放过…

D3121是什么?主要有哪些特点呢?为什么可以应用在车载音响系统上

D3121 是一块对地能动冲放大器集成电路,该电路能有效消除由线 路电阻所引起的问题及噪声。所需外围电容小,便于设计时小型化的同 时可靠性不降低。广泛应用于车载音响系统内。 D3121 系列采用 DIP8 、 SOP8 、 SIP8 的封装形式封装。 主要特点&#…

IP风险画像:源头防范网络攻击的全面策略

在当今数字化的时代,网络攻击呈现多样化和复杂化的趋势,为了确保网络的安全,制定全面的IP风险画像并从源头防范网络攻击是至关重要的。ip数据云将探讨如何通过建立IP风险画像来识别和应对潜在的威胁,从而实现更加安全可靠的网络环…

【STM32】HAL库的RCC复位状态判断及NVIC系统软件复位

【STM32】HAL库的RCC复位状态判断及NVIC系统软件复位 在实际开发中 有时候会遇到复位状态不同 导致结果不同的情况 比如在上电复位时 电压不稳定 可能导致一些外部芯片无法正常工作 从而导致进行了错误的操作流程 所以 可以在程序运行后 加一个复位状态判断 用来检测是否正常复…

网络服务DHCP与DNS

一 DHCP的工作原理(租约过程) 分类 1)自动分配:分配到一个IP地址后永久使用 (2)手动分配:由DHCP服务器管理员指定IP(打印机、报销系统)把mac地址和ip地址做一个一一对…

MySQL 从零开始:03 基本入门语句

文章目录 1、连接数据库1.1 命令提示符登陆1.2 MySQL 8.0 Command Line Client 登陆1.3 MySQL Workbench 登陆 2、基本语句2.1 查看所有库2.2 创建库2.3 删除库2.4 选择数据库2.5 查看表2.6 创建表2.7 删除表2.8 改表名2.9 清空表 在上一小节中介绍了 MySQL 数据库的安装&#…