机器学习项目精选 第一期:超完整数据科学资料合集

大噶吼,不说废话,分享一波我最近看过并觉得非常硬核的资源,包括Python、机器学习、深度学习、大模型等等。

1、超完整数据科学资料合集

地址:https://github.com/krishnaik06/The-Grand-Complete-Data-Science-Materials

  • Python 数据分析和数据科学完整播放列表
  • 数据分析和数据科学的完整统计学播放列表
  • 数据分析和数据科学的完整 SQL
  • Git 和 Github 教程
  • 探索性数据分析、特征工程和特征选择
  • 机器学习播放列表
  • 深度学习和自然语言处理完整播放列表
  • 生产部署的重要框架
  • 完整的 AWS Sagemaker 和 Sagemaker Studio 工具
  • 完整的 MLOPS 教程
  • 使用开源工具的端到端机器学习、深度学习和自然语言处理项目,直到部署
  • 生成式 AI 和 Open AI 播放列表
  • PySpark 完整教程
  • 完整的数据科学、机器学习和深度学习面试题

2、机器学习算法实现的最小和最干净的例子

地址:https://github.com/rushter/MLAlgorithms

这个项目有点老,但是知识不老。主要面向希望学习机器学习算法内部原理,或者从零开始自己实现机器学习算法的人群。相比于高效优化的现成机器学习库,这个项目中的代码更容易理解和操作。所有的算法都是用 Python 实现的,利用了 numpy、scipy 和 autograd 这些库。

已经实现的算法包括:

  • 深度学习(多层感知器、卷积神经网络、递归神经网络、长短期记忆网络)
  • 线性回归、逻辑回归
  • 随机森林
  • 支持向量机(线性核、多项式核、RBF 核)
  • K均值聚类
  • 高斯混合模型
  • K近邻
  • 朴素贝叶斯
  • 主成分分析(PCA)
  • 因子分解机
  • 受限玻尔兹曼机(RBM)
  • t分布随机嵌入(t-SNE)
  • 梯度提升决策树(也称为 GBDT、GBRT、GBM、XGBoost)
  • 强化学习(深度 Q 学习)

3、机器学习面试

地址:https://github.com/khangich/machine-learning-interview

包含了机器学习工程师面试常见问题的分享,包括来自 Facebook、Amazon、Google 等大公司的面试经历。作者 Pham An Khang 通过收集整理不同公司的面试题,并分享自己以及朋友的面试准备经验,帮助读者为机器学习岗位面试做准备。

4、深度学习论文精读

地址:https://github.com/mli/paper-reading?tab=readme-ov-file

5、微软开源的promptbase

地址:https://github.com/microsoft/promptbase

promptbase 微软开源的一系列资源、最佳实践和示例脚本,用于从 GPT-4 等基础模型中激发出最佳性能。号称:All things prompt engineering(关于提示工程的一切)

6、苹果最新开源的机器学习框架

地址:https://github.com/ml-explore/mlx

熟悉的 API:MLX 具有一个紧随 NumPy 的 Python API。MLX 还有一个功能齐全的 C++ API,与 Python API 密切相关。MLX 具有更高级的包,如 mlx.nn 和 mlx.optimizers,其 API 紧随 PyTorch,以简化构建更复杂的模型。

苹果同时还公布了mlx应用示例:https://github.com/ml-explore/mlx-examples

示例包括:

  • Transformer 语言模型训练
  • 使用 LLaMA 或 Mistral进行大规模文本生成
  • 混合专家(MoE)语言模型与 Mixtral 8x7B
  • 使用 LoRA进行参数高效微调。
  • 使用 Stable Diffusion 生成图像。
  • 使用 OpenAI 的 Whisper进行语音识别。
  • 使用 BERT进行双向语言理解
  • 在图结构数据上使用 GCN进行半监督学习

7、Mistralai client-python

地址:https://github.com/mistralai/client-python

Mistral AI 发布的,最近风头最盛的大模型`Mixtral 8x7B,这个库是Mistral AI官方开源的Python客户端,可以直接调用Mistral AI API

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/229286.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

安全CDN有什么作用,安全CDN工作原理是什么?

一、CDN的应用场景 CDN技术可以应用于各种类型的网站和应用程序,特别是对于以下几种场景,CDN的作用尤为明显: 1. 高流量网站:对于流量较大的网站,CDN可以将网站的内容分发到全球各地的节点上,从而分担服务…

【Linux API 揭秘】container_of函数详解

我的圈子: 高级工程师聚集地 我是董哥,高级嵌入式软件开发工程师,从事嵌入式Linux驱动开发和系统开发,曾就职于世界500强企业! 创作理念:专注分享高质量嵌入式文章,让大家读有所得! …

1852_bash中的find应用扩展

Grey 全部学习内容汇总: https://github.com/GreyZhang/toolbox 1852_bash中的find应用扩展 find这个工具我用了好多年了,但是是不是真的会用呢?其实不然,否则也不会出现这种总结式的笔记。其实,注意部分小细节之后…

liunx之Samba服务器

环境:虚拟机CENTOS 7和 测试机相通 一、Samba服务器_光盘共享(匿名访问) 1.在虚拟机CENTOS 7安装smb服务,并在防火墙上允许samba流量通过 2. 挂载光盘 3.修改smb.conf配置文件,实现光盘匿名共享 4. 启动smb服务 5.在…

GB/T 19536-2015 集装箱底板用胶合板检测

集装箱底板用胶合板是指由木质单板或竹质单元与木质单板复合而成的,具有防虫、防腐及耐候性能,用于一般货物集装箱底板的胶合板。 GB/T 19536-2015集装箱底板用胶合板测试: 测试项目 测试方法 含水率 GB/T 17657 密度 GB/T 17657 静曲…

编写自定义函数找出二维数组(3*4)中元素的最大值与最小值,并返回其最大值与最小值,并在main函数中测试结果

编写自定义函数找出二维数组(3*4)中元素的最大值与最小值,并返回其最大值与最小值,并在main函数中测试结果。要求: 数组在main函数中使用随机函数获得赋值;自定义函数返回类型为void;输出结果在…

手麻、腿麻、麻痛…背后竟隐藏7大疾病!多一个人知道,少一个悲剧!

手脚麻木背后的7大病症:骨病、脑梗、肿瘤…… 1、神经问题 上图四只手上橙色的区域代表了麻木感,如果您的手麻集中在无名指和小指的区域,您可以拿一张纸,用五个手指分别试着夹住,检验您的五个手指力量;您还…

(5)shell命令以及Linux的权限

写在前面 本章我们将重点讲解 Linux 权限,这是 Linux 基础部分中非常重要的一部分。内容比较干,我会稍稍正经些去讲解。话不多说,我们直接切入正题。 shell 命令及运行原理 严格意义上说的是一个操作系统,我们称之为 —— &…

Logstash访问安全访问Elasticsearch集群

生成logstash证书: opensal pkcs12 -in elastic-stack-ca.p12 -clcerts -nokeys > logafash.cer openssl x509 -in logstash.cer -out logstash.pem 编排配置文件

xtu oj 1328 数码和

题目描述 一个10进制数n在2∼16进制下可以得到的不同的数码和,求在这些数码和中出现次数最多的数码和。 比如20, 其中数码和2和4分别出现了3次,为最多出现次数。 输入 第一行是一个整数T(1≤T≤1000),表示样例的个数。 以后每行…

Sherlock:社交媒体账号搜索工具 | 开源日报 No.111

sherlock-project/sherlock Stars: 45.1k License: MIT 这个项目是一个社交媒体账号搜索工具,名为 Sherlock。它可以通过用户名在不同的社交网络上追踪用户的账号。 支持单个或多个用户搜索提供 Docker 容器化部署方式开放源代码并欢迎贡献者参与开发包含详细测试…

Shell三剑客:sed(命令)一

一、删除命令:d [rootlocalhost ~]# sed -r /root/d passwd.txt bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin adm:x:3:4:adm:/var/adm:/sbin/nologin lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin sync:x:5:0:sync:/sbin:/bin/sync…

【深度学习】重要概念

文章目录 1. 前向传播、反向传播和计算图2. 数值稳定性和模型初始化3. 环境和分布偏移 1. 前向传播、反向传播和计算图 前向传播:按顺序(从输入层到输出层)计算和存储神经网络中每层的结果。计算图:可视化计算中操作符和变量的依…

C# 内存的分配管理

using System.ComponentModel; using System.Runtime.InteropServices; //内存的分配 int n 100000;//长度 IntPtr buffer Marshal.AllocHGlobal(sizeof(int) * n); try { var t buffer (n * 10) * sizeof(int); var p Marshal.PtrToStructure<int>(t); /…

Vim入门

Vim使用入门 1.Vim编辑器的三种常用模式 一般模式&#xff1a;刚打开文件是它&#xff0c;从编辑模式按“ESC”退回的模式也是它。可以执行各种编辑操作&#xff0c;如移动光标、复制、粘贴、删除、查找替换等 ; 编辑模式&#xff1a;在一般模式下按下 i、I、a、A、o、O 等键…

CesiumLab地理信息基础数据处理平台 各类数据类型介绍、发布数据介绍

目录 0 引言1 CesiumLab2 数据处理模块2.1 输出格式&#xff1a;切片文件格式2.2 输入格式2.2.1 传统GIS数据2.2.2 人工模型2.2.3 BIM模型2.2.4 倾斜实景数据2.2.5 点云数据 3 发布服务功能3.1 拓展&#xff1a;其他平台发布服务功能 &#x1f64b;‍♂️ 作者&#xff1a;海码…

再怎么“顽固”的应用程序,也很难经得住以下的卸载方法

卸载程序是我们经常尝试的事情。这可能是因为我们不再需要程序,该程序可能会导致问题等。有时,如果你试图卸载某个程序,你会收到一个错误,但卸载没有发生。在这种情况下,你可以选择强制卸载。在本教程中,我将向你展示如何在Windows 10/11计算机上强制卸载程序。 ​控制面…

Mybatis的插件运⾏原理,如何编写⼀个插件?

&#x1f680; 作者主页&#xff1a; 有来技术 &#x1f525; 开源项目&#xff1a; youlai-mall &#x1f343; vue3-element-admin &#x1f343; youlai-boot &#x1f33a; 仓库主页&#xff1a; Gitee &#x1f4ab; Github &#x1f4ab; GitCode &#x1f496; 欢迎点赞…

2024年最免费的DAW混音编曲FL Studio21.2.中文版下载

FL Studio 简称FL&#xff0c;全称Fruity Loops Studio&#xff0c;因此国人习惯叫它"水果"。目前最新版本是FL Studio21.1.1.3750版本&#xff0c;它让你的计算机就像是全功能的录音室&#xff0c;大混音盘&#xff0c;非常先进的制作工具&#xff0c;让你的音乐突破…

AUTOSAR组织引入了Rust语言的原因是什么?有哪些好处?与C++相比它有什么优点?并推荐一些入门学习Rust语言链接等

AUTOSAR(汽车开放系统架构)是一个由汽车制造商、供应商和其他来自电子、半导体和软件行业的公司组成的全球发展伙伴关系,自2003年以来一直致力于为汽车行业开发和引入开放、标准化的软件平台。 AUTOSAR 最近宣布成立一个新的工作组,用于探索在汽车软件中使用 Rust 编程语言…