GitHub一周热点汇总第5期 (2024/01/07-01/13),梳理每周热门的GitHub项目,这一周的热门项目都普遍比较年轻,有几个更是刚刚发布就火热起来了,一起来看看都有哪些项目吧。
#1 llm-course
- 项目名称:llm-course - 大语言模型课程
- GitHub 链接:https://github.com/mlabonne/llm-course
- 上周 Star 数:3300+
本项目的内容从名字就能大概猜到了,没错,就是一个针对大语言模型的课程。本项目中包含了学习大语言模型的roadmap和colab notebook,很适合从头来学习入门一下LLM。学习党们可以出手了,赶快学起来吧。
项目分成3个部分,分别是:
- LLM 基础知识:基础知识包括了数学、Python、神经网络等。
- LLM 科学家:主要针对使用最新技术去构建更好的LLM
- LLM 工程师:主要针对如何去开发和部署基于大模型的应用
下面是基础知识部分和LLM科学家部分的roadmap,LLM工程师的部分还暂时没有更新,大家要稍微等等。
这是项目的GitHub star历史,上周突然一下子就火爆起来了。
#2 Jan
- 项目名称:Jan - 离线运行LLM
- GitHub 链接:https://github.com/janhq/jan
- 上周 Star 数:3200+
又是一款ChatGPT的替代品,但是与一般的OpenAI套壳产品不太一样的地方在于,它希望把AI能力放到你本地的环境中。Jan支持从 PC 到多 GPU 集群的各种类型环境,帮助你在100%离线的在本地构建一个ChatGPT。
以下是Jan支持运行环境类型:
- Nvidia GPU(快速)
- Apple M 系列(快速)
- 苹果英特尔
- Linux Debian
- Windows x64
由于是在本地部署和运行的LLM,因此使用Jan理论上可以获得一些优势:
隐私:全本地化的数据,避免了泄露的可能
可定制:可以微调模型或者是定制自己的产品页面。
另外就是如果本地的性能足够强大,是可以获得更好的使用速度和稳定性的。
#3 crewAI
- 项目名称:crewAI - AI agent调度框架
- GitHub 链接:https://github.com/joaomdmoura/crewAI
- 上周 Star 数:2700+
crewAI 是一个针对AI agent的编排框架,它希望可以让ai agent之间更加智能的协同工作,进而让整个AI 体系可以独立完成复杂的任务。
CrewAI 旨在使人工智能代理能够承担角色、分享目标并在一个有凝聚力的单元中运作——就像一个运转良好的团队。无论您是要构建智能助理平台、自动化客户服务整体还是多代理研究团队,CrewAI 都可以为复杂的多代理交互提供支撑。
CrewAI的主要特性:
- 基于角色的agent设计:定制具有特定角色、目标和工具的代理。
- agent间自主委派:agent可以自主委派任务并相互查询,提高解决问题的效率。
- 灵活的任务管理:使用可定制的工具定义任务并将其动态分配给agent。
- 流程驱动:目前仅支持sequential。任务执行,处理更复杂的流程,例如共识和分层。
#4 1brc
- 项目名称:CV - 10 亿行挑战
- GitHub 链接:https://github.com/gunnarmorling/1brc
- 上周 Star 数:1500+
1brc就是 One Billion Row Challenge ,项目实际上是一个关于JAVA的挑战,使用JAVA处理一个10亿行的文件,怎么样Java大神的竞赛的基因动了吗,有兴趣的话,也可以去提交一下。
发起者希望探讨现代 Java 在聚合文本文件中的 10 亿行方面能走多远,挑战要求从处理一个文本文件,它包含一系列气象站的温度值,一共有10亿行。各路大神请使用各种可能的技术,比如虚拟线程、SIMD、优化GC,最终获取最好的运行速度。
目前已经有一些开始提交了,有兴趣的快动手吧,挑战一直持续到1月底。
#5 Umi-OCR
- 项目名称:Umi-OCR - 离线OCR软件
- GitHub 链接:https://github.com/hiroi-sora/Umi-OCR
- 上周 Star 数:1100+
这是个国人项目,打开项目的所有介绍都是中文优先的,对国内是非常友好。
Umi-OCR是开源、免费的离线OCR软件。支持截屏/粘贴/批量导入图片,段落排版/排除水印,扫描/生成二维码。内置多国语言库。
下面是它的主要特点:
- 免费:本项目所有代码开源,完全免费。
- 方便:解压即用,离线运行,无需网络。
- 高效:自带高效率离线OCR引擎。只要电脑性能足够,可以比在线OCR服务更快。
- 灵活:支持命令行、HTTP接口等多种调用方式。
- 功能:截图OCR / 批量OCR / 二维码 / 数学公式识别
本应用适用于 Windows7 x64 及以上,这点对于平时使用Mac的我有点可惜,如果你是Windows用户,就去试试吧。