文章目录
- 【盘古】
- 【嗜睡检测】
- 【3D AI 生成】
- 多模态——指哪打哪
- 【AlphaDev:汇编版 AlphaZero】
- 【ChatExcel】
【盘古】
2023年7月,华为正式发布盘古大模型3.0,并提出3层模型架构。
-
L0:基础大模型,包括自然语言、视觉、多模态、预测、科学计算;
-
L1:N个行业大模型,比如政务、金融、制造、矿山、气象等;
-
L2:更细化场景的模型,提供“开箱即用”的模型服务
【嗜睡检测】
基于Python和MediaPipe,嗜睡检测系统搭建代码实战
思路:疲劳驾驶的司机大部分都有打瞌睡的情形,所以我们根据驾驶员眼睛闭合的频率和时间来判断驾驶员是否疲劳驾驶(或嗜睡)。
【3D AI 生成】
3D AI生成出新玩法了:无需数小时,只要45秒,单张图片即可生成 3D模型
Project Page: http://one-2-3-45.com
Paper: https://arxiv.org/pdf/2306.16928.pdf
Code: https://github.com/One-2-3-45/One-2-3-45
Demo:https://huggingface.co/spaces/One-2-3-45/One-2-3-45
多模态——指哪打哪
仅靠“口才”就能解决视觉任务!商汤提出Shikra:新一代多模态大模型
《Shikra: Unleashing Multimodal LLM’s Referential Dialogue Magic》
https://arxiv.org/pdf/2306.15195.pdf
https://github.com/shikras/shikra
基于 CLIP 做的
会拼图
会分辨谁是镜子中的人
点作为输入也可以
Reffering Expression Generation
Referring Expression Compression
【AlphaDev:汇编版 AlphaZero】
谷歌DeepMind打破十年算法封印,AlphaDev惊世登场,颠覆人类算法格局!
Alpha」家族再添新成员AlphaDev!谷歌大脑DeepMind合体后首发力作,全新AI系统将排序算法提速70%,C++排序库十年来首次更改。AI创造AI的时代要来了?
谷歌 DeepMind 的研究者相信,在这个较低的层级中存在许多可改进的空间,而这些改进在更高级的编程语言中可能很难发现。
AlphaDev:汇编版 AlphaZero
【ChatExcel】
老罗落泪!北大团队搞出ChatExcel,说人话自动处理表格,免费且不限次使用