揭秘Etched AI:三个哈佛辍学00后挑战英伟达,推出Transformer专用ASIC芯片sohu

人工智能领域最近掀起了一股新的热潮,三位哈佛辍学的00后本科生创建了Etched AI,并成功推出了一款超强AI芯片sohu,直指英伟达的AI芯片帝国。这款芯片被誉为比英伟达H100快20倍,吸引了众多科技界的关注。本文将深入探讨Etched AI及其革命性的ASIC芯片sohu。

一、Etched AI的诞生

Etched AI位于加利福尼亚,由Chris Zhu、Gavin Uberti和Robert Wachen三位哈佛辍学生创立。公司仅有35名员工,却已经在科技界掀起了不小的波澜。Etched AI的核心产品是专门为Transformer架构设计的ASIC芯片sohu。所谓ASIC(Application-Specific Integrated Circuit),即应用专用集成电路,是一种针对特定任务优化的芯片。

这三位年轻的创始人早在2020年进入哈佛,后因对AI芯片技术的浓厚兴趣而休学创业。他们在创业初期便获得了Peter Thiel、Thomas Dohmke、Kyle Vogt和Charlie Cheever等科技大佬的支持,完成了1.2亿美元的A轮融资。

二、sohu芯片的技术创新

Etched AI的sohu芯片采用了台积电4nm工艺制造,只有1个核心,但配备了144GB HBM3E高带宽内存。与英伟达的H100芯片相比,sohu芯片的晶体管利用率大大提高,超过了90%,主要得益于“连续批处理”(Continuous batching of prompts and completions)技术。这项技术使得芯片可以高效处理多个输入和输出序列,充分利用计算资源,大幅提升了AI应用的响应速度和处理能力。

Etched团队指出,传统GPU在过去四年的效率提升并不明显,主要通过增大芯片面积来提高性能。而sohu芯片通过专门针对Transformer优化,去掉了其他不必要的功能,实现了更快的速度和更低的功耗。例如,在推理Llama-3 70B等大型模型时,sohu的速度比H100快了至少20倍。

三、Etched AI的市场策略

Etched AI的创始人意识到,市场上对大语言模型的需求日益增长,而通用GPU芯片已经无法满足这种需求。于是,他们选择了专用化的路线,开发了针对Transformer的ASIC芯片。Transformer架构如今被广泛应用于各种AI模型中,如OpenAI的GPT系列、谷歌的PaLM、Meta的LLaMa等。

Etched AI的sohu芯片在性能测试中表现出色,支持最高100万亿参数的大模型,远超当前市面上的大模型规模。此外,sohu芯片的设计还简化了推理所用的硬件和软件,去掉了与Transformer无关的部分,进一步提升了性能。

四、Etched AI的挑战与未来

尽管Etched AI取得了初步的成功,但挑战英伟达的垄断地位并非易事。英伟达凭借A100和H100芯片在业界稳居头把交椅,并且在资金和技术上有着巨大的优势。然而,Etched AI的三位创始人表示,他们将继续专注于Transformer专用芯片,相信这种专用化的路线是未来的趋势。

Etched AI的成功离不开技术创新和市场洞察力,但也离不开资本和人脉的支持。未来,Etched AI能否在激烈的市场竞争中脱颖而出,还有待时间的检验。

五、结论与未来展望

Etched AI的sohu芯片展示了ASIC在AI领域的巨大潜力。通过专门化的设计,sohu在大语言模型推理上实现了显著的性能提升。尽管面临巨头英伟达的强力竞争,Etched AI凭借其技术创新和市场策略,展现出了强大的发展潜力。

未来,随着AI应用的不断扩展和Transformer架构的普及,专用ASIC芯片可能会成为AI芯片市场的重要组成部分。Etched AI的成功不仅为行业注入了新的活力,也为更多的创新企业树立了榜样。让我们拭目以待,看看这三位哈佛辍学的00后能否真正掀翻英伟达,开创AI芯片的新纪元。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/37732.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

“实时数据大屏2k、4k、8k”这样做【高级前端必备技能之一】

🔥废话不多先上效果图 🔥划重点 新手程序员需要注意以下几点: 我们需要进行充分的技术调研,进行技术选型产品,UI,再三确认效果图是否确定,避免后续出现返工的情况 不能拿到效果图之后&#x…

【分布式计算框架 MapReduce】MapReduce 初级编程

目录 一、MapReduce 示例程序的导入并运行测试 二、准备 4 个小文件(文件大小分别为 1.7M,5.1M,3.4M,6.8M) 1. 第一种情况,默认分片:不修改程序代码,直接使用 WordCount 源程序 2…

电脑提示vcomp140.dll丢失的几种有效的解决方法,轻松搞定dll问题

在电脑使用过程中,我们可能会遇到一些错误提示,其中之一就是找不到vcomp140.dll。那么,究竟什么是vcomp140.dll呢?为什么会出现找不到vcomp140.dll的情况呢?本文将从vcomp140.dll的定义、常见原因、对电脑的影响以及解…

如何理解CI/CD的概念及其在Java项目中的应用

CI/CD 是持续集成(Continuous Integration)和持续交付/部署(Continuous Delivery/Deployment)的缩写。它是一种现代软件开发实践,用于提高代码发布的频率和质量,确保软件系统的稳定性和一致性。通过自动化构…

19.《C语言》——【如何理解static和extern?】

🎇开场语 亲爱的读者,大家好!我是一名正在学习编程的高校生。在这个博客里,我将和大家一起探讨编程技巧、分享实用工具,并交流学习心得。希望通过我的博客,你能学到有用的知识,提高自己的技能&a…

解锁iCloud的全能潜力:从新手到专家的终极指南!

在今天这个数字化日益发达的时代,云服务已经成为我们生活中不可或缺的一部分。苹果公司的iCloud服务,作为一个集成的云服务平台,为用户提供了数据存储、备份、同步等多样化的功能。通过本文,我们将深入探讨如何高效利用iCloud&…

[单机版架设]新天堂2-死亡骑士338|带AI机器人

前言 今天给大家带来一款单机游戏的架设:新天堂2-死亡骑士338单机服务端—带AI机器人 如今市面上的资源参差不齐,大部分的都不能运行,本人亲自测试,运行视频如下: 新天堂2 搭建教程 此游戏架设不需要虚拟机&#xf…

识图生成代码:通义千问vsGPt4o,有点小崩

今日对比一下通义千问和GPt4o,在通过识别图片然后去生成前端代码 在当今ai的时代,通过ai去生成页面的代码可以很大的提高我们的开发效率下面是我们要求的生成的图片截图,这是掘金的榜单 效果对比 首先我们使用通义千问,让他去帮我…

C++11中引入的auto关键字和范围for循环(range-based for loop)。

C11中引入的auto关键字和范围for循环(range-based for loop)是两项重要的新特性,它们旨在提高代码的可读性和简洁性,同时减少编写错误。 auto关键字 auto关键字在C11中被赋予了新的含义,用于自动类型推断。在C11之前…

Django 自定义过滤器

1,编写自定义过滤器并注册 创建目录 Test/app5/templatetags 分别创建文件 Test/app5/templatetags/__init__.py Test/app5/templatetags/myfilter.py 添加过滤器脚本 Test/app5/templatetags/myfilter.py from django import template register template.…

Python功能制作之使用streamlit做一个简单的WebUI

使用Streamlit创建WebUI 1. 什么是Streamlit Streamlit 是一个开源的Python库,用于快速创建美观的Web应用。 它适合数据科学家和机器学习工程师,因为它能够以最小的代码量将数据应用程序带到浏览器中。通过简单的Python脚本,可以创建交互式…

c++类和对象(三)日期类

类和对象 一.拷贝构造函数定义二.拷贝构造函数特征三.const成员函数权限权限的缩小权限的缩放大 四.隐式类型转换 一.拷贝构造函数定义 拷贝构造函数:只有单个形参,该形参是对本类类型对象的引用(一般常用const修饰),在用已存 在的类类型对象…

kettle创建资源库无法登录问题

问题:You dont seem to be getting a connection to the server. Please check the path youre using and make sure the server is up and running. 1. 删除资源库 2.删除数据库中R_开头的表 3.重新创建资源库连接,查看是否成功产生表 4.创建成功&…

如何在离线环境下安装Docker社区版

目录 1. 引言 2. 准备工作 3. 下载Docker安装包 4. 下载Docker的依赖包 5. 将安装包传输到目标系统 6. 安装Docker社区版 7. 配置Docker 8. 解决常见问题 9. 维护和更新Docker 10. 创建离线安装脚本 11. 使用离线镜像 12. 高级配置与优化 13. 安全性考虑 14. 总结…

005-GeoGebra基础篇-GeoGebra的矩形

上一篇关于点的介绍已经触及到了诸多GeoGebra的基础操作,这一篇我们根据画矩形,继续探索GeoGebra。 目录 一、最粗暴的方式绘制矩形1. 使用“Polygon”工具直接绘制2. 注意看代数列表3. 关于矩形和线段 二、用点和线段绘制矩形(1)…

52、基于K 均值聚类实现基于颜色的分割(matlab)

1、K 均值聚类实现基于颜色的分割原理及流程 K 均值聚类是一种常用的聚类算法,通过将数据点分配到 K 个簇中,每个簇的中心代表簇的平均值来实现聚类的目的。 基于颜色的分割的原理是利用像素的颜色信息来对图像进行分割。首先需要将图像的每个像素点表…

计算机网络微课堂(湖科大教书匠)TCP部分

计算机网络微课堂(湖科大教书匠)TCP部分 【计算机网络微课堂(有字幕无背景音乐版)】 TCP的流量控制 一般来说,我们希望数据传输得更快一些。但如果发送方把数据发送得过快,接收方就可能来不及接收&#…

FFmpeg 剪切(Seeking)视频后音画不同步问题分析

问题 需求:最近,需要剪切一段mp4格式的视频,要求从第30s位置开始剪切,持续30s的视频段。于是乎,拿出音视频领域最强工具之一,FFmpeg神器,输入命令行:ffmpeg -i input.mp4 -ss 00:00:30.0 -codec copy -t 30 output.mp4播放这段视频output.mp4,问题出现了:前几秒没有画…

Django 表单使用示例:数据格式校验

在本文中,我们将使用 Django 的表单(Forms)功能来创建一个添加角色的页面,并对用户提交的数据进行格式校验。 创建 Django 项目和应用 首先,我们创建一个名为 ​​form_demo​​​ 的 Django 项目和一个名为 ​​app01​​ 的应用: django-admin startproject form_de…

FAST SPLIT PARTITION 快速分割分区

How to Perform a FAST SPLIT PARTITION Using ALTER TABLE? (Doc ID 1268714.1) 快速分割分区,就是如果最大的分区全部满足新split分区的条件,直接把最大的这个改名,再新加一个max分区出来。这样可以避免partition分区index的unsable&…