大模型技术论文不断,每个月总会新增上千篇。本专栏精选论文重点解读,主题还是围绕着行业实践和工程量产。若在某个环节出现卡点,可以回到大模型必备腔调或者LLM背后的基础模型重新阅读。而最新科技(Mamba,xLSTM,KAN)则提供了大模型领域最新技术跟踪。若对于具身智能感兴趣的请移步具身智能专栏。技术宅麻烦死磕AI架构设计。
先来感受下Claude3.5的“Artifacts”,这是Claude.ai上的一项新功能,允许用户在动态工作区中生成代码片段、文本文档或网站设计等内容并与之交互,因此Claude从对话式AI向协作式工作环境的演变。
Claude 3.5 Sonnet
Claude 3.5 Sonnet
Anthropic AI推出了Claude 3.5 Sonnet,这是其新Claude 3.5模型系列的首次发布。Claude的最新版本带来了AI功能的重大进步。它可在Claude.ai和 Claude iOS应用程序上免费获得。该模型可通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI访问。收费模式为3美元每百万个输入和15美元每百万个输出,具有200K的上下文窗口。
上图横轴为百万Token的收费,纵轴为智能分数
性能评估
Claude 3.5 Sonnet拥有两倍于Claude 3 Opus的速度,同时保持中端模型成本。它在研究生水平的推理、本科水平的知识和编码能力方面表现出色,显着提高了对细微差别、幽默和复杂指令的理解。它能够以自然和相关的语气编写高质量内容,进一步巩固了其作为领先 AI 模型的地位。
在内部编码评估中,Claude 3.5 Sonnet解决了64% 的问题,而Claude 3 Opus仅仅解决了38%的问题。这个评估测试了模型根据自然语言描述进行错误修复和向开源代码库添加功能的能力。
Claude 3.5 Sonnet展示了复杂的推理和故障排除的能力,特别在更新遗留应用程序和迁移代码库方面特别有效。
今年晚些时候,该公司还计划发布Claude 3.5 Haiku和Claude 3.5 Opus,完善Claude 3.5模型系列。未来的开发还将包括新的模式和功能,以支持更多的业务用例,包括与企业应用程序的集成。