智谱AI 旗下的代码生成大模型 CodeGeeX 正式发布第四代开源版本:CodeGeeX4-ALL-9B,其是集代码补全和生成、代码问答、代码解释器、工具调用、联网搜索、项目级代码问答等能力于一体的代码大模型,是目前百亿(10B)参数以下性能最强、最全能的代码大模型。
模型的核心功能 Demo 和使用教程已经在 GitHub 上开源,模型权重可在 HuggingFace、ModelScope、WiseModel 等大模型平台下载。
GitHub:
https://github.com/THUDM/CodeGeeX4
HuggingFace:
https://huggingface.co/THUDM/codegeex4-all-9b
ModelScope:
https://modelscope.cn/models/ZhipuAI/codegeex4-all-9b
WiseModel:
https://wisemodel.cn/models/ZhipuAI/codegeex4-all-9b
百亿参数以下性能最强的全能代码模型
CodeGeeX4-ALL-9B,集多种编程开发功能于一体,覆盖了编程的多个场景,并在多个代码评测集上表现优异,展现了强大的代码生成能力。模型支持128K上下文,处理长代码文件,并在代码检索任务中实现 100% 准确度。
此外,CodeGeeX4-ALL-9B 是唯一实现Function Call的代码大模型,在函数调用测试中成功率超过90%。
1. 性能表现评测
CodeGeeX4-ALL-9B 在多个权威代码能力评测集,如 NaturalCodeBench、BigCodeBench 上都取得了极具竞争力的表现,是百亿参数量级以下性能最强的模型,甚至超过数倍规模的通用模型,在推理性能和模型效果上得到最佳平衡。
BigCodeBench 测试结果显示,CodeGeeX4-ALL-9B 在同等尺寸下效果最好:
在其他代码生成、补全、推理测试集上,CodeGeeX4-ALL-9B 取得了与更大规模模型接近的水平:
2. 支持128K上下文
CodeGeeX4-ALL-9B 升级支持 128K 上下文,使其能够处理和利用更长代码文件、甚至是项目代码中的信息,有助于模型更深入理解复杂和细节丰富的代码。
在“大海捞针”(Needle In A Haystack, NIAH)评估中,CodeGeeX4-ALL-9B 模型展示了其在处理长达 128K 的上下文中进行代码的嵌入和检索能力,实现了 100% 的检索准确度。
3. 支持 Function Call
CodeGeeX4-ALL-9B 是目前唯一一个实现 Function Call 的代码大模型。
Berkeley Function Calling Leaderboard 是第一个可全面评估大模型函数调用能力的测试集。其中 AST 数据集是评估模型对 Java、JavaScript、Python 程序的调用能力;Excecutable 数据集是评估模型对真实场景 API 的函数调用能力。
CodeGeeX4-ALL-9B 在 Berkeley Function Calling Leaderboard 上进行了全面的测试,包括各种形式的函数调用、不同的函数调用场景以及函数调用可执行性的测试,得到了以下结果:在 AST 和 Exec 测试集中调用成功率超过 90%。
4. 插件功能全面进入项目级辅助编程
CodeGeeX 插件 v2.12.0 版本已全面接入第四代模型,带来更快的代码生成速度和多项功能创新,如自动生成项目README文件、长文本上下文记忆、跨文件分析和问答、本地模式支持,以及NL2SQL能力提升。这些功能增强了代码查找、理解和维护的效率,提升了开发体验。
查看更多,请阅读:
CodeGeeX零基础上手实用手册:
https://zhipu-ai.feishu.cn/wiki/CuvxwUDDqiErQUkFO2Tc4walnZY
欢迎各位关注我的个人微信公众号:HsuDan,我将分享更多自己的学习心得、避坑总结、面试经验、AI最新技术资讯。