codecamp

CodeGeeX模型详解:本地部署、性能评测与新功能

模型相关

1. 我是否也可以下载CodeGeeX模型在本地?

CodeGeeX模型在Github上全部开源,希望学习和研究大模型的用户都可以下载。截止7月,CodeGeeX在Github上获得16,326个Star好评。最新一代模型的Github项目地址:https://github.com/THUDM/CodeGeeX4

2. CodeGeeX2代模型评测结果怎么样?

我们使用CodeGeeX2-6B(截止7.26日的开源版本)在一些学术评测集(HumanEval,HumanEval-X)上做了测试,在没有数据泄漏的情况下,这些评测集可以反映模型的基础能力,实际体验还是需要以具体场景为准。

在 HumanEval 评测中,CodeGeeX2-6B的表现全面超越了参数规模更大的 StarCoder 模型以及 OpenAI 的 Code-Cushman-001 模型(GitHub Copilot 曾使用的模型)。

在多语言方面,新版 CodeGeeX 2 模型在 HumanEval-X 数据集评测中表现优异。相较于第一代,CodeGeeX2 的Pass@1 指标在各个语言上的平均表现提升了 107%。其中,Rust 语言的性能提升显著,提升了 321%;C++ 和 JavaScript 语言上的表现也提升了 70% 以上。

3. 如何使用最新版的第三代CodeGeeX模型?

目前VSCode 中的CodeGeeX插件已经接入最新的第三代CodeGeeX模型。在VSCode插件市场搜索“CodeGeeX”,免费下载安装 v2.3.1 之后的版本,可以随时体验最新模型能力。

4. 第三代CodeGeeX模型能力如何?

一、第三代模型性能全面提升

CodeGeeX第三代模型正式发布,基础能力全面提升。

针对Python、Java、JavaScript、C++、Golang五种主流编程语言,代码生成准确率提升200%。

二、自定义系统指令

CodeGeeX 3代模型中,用户可以根据不同开发场景和习惯,自定义系统指令。这种方式在不用模型微调的情况下,代码注释匹配度提升20%、代码修复准确率提升20%、单元测试通过率提升40%,使同一模型在不同使用场景下的泛化能力大幅提升。

三、RAG检索增强

CodeGeeX 3代模型引入RAG算法,构建流行公有仓库和私有仓库的代码向量数据库,缓解代码生成模型幻觉性问题。包括:避免生成错误的私有函数调用、让模型拥有最新的代码仓库知识、对私有代码仓库建立知识库等。

基于CodeGeeX第三代模型能力的全面提升,插件产品推出多项全新功能。

CodeGeeX插件产品相关问题解答
CodeGeeX4-ALL-9B 技术文档
温馨提示
下载编程狮App,免费阅读超1000+编程语言教程
取消
确定
目录

关闭

MIP.setData({ 'pageTheme' : getCookie('pageTheme') || {'day':true, 'night':false}, 'pageFontSize' : getCookie('pageFontSize') || 20 }); MIP.watch('pageTheme', function(newValue){ setCookie('pageTheme', JSON.stringify(newValue)) }); MIP.watch('pageFontSize', function(newValue){ setCookie('pageFontSize', newValue) }); function setCookie(name, value){ var days = 1; var exp = new Date(); exp.setTime(exp.getTime() + days*24*60*60*1000); document.cookie = name + '=' + value + ';expires=' + exp.toUTCString(); } function getCookie(name){ var reg = new RegExp('(^| )' + name + '=([^;]*)(;|$)'); return document.cookie.match(reg) ? JSON.parse(document.cookie.match(reg)[2]) : null; }