Mistral发布Codestral,其首个用于编码的生成式AI模型
Mistral,这家得到微软支持并估值60亿美元的法国人工智能初创公司,已发布其第一个用于编码的生成式AI模型,名为Codestral。Codestral,像其他生成代码模型一样,旨在帮助开发人员编写并与代码互动。Mistral在博客文章中解释,该模型在80多种编程语言中进行了训练,包括Python,Java,C++和JavaScript。Codestral可以完成编码功能,编写测试并“填充”部分代码,以及用英语回答有关代码库的问题。 Mistral将该模型描述为“开放”的,但这是有争议的。该初创公司的许可证禁止将Codestral及其输出用于任何商业活动。有一个“开发”的例外,但即使如此也有许多限制:许可证明确禁止“员工在公司业务活动的背景下进行任何内部使用”。造成这种情况的原因可能是Codestral在一定程度上是基于受版权保护的内容训练的。Mistral并未在博客文章中确认或否认这一点,但如果有证据表明该初创公司之前的训练数据集包含受版权保护的数据。无论如何,Codestral可能并不值得麻烦。这款模型拥有220亿个参数,需要一台强大的个人电脑才能运行。(参数基本上定义了AI模型解决问题的能力,比如分析和生成文本。)虽然它在一些基准测试中击败了竞争对手(正如我们所知,这些测试是不可靠的),但它并不完全占据优势。 尽管对大多数开发人员来说并不切实际且在性能改进方面是增量的,Codestral肯定会引发关于依靠生成代码模型作为编程助手的智慧的辩论。开发人员肯定正在接受生成式AI工具,用于至少一些编码任务。根据2023年6月Stack Overflow的一项调查,44%的开发人员表示他们现在在开发过程中使用AI工具,而26%计划很快开始使用。然而,这些工具显然有缺陷。通过分析过去几年提交到项目存储库的1.5亿行代码,GitClear发现,生成式AI开发工具导致更多错误的代码被推送到代码库中。此外,安全研究人员警告称,这类工具可能会放大软件项目中现有的错误和安全问题;根据普渡大学的一项研究,OpenAI的ChatGPT对编程问题给出的超过一半的答案是错误的。 这并不会阻止Mistral和其他公司试图通过其模型实现商业化(并在市场上取得知名度)。今天早上,Mistral在其Le Chat对话式人工智能平台上推出了Codestral的托管版本,以及其付费API。Mistral表示,他们还努力将Codestral构建到应用程序框架和开发环境中,如LlamaIndex,LangChain,Continue.dev和Tabnine。