当前位置:编程学堂 > 甚至比 GPT-4 还要强大,20 亿参数模型可以以几乎 100% 的准确率做算术问题

甚至比 GPT-4 还要强大,20 亿参数模型可以以几乎 100% 的准确率做算术问题

  • 发布:2023-10-11 06:00

目前,大型语言模型(LLM)在处理 NLP 领域的各种下游任务方面表现出了出色的能力。特别是,GPT-4和ChatGPT等开创性模型已经接受了大量文本数据的训练,赋予它们强大的文本理解和生成能力、生成连贯且上下文敏感的响应的能力以及在各种NLP任务中的高度多功能性。性别。

然而,LLM在数学推理方面的表现却不尽如人意。 LLM很难准确地进行复杂的算术运算,尤其是涉及超过8位数字的乘法运算,以及涉及小数和分数的运算。

基于此,清华大学、好未来人工智能实验室和智普人工智能的研究人员共同提出了一种可以完美执行复杂算术运算的新模型——MathGLM。

相关文章