“书生・浦语”2.0大语言模型开源 200K上下文

2024-01-17 深圳推广 前沿资讯

IT之家今日(1月17日)消息,商汤科技与上海 AI 实验室联合香港中文大学和复旦大学今日发布了新一代大语言模型书生・浦语 2.0(InternLM2)。

“书生・浦语”2.0大语言模型开源 200K上下文 前沿资讯 第1张

据介绍,InternLM2 是在
2.6 万亿 token 的语料上训练得到的。沿袭第一代书生・浦语(InternLM)设定,InternLM2 包含 7B 及
20B 两种参数规格及基座、对话等版本,继续开源,提供免费商用授权。

目前,浦语背后的数据清洗过滤技术已经历三轮迭代升级,号称仅使用约 60% 的训练数据即可达到使用第二代数据训练 1T tokens 的性能表现。

“书生・浦语”2.0大语言模型开源 200K上下文 前沿资讯 第2张

与第一代InternLM相比,InternLM2在大规模高质量的验证语料上的Loss分布整体左移,表明其语言建模能力增强。

“书生・浦语”2.0大语言模型开源 200K上下文 前沿资讯 第3张

通过拓展训练窗口大小和位置编码改进,InternLM2支持20万tokens的上下文,能够一次性接受并处理约30万汉字(约五六百页的文档)的输入内容。

下面表格对比了InternLM2各版本与ChatGPT(GPT-3.5)以及GPT-4在典型评测集上的表现。可以看到,InternLM2在20B参数的中等规模上,整体表现接近ChatGPT。

“书生・浦语”2.0大语言模型开源 200K上下文 前沿资讯 第4张

相关推荐://
  • 周鸿祎:留给谷歌的时间不多了 建议所有产品开源
    hover

    周鸿祎:留给谷歌的时间不多了 建议所有产品开源

    本周,谷歌举办I/O 2024开发者大会,发布了Gemini 1.5 Flash、文生图工具Imagen 3以及视频生成模型Veo等产品。 日前,360集团创始人周鸿祎在微博发长文点评了今年的谷歌I/O大会。周鸿祎表示,“我的整体感觉是,现在留给谷歌的时···

    2024-05-18
  • 李彦宏称大模型开源意义不大 周鸿祎:别被忽悠了
    hover

    李彦宏称大模型开源意义不大 周鸿祎:别被忽悠了

    在近日的一次内部讲话中,百度董事长李彦宏给开源大模型泼了不少冷水。 李彦宏认为,大模型开源的意义不大,闭源模型在成本和能力上会持续领先。 而对于大模型开源与闭源之争,360集团董事长周鸿祎在哈佛大学的演讲中表示,他···

    2024-04-15
  • 李彦宏首次回应为何不开源文心:闭源能赚到钱 聚集人才
    hover

    李彦宏首次回应为何不开源文心:闭源能赚到钱 聚集人才

    4月12日消息,据媒体报道,在近日的一次内部讲话中,李彦宏首次回应了为什么不开源文心大模型。 李彦宏表示,一年前文心刚刚发布的时候是有过非常激烈的讨论的,但最终还是选择了不开源,因为当时的判断是,市场上一定会有不···

    2024-04-12
  • 马斯克xAI推出Grok-1.5大语言模型 可处理128k上下文
    hover

    马斯克xAI推出Grok-1.5大语言模型 可处理128k上下文

    IT之家今日(3月29日)消息,马斯克旗下人工智能公司xAI今天在官方博客中宣布,正式推出Grok-1.5大语言模型。 Grok-1.5具有改进的推理能力和128k的上下文长度,其中最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5···

    2024-03-29
  • 谷歌发布全球最强开源大模型Gemma 可在笔记本运行
    hover

    谷歌发布全球最强开源大模型Gemma 可在笔记本运行

    今日凌晨,Google宣布推出先进的轻量级开放模型系列Gemma,该模型采用了与创建 Gemini 模型相同的研究和技术。 Google表示,受到 Gemini 的启发,Google DeepMind 和 Google 其他团队合作开发了 Gemma,并用拉丁语中意为“宝···

    2024-03-06
  • 我国开源软件开发者人数已突破800万 位居全球第二
    hover

    我国开源软件开发者人数已突破800万 位居全球第二

    近日据央视报道,目前我国开源软件开发者数量已突破800万,位居全球第二。在开放原子开发者大会上,开放原子开源基金会秘书长冯冠霖表示:“目前97%的开发者和99%的企业都在运用开源软件,我们开发者的数量应该是位居全球第二。” ···

    2023-12-28
  • 免费的开源工具:缩短 macOS 菜单栏并隐藏不常用的内容
    hover

    免费的开源工具:缩短 macOS 菜单栏并隐藏不常用的内容

    对 macOS 用户来说,一些常用的软件或能,可过右上角的 Menu bar 直接访问,不过日子久了,你会发现它的图标越来越多,你的 Menu bar 渐渐变得越来越长。 如果你用MacBook更可能会超过「刘海」的中间位置。 这次为大家推荐一套名为 Hi···

    2023-12-01
  • 开源软件是指什么
    hover

    开源软件是指什么

    开源软件是指其源代码是公开可见、可以被任何人自由访问、使用、修改和分发的软件,具有以下特点和优势:1、自由访问和使用;2、可以根据自己的需求对开源软件进行修改和定制;3、源代码对所有人都是可见的;4、鼓励用户和开发者参与···

    2023-08-28
在线客服 13691917840 提交需求 二维码