“商量 SenseChat” 的网址。商汤 “商量 SenseChat” 于 2023 年 4 月首次推出,是国内最早的基于千亿参数大语言模型之一,并不断迭代更新。目前,其基模型为商汤联合多家国内顶级科研机构发布的书生・浦语 InternLM-123B,拥有 1230 亿参数,在语言、知识、理解、推理和学科五大能力上均处于行业领先水平,并在全球 51 个知名评测集共计 30 万道问题集合上测试成绩整体排名全球第二,超过 GPT-3.5-turbo 以及 Meta 新发布的 LLaMA2-70B 等模型,在主要评测中 12 项成绩超越 GPT-4,排名第一。
“商量 SenseChat” 背后依托商汤 AI 大装置 SenseCore,其上线 GPU 数量由 2023 年 3 月底的 27000 块提升至日前的约 30000 块,算力规模提升 20% 至 6 ExaFLOPS,可有效支持语言大模型的训练、升级迭代和服务。在训练数据方面,商汤每月可产出约 2 万亿 token 的高质量数据,以支持基模型训练。预计今年底,高质量数据储备将突破 10 万亿 token。同时,公司还投入数百台服务器,它们搭载了千卡 GPU 的计算资源,采用算法结合人工的方法,对原始语料数据进行分门别类的精细化清洗,以确保数据的质量、安全性和价值观都符合要求。
2023 年 8 月 31 日,商汤大模型应用 “商量 SenseChat” 全面向广大用户开放服务。