3月26日,商汤发布2024年全年业绩财报。2024年,商汤集团的总体收入同比增长10.8%,达到37.7亿元人民币;其中,生成式AI收入突破24.0亿元人民币,同比增长103.1%,这是生成式AI连续两年保持三位数增速,已成为集团最大业务。
大模型面世两年多时间以来,从前期的一味追求大模型Scaling Law,到如今算力效率、训练转推理,应用落地等被接连质疑,大模型已经全面来到新的发展阶段。
这是产业逐步成熟的标志,但同样也在堆叠算力之外,对工程技术以及场景协同能力提出了更高的要求。
在众多传统大模型厂商之外,作为第一代“AI原生”企业,商汤在AI基础设施上的投入早于几年前便开始布局,此后战略升级为“大装置-大模型-应用”的三位一体核心战略,而这一战略正显现出其在AI产业的前瞻性。
“大装置”是指商汤的AI基础设施,为大模型提供强大的算力支撑,大模型驱动技术创新,应用端推动AI商业化落地——过去三年,商汤已经形成了“大装置-大模型-应用”三者协同的良性生态闭环,赋能千行百业。
我们看到的是,历经过多次技术周期起伏,商汤的技术积淀正迎来爆发。
01 有算力、懂算力
2024年5月,国内权威大模型测评机构SuperCLUE榜单出炉。商汤“日日新5.0”(SenseChat V5)的中文基准测评结果排名第一,以总分80.03分的成绩刷新国内最好成绩,并且在中文综合成绩上超越GPT-4 Turbo, 这是国内大模型首次在SuperCLUE中文基准测试中超越GPT-4 Turbo实现登顶。
之所以能够斩获如此成绩,与商汤在AI基础设施上的提早布局至关重要。
众所周知,2024年以来,全国智算中心的建设高速推进。从训练到推理,算力的资源属性愈发显现,而且市场仍面临算力资源分散且标准不统一、使用起来效率不高的问题。
商汤正是针对这一痛点,布局算力运营,将不同标准的卡连接起来,适配不同需求,满足不同类型的客户。
商汤科技董事长兼CEO徐立认为,一些科技巨头的重心在于自己的生态,包括自研芯片和云平台等,但当下AI领域要抢占先机,什么资源更快更好用就先用起来,不局限于一家的产品和平台,“商汤提供的基础服务更贴近AI发展现状。”
过去三年,商汤持续投入建设AIDC基础设施。据悉,商汤自持的全国首个5A级智算中心——上海临港AIDC,通过运营模式将算力规模提升至了23,000PetaFlops。
通过与大模型迭代的联合调优,商汤大装置的目标是成为“最懂大模型的AI基础设施”,不仅服务于日日新大模型的训练与推理,还服务于包括互联网、金融、能源等成熟行业,还拓展性服务了具身智能、AIGC、AI4S(AI For Science)等高潜行业的客户。
徐立曾表示,商汤是最懂模型的算力服务商,最懂算力的模型服务商。
02 三位一体
算力只是生态其中一环。大模型产业能够高效运转,还需要靠上下游协同发力。
“今天人工智能的商业模式不管是训练模型,还是用模型对外服务,本质意义上都是在消耗资源,付的是资源的费用。所有的商业模式最后都和计算资源消耗划了一个等号,就是通过‘三位一体’,把资源以最有效的方式整合使用起来。”徐立表示。
“三位一体”是2024年10月商汤确立的战略方向,是商汤以大装置作为AI基础设施为底座,实现“大装置-大模型-应用”三位一体、联合优化的战略。
算力与模型的双向优化,进一步提升了大模型的训练和推理效率。在提升训练效率方面,商汤通过采用自动化多维并行策略显著提升了训练效率,并且实现了FP8混合精度训练,特别是对类似于DeepSeek的优秀第三方开源模型,大装置做到高于官方报告的训练效率,形成行业标杆。
在提升推理效率方面,商汤的推理系统进行低比特量化推理,支持开源vLLM及自研lightLLM双推理引擎,以DeepSeek R1为例,商汤的推理吞吐性能比业界头部厂商高15%以上。通过模型蒸馏技术、键值缓存、PD(Prefill-decode)分离、多模态信息压缩等技术,商汤在基本保持模型性能的前提下将推理成本压低了一个数量级。
因此,即使是同样一个模型,在不同的算力底座上,会有完全不同的训练及推理效率。
随着向生成式AI演进的稳步推进,“三位一体”进一步整合了商汤的资源优势,使其在大模型时代的内卷竞争中打出差异化。
商汤科技日日新大模型重点打磨生产力工具与交互工具两个方向的应用与产品。生产力工具直接为企业办公、金融、政务等场景提高生产效率,以订单金额为代表的客户付费意愿较2023年增长6倍;交互工具通过2B2C的方式赋能业务伙伴,提升用户体验,满足智能陪伴、智能硬件交互、智能营销等多场景需求,月均用户使用量较2023年增长8倍。
日日新大模型在保持领先的市场应用占有率和客户服务粘性的基础上,在模型技术上始终保持领先的位置。2023年4月商汤首次推出商汤日日新SenseNova大模型体系,至2024年7月完成5大版本迭代。其中,2024年7月发布的日日新5.5版本在多模态能力上显著提升,为国内首个对标GPT-4o的多模态实时交互大模型,实现语音、视频和语言模型的原生融合。值得期待的是,商汤日日新6.0将于2025年4月10日发布,性能预期对标Gemini 2.0 Pro。
此外,基础设施搭建好后,商汤同样及早布局应用。
03 为什么是原生融合多模态
生成式AI爆发后,多模态大模型早已成为人们追求的方向。然而,市面上很多应用中接触到的多模态模型并不能说是“完全体”。
就像谷歌所认为的,只有从头开始的多模态才能构建出超越前代的先进模型。这意味着它天生地可以读取和输出不同模态内容,还具备强大的多模态推理能力和跨模态迁移能力。
技术上,这被称为“原生融合多模态技术”,被认为是AI未来发展的必由之路,也是商汤当下重点投入的研究领域。
与传统的多模态模型不同,商汤的技术并非简单地将不同模态内容转换为语言token输入,而是从数据层、模型架构层进行全流程融合,涵盖感知、思考到输出的完整过程。
在2024年全球CVPR大会上,商汤科技共有50篇论文入选,研究成果聚焦于视觉语言基础模型,涉及自动驾驶、机器人等前沿领域。
商汤的多元化AI产品均已有所应用成效。据悉,目前商汤“小浣熊家族”已为数十万用户提供数十亿次智能辅助服务。而商汤绝影在行业内也率先实现了原生多模态大模型的车端部署。
在AI的新阶段,商汤前瞻性地布局了硬件基础设施和应用端,通过底层和上层的协同优化构建起了技术壁垒。
在基础设施端,商汤自建AI数据中心(AIDC)和规模化研发服务,确保公司在传统基础设施厂商和AI原生公司中脱颖而出。在应用端,商汤拥有全栈体系AI应用,覆盖行业广泛,大模型聚焦于原生融合多模态发展。
可以预见,商汤的“储备”有望在AI应用爆发后为公司带来巨大发展空间。
少归被狂C下部❌羞羞视频 | 1天前 |
PornoHD1000💋💋 |
男人隐私㊙️黄www网站 | 6天前 |
成人🔞免费A片 |
🔞AI网站无下载免费看 | 7天前 |
❤️爱情岛论坛网站入口 |
动漫3D❌️吸乳羞羞漫画免费 | 2天前 |
动漫玉足❌吸乳羞免费网站玉足 |
美女拉屎隐私㊙️网站 | 0天前 |
男人把🍆又入女人的🍑里 |
真人不知火舞被❌🔞🈲 | 6天前 |
"18🈲🍆🍆🍆🍆网站 |
成人🔞AV精 | 3天前 |
小兰被❌到爽羞羞漫画 |
XXX💋🍌🍆🍑男性恋 | 5天前 |
国外精品㊙️天美传媒 |
国产又爽❌又黄❌免费智库q | 5天前 |
博人✖️雏田h性教育 |
美女免费❤️ | 1天前 |
成人网站♥3D动漫玄衣 |