沉寂已久的 AI 巨头商汤 4 月 24 日迎来大爆发,当日股价飙涨 31.15%。商汤的放量大涨行情也成为了市场焦点,4 月 24 日上午 11 时 15 分起,公司股票暂停买卖。股价燃爆背后,商汤推出了日日新大模型 5.0,性能超越 GPT-4Turbo。当日晚间,商汤在港交所回应了日日新大模型 5.0 相关事项,并称公司股票于 4 月 25 日起恢复买卖。

  股价大涨

  交易行情显示,4 月 24 日,商汤高开 3.28%,开盘后公司股价迅速拉升,盘中涨超 30%,开盘后涌入大额买单,公司股价也被迅速推高,早盘涨超 30%,之后 11 时 15 分起公司股票暂停买卖。暂停交易前,商汤股价涨幅 31.15%,股价报 0.8 港元/股,当日成交金额 12.6 亿港元,成交量远高于前几日。

  4 月 24 日午间,商汤方面对北京商报记者表示,4 月 23 日,日日新大模型 5.0 发布会广受好评,受到市场极大关注;依照上市规则及港交所建议,公司将进一步刊发相关公告。当日晚间,商汤在港交所发布公告称,已向港交所申请 4 月 25 日上午 9 时起恢复买卖。

  商汤在公告中表示,公司于上海临港 AIDC 举办技术交流日活动,其中公司推出 6000 亿参数大模型(日日新 5.0),在知识、数学、推理和代码能力方面大幅提升,综合性能全面对标 GPT-4Turbo。同时,公司推出行业大模型一体机版本以及移动端侧大模型 SDK 版本。

  二级市场上,今年以来,商汤股价接连走低,不过 4 月 24 日一日涨幅收回公司近一个月累计跌幅。

  商汤股价大涨下,4 月 24 日港股 AI 概念股也表现活跃,其中微盟集团收涨 13.22%,创新奇智收涨 7.91%。

  沉寂已久

  商汤系 AI 巨头,据公司披露的 2023 年年报,公司全年实现营收 34 亿元,毛利润为 15 亿元,毛利率 44%。当年,日日新大模型+大装置驱动生成式 AI 业务爆发式增长 200%,收入已达 12 亿元,为集团贡献 35% 的营收。2023 年,商汤主要经营生成式 AI、传统 AI 和智能汽车三大业务板块,以生成式 AI 业务为重点发展方向,同时保持传统 AI 业务和智能汽车的优势。

  此前商汤已经发布多款大模型,但都反响平平。去年 4 月 10 日,商汤首次公布“日日新 SenseNova”大模型体系以及自研的中文语言大模型应用平台“商量”,参数量达千亿,可实现文本生成、图像生成、多模态内容生成等能力与场景应用。

  2023 年7、8 月以及今年 1 月,日日新大模型分别升级到 2.0、3.0 版本以及日日新 V4.0,“商量”2.0 和小模型商量S版(SenseChat S)等不同参数量级模型版本页同时发布,可适配移动端等不同终端及场景的应用需求。新的日日新 V4.0 通过提高训练数据的质量以及实现基础语言能力的显著提升,在代码编写、数据分析、医疗问答等多个场景中达到与 GPT-4 相匹配的能力,同时还开源对应 7B 和 20B 的两种参数基模型。

  此外,商汤创始人汤晓鸥去年 12 月去世,对公司也是一次沉重打击。

  解决瓶颈?

  4 月 23 日,商汤董事长兼 CEO 徐立在交流日上表示,日日新 5.0 最重要的提升除了模型采用混合专家(MoE)之外,还解决了数据质量的瓶颈。在知识层面上采用超过 10T 的 Tokens,使得高质量数据的完备性能够得以保持。

  商汤联合创始人、首席科学家王晓刚在接受北京商报记者采访时表示,日日新 5.0 首次加载低于 0.4 秒,解码大于 20Token 每秒。据商汤 2023 年年报,商汤在端侧已实现了全球主流安卓手机厂商的大多数合作。对此,王晓刚对北京商报记者提到,在众多手机厂商自研大模型的情况下,之所以还选择商汤是因为高质量的端侧模型离不开高质量的数据,一部分高质量的数据是在商汤进行云端大模型开发的整个链条过程中,一直在持续提升数据质量、体量。另外,商汤的大模型也会生成相应的数据,用于加强对小模型的训练。

  商汤在年报中表示,公司生成式 AI 的客户包含三大运营商、招商银行、海通证券等机构,京东、小米、阅文等头部互联网公司,以及清华大学、上海交大等学术机构。据商汤旗下智能汽车平台品牌绝影智能的官方公众号,日日新大模型已经应用于小米 SU7 汽车之中,用于助力小爱同学在车载语音场景中的应用。

  对于商汤的股价未来走势,有分析师认为,仍要看未来业内采用何种方法和逻辑给商汤估值。“这里其实有一个框架变换的过程,尚不知道最后会稳定到什么程度。”

  北京商报记者马换换