腾讯首次披露行业大模型进展:不追求参数高,希望成本预算可控-环球聚焦
(相关资料图)
IT之家 6 月 20 日消息,6 月 19 日,腾讯云行业大模型及智能应用技术峰会在国家科技传播中心召开,腾讯首次对外披露行业大模型研发进展,发布依托腾讯云 TI 平台打造行业大模型精选商店,为客户提供 MaaS(Model-as-a-Service)一站式服务,助力客户构建专属大模型及智能应用。
腾讯云还联合多家客户和生态伙伴,启动了行业大模型共建合作和生态计划,推动大模型在各个领域的创新应用。基于腾讯 HCC 高性能计算集群和大模型能力,为传媒、文旅、政务、金融等 10 余个行业提供超过 50 个大模型行业解决方案。
据澎湃新闻报道,腾讯此次发布的并非是 C 端通用大模型,而是落地于 B 端的产业大模型。对此,腾讯云副总裁吴运声解释称,对于 C 端通用大模型,腾讯内部也有相关应用,但目前尚不能对外公开相关信息。
吴运声还表示,基本在亿级别参数以上的都可以称为大模型,但规模参数越高,消耗的资源和成本也越相应增加。行业大模型的核心在于根据客户需求制定相关的模型参数,而不是一味追求“规模大”或是“参数高”。在他看来,随着技术和算力的发展,大模型的参数规模也在不断上涨,腾讯更关注怎么用更有效的方法、更低的成本去解决问题,而不是关注几亿、几十亿、几百亿还是一千多亿这些数字。他举例说,就像不同类型的运动员需要不同程度的体力训练一样,不需要每个人都追求最高的参数规模。希望能以最低的成本、最合适的模型和最好的服务把大模型真正做好,会在预算和成本可控的情况下提供最符合逻辑的模型,让其在场景中达到目的,解决问题。
吴运声还透露,目前腾讯云行业大模型能力已在腾讯企点、腾讯会议、腾讯云 AI 代码助手等多款产品中落地使用。
通用大模型通常需要更高的参数规模和更强的算力支持,也更具有挑战性和前瞻性。IT之家注意到,腾讯云此前发布了新一代高性能计算集群 HCC,采用英伟达最先进的 H800 GPU 芯片,其算力超过旗舰芯片 A100 三倍,为大模型训练提供了强有力的保障。