新华社最新AI报告:大模型概念红利逐渐消失,需关注大模型+行业

2023-08-15 10:39:37   来源:新浪VR

  近日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告 2.0》,其中提到,大模型概念红利逐渐消失,正回归到实际应用。

  报告针对大模型给出发展建议,并对未来发展趋势进行解读。另外报告评测了国内8个大模型产品,包括科大讯飞、文心一言、360智脑等。

  发展趋势及建议

  报告指出,AI技术发展的重点已经不再是盲目追求大模型,而是转向实用性和可持续性的发展。越来越多的企业和学术界开始关注如何将大模型与实际应用场景相结合,实现真正的商业化应用。

  建议通过降低成本、提高易用性,以及通过安全可解释、提升数据安全等措施,以提高大模型的可用性。

  随着大模型概念红利逐渐消失,应在未来持续加强算力基础设施建设,跨领域知识、多模态数据融合,深耕安全可靠的大模型产品应用,让大模型走向实体经济。

  大模型评测

  新华社研究院中国企业发展研究中心曾在6月发布《人工智能大模型体验报告》,此次对评测进行了升级,主要引入Benchmark-人类答案做对比,更加直观观测A模型与人之间的差异。

  另外,题目数量由300道扩充到500道,根据目前市场情况,增加二级分类权重,并细化二级分类,侧重考察产品的基础能力和智商部分等。

  在具体的评测维度方面,包含:基础能力、智商测试、情商测试、工具提效能力。

  本次评测产品共8个,排名为:讯飞星火、文心一言、商量、ChatGLM、360智脑、天工、通义千问、Mchat。

  在各项具体能力方面,文心一言的基础能力十分突出;星火、ChatGLM的智商指数同样优秀;商量的情商指数有明显优势;星火的工具提效指数一骑绝尘。

  而各项能力与人类的对比方面,人类与AI之间的基础能力差距并不显著,此外,人类在智商、情商方面明显优于AI,但AI的工具效率远超人类。

  最后

  此次新华社发布的报告2.0,指出了国内AI大模型未来发展的方向,其中的重点是大模型的实际应用,未来,大模型+行业的发展将愈发重要。

  但在产品评测上,所选取的大模型数量有限,加之没有更多评测细节的展示,所以对于用户来说,还需要通过自己的亲身体验来感受各个大模型的优劣,并作出自己的评判。

  报告全文可进入元力社官网查看:https://yuanlishe.cn/doc/docView?id=304

新浪声明:新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

微博

HOT RECOMMEND

关于新浪VR | 论坛社区

Copyright © 1996-2015 SINA Corporation, All Rights Reserved 京ICP证000007  京网文【2017】10231-1157号

北京幻世新科网络科技有限公司 版权所有