人工智能行业深度报告:AI大模型赋能千行百业

2023-09-15 18:37:20   来源:新浪VR

  (报告出品方/作者:国泰君安证券,李沐华、齐佳宏、李博伦)

  1. AI+办公是 AIGC 浪潮的核心,有望深刻改变办公模式

  1.1. AI+办公是AIGC 浪潮的核心,海外巨头引领潮流

  AI+办公是此次 AIGC 浪潮中的核心受益方向。此次 AIGC 浪潮的引爆点是基于自然语言处理大模型技术的文字创作工具 ChatGPT 快速成长 为火爆全球的现象级应用,随后基于对图像、视频、音频等进行处理的 多模态大模型的应用也快速推广起来。AIGC 即生成式人工智能天然是 面向文字、音视频、图像等内容自主创作场景的 AI 技术,因而其可以 直接提升现有各类型办公软件的产品力,从而推动办公软件的迭代升级。

  微软推出 Microsoft 365 Copilot 订阅服务,用 AIGC 技术重塑办公体验。 2023 年 3 月 16 日,微软正式发布 Microsoft 365 Copilot 订阅服务,其背 后技术支撑是 Copilot 引擎,使用了 Microsoft 365 Apps、Microsoft Graph 和 Large Language Model 三大核心基础技术。Microsoft 365 Apps 是 Word、 Excel、PowerPoint、Outlook、Teams 等一系列常见的微软办公软件; Microsoft Graph 是一个可以帮助访问在 Microsoft 365 Apps 上积累的用 户业务数据的安全智能网关,这些数据来自于用户的文档、电子邮件、 会议、聊天、日历等环节;大语言模型(LLM)是一个创造性的引擎, 能够解析并产生人类可以阅读的文字,其使用了 OpenAI 的 ChatGPT 及 最新发布的 GPT4 模型。用户在 Microsoft 365 Apps 里使用自然语言输入 提示词后,提示词会通过 Copilot 系统进行基础训练,这一过程可以提 高提示词的质量,使提示词变得可以被执行,在基础训练的过程中最重 要的一环便是调用 Microsoft Graph 中用户此前产生的各项数据,来理解 并改善提示词的质量,之后将改善后的提示词发送给 LLM,前述过程叫 做预处理。LLM 对提示词进行响应并进行后处理,这个过程会再次通过 Microsoft Graph 调用用户数据进行训练后,在通过安全性、合规性和隐 私审查之后,生成反馈答复,最后通过 Copilot 系统向用户输出反馈答 复并驱动 APP 执行相关的命令。通过这样一套完整的处理流程,用户可 以在 Word 等办公软件里通过自然语言下达指令,此后办公软件便自动 呈现出一个具有明显个人信息特征的反馈初稿,极大提高了用户的办公 效率。

  Microsoft 365 Copilot 为用户办公模式带了个革命式的变化,有助于 提高办公创作效率。Microsoft 365 Copilot 一方面会嵌入到用户高频 使用的各类办公软件之中,包括了 Word、Excel、PowerPoint、Outlook、 Teams 等,从而帮助用户从繁琐的事务性工作中解放出来,让用户更专 注于创造性工作,从而提高办公效率。另一方面还引入了全新的商务聊 天(Business Chat)应用场景,可以基于用户过往积累各项业务数据, 按照用户需求生成全新的内容,提高创作效率,例如用户提出“请告诉 团队成员如何更新销售策略”指令后,系统会根据用户过往的会议讨论 记录、聊天记录、电子邮件沟通内容等生成一份全新的销售策略。用户 可以对生成后的内容进行自主修改、保留或舍弃,使得 Word 更具创造 性、Excel 更具分析性、PowerPoint 更具表现力、Outlook 更具效率性、 Teams 更具协作性。

  Microsoft 365 Copilot 使用自然语言作为人机交互的渠道,降低了 Office 办公软件的使用门槛。根据微软发布会上披露,有 90%以上的 PowerPoint、 Excel 功能是不被用户使用的。我们认为这一现象并不是因为这些功能 无用,而是过往通过菜单按钮或者函数公式的方式进行交互的门槛较高, 多数用户未经过系统学习就无法直接调用相关功能。引入 Copilot 之后, 所有的办公软件在右侧都会形成一个聊天框,用户将自己想要实现的效 果(如进行某种排班、添加某种动画效果或者进行某种特殊运算)以自 然语言聊天的方式输入后,软件会直接实现相关的功能,从而使得丰富 的软件功能都得到应用,极大降低了用户的使用门槛,有助于进一步提 高用户规模和粘性,从而提高付费月活用户数量。

  Microsoft 365 Copilot 的推出将为微软带来新的收入来源,提高付费用 户 ARPU。目前 Microsoft 365 Copilot 仍处于内部测试阶段,根据科技 媒体 The Information 报道,微软正在向包括美国银行、沃尔玛、福特 和埃森哲等在内的 600 多家大型机构客户测试具备 AI 能力的 Microsoft 365 Copilot 订阅服务,在已经付费订阅 Microsoft 365 年费会员的基 础上,每 1000 名员工使用 Copilot 服务需要支付的额外年费为 10 万美 元,对应额外的 ARPU 为 100 美元,目前试点客户的付费意愿超出微软 早先预期。我们根据微软财报数据测算,2022 年 Microsoft 365 机构订 阅的 ARPU 约为 103 美元,此次 Copilot 服务的试点价格有望推动 ARPU 实现接近翻倍增长。

  Adobe 推出生成式 AI 模型集 Firefly,展示出强大的设计创作能力。2023 年 3 月 21 日,Adobe 正式推出生成式 AI 模型集 Firefly,随后在 Photoshop 应用中进行了测试上线。目前其主要具备以下能力:1)文字 转图像,Firefly 可以根据用户的提示词自动生成所需图像,如输入“天 空增加极光”指令之后,可以自动为图像中的天空部分增添极光;2) 生成填充能力,可以根据原始图像中内容,自动拓展、填充、扩容成为 一个内容更加丰富的图像;3)文字效果:将特定纹理显示到艺术字体 中等。后续 Firefly 还将探索视频自动处理、文字生成 3D/矢量文件、 草图变全彩图像等一系列 AI 功能。Firefly 的推出有望极大提高设计创 作效率,降低设计创作用户门槛,改变目前的创意设计行业格局。

  1.2. 国内办公软件厂商奋起直追,AIGC 功能实现快速迭代

  金山办公是国内办公软件厂商探索 AI 技术应用的先行者之一。2017 年, AI 在金山办公内部被首次上升到战略层面,由姚冬组建了数百人的 AI 团队,主要负责 AI 算法改进和工程产品的落地。2018 年,金山办公正 式对外提出了“多屏、内容、云、AI”的发展战略,AI 战略公开亮相。 在 AI 团队成立的前两年,团队主要强调积累 AI 研发能力,包括算法能 力、工程能力、数据采集和分析能力等。之后两年公司开始更加注重 AI 技术的产品化,在公司产品中增加了一系列 AI 功能,推出了包含智 能美化、智能校对、智能辅助写作、全文翻译、图像识别等一系列的AI 辅助办公功能,来帮助提高用户的办公效率。例如智能美化可以帮助 用户在提供基础文本的情况下整体改换 PPT 模板和配色、统一字体和排 版等;智能校对可以一键识别并校对文档中的错别字、多漏字、标点符 号错误、语法错误、敏感词错误等;智能辅助写作可以根据提纲自动生 成文字段落或者进行句子补写,帮用户打底稿,其储备的数千万篇语料 库都来自于权威媒体和政府公开网站,在公文写作等场景上有较多应用。 截止 2021 年 7 月,WPS 的智能美化月活用户超过百万,智能校对的月 校对字数超过了 70 亿,智能生成的内容占据了云端整体内容资源的 33.6%,AI 战略对公司产品力和用户粘性的提升已经体现出明显的帮助。 现阶段及未来,公司发展战略的重心已经成为加速 AI 产品的产业化, 强化对公司营收增长的积极作用,从而实现长期的可持续发展。

  金山办公接入多个大模型供应商,可以更精准的满足用户AI创作需求。 目前金山办公的产品已经接入了 MiniMax、百度文心、CopyDone 等多 家大模型,未来还有望接入新的大模型。目前市面上可供选择的大模型 正在持续增加,既包括百度、阿里、科大讯飞等巨头的大模型产品,也 包括初创公司的产品。各家大模型目前的表现各有所长,并没有哪一家 有绝对领先的产品力表现,因而同时接入多家大模型,按照不同的用户 需求去匹配调用不同的大模型进行内容创作,能够更好的满足用户的创 作需求。例如 CpoyDone 是一个专门面向场景营销打造的大模型,可以 生成丰富商品类型、海量内容平台风格的文案、图片、视频内容,因为 在文案营销场景 WPS 可以优先对接 CopyDone 大模型;MiniMax 是一个 多模态大模型,在对华聊天等场景更有优势;百度文心则凭借其丰富的 语料库在文学创作等领域可以更好的满足用户需求;WPS 作为大模型的 调度匹配中心,可以统筹各家大模型发挥出“1+1>2”的效果。

  基于 AI 大模型的 WPS 轻文档率先进入内测阶段,展示出较强的文字创 作能力。2023 年 4 月 18 日,金山办公发布了 WPS AI 的 Demo 演示视 频,官宣 WPS AI 将嵌入金山办公全线产品。率先进入内测阶段的是具 备 AI 能力的 WPS 轻文档,这是一款对标 Notion AI 等轻办公产品的在 线内容协作编辑工具,可以借助大模型自动生成新闻稿、工作周报、运 营策划案等;也可以实现多轮对话,持续就某个主题进行讨论;也可以 对现有文档进行改写、扩写、缩短、润色等;还可以对指定文档生成主 旨摘要、文章大纲等功能。WPS AI 显示出较强的文字创作能力,有望 提升用户创作效率。

  福昕软件在海外版 PDF Editor Cloud 中集成 ChatGPT,向用户提供 AIGC 功能。福昕软件是 PDF 板式办公软件龙头企业,其推出的 Foxit PDF Editor Cloud 是一款在线 PDF 编辑器,用户可以通过该工具在线阅读及 编辑 PDF 文件。2023 年 4 月 25 日,海外版的 Foxit PDF Editor Cloud 成功集成 ChatGPT,付费用户目前主要可以使用以下 AIGC 功能,1)文 档摘要,根据文档内容快速生成简洁、准确的摘要;2)文档改写,在 不改变文档原意的情况下进行重写,优化文档的表述方式,提高可读性; 3)文档翻译,将选定内容或者摘要翻译成指定语言;4)文档内容问答, 可以在对话框中就感兴趣的内容进行提问,其将根据文档内容生成答案, 并定位到相应段落。通过上述功能,可以显著提高用户的文档阅读效率 以及多语言工作环境下的工作效率。作为一款线上编辑软件,Foxit PDF Editor Cloud 的 AI 功能具备快速迭代的优势,预计每两个星期就推出 一个新版本,持续拓宽 AIGC 技术在文档领域的数字化场景应用,优化 用户体验,从而提供用户付费率。

  AIGC 功能有望提升福昕软件 ARPU。由于 Foxit PDF Editor Cloud 提供 的 AI 功能基于 ChatGPT,因而对用户均有次数/字数限制,文档改写每 用户每月上限为 100 页;文档翻译每用户每日上限为 50 个指令,每个 指令最多 2000 字;文档内容问答每用户每日上限为 50 个指令或问题; 一旦超过相应限制,用户需要进行额外付费,从而有助于提高用户 ARPU。 万兴科技拥有完善的创意办公软件产品线,是国内创意办公软件的领跑 者。公司产品涵盖视频创意、绘图创意、文档创意和实用工具四大类别, 形成了万幸喵影、万兴播爆、亿图脑图、万兴爱画、万兴 PDF 等具有广 泛影响力和庞大用户群的核心创意办公软件产品。

  万兴科技长期加码 AI 技术研发投入,AI 产品逐渐进入落地期。公司从 2020 年就开始洞察到 AI 技术的发展前景,并快速组建了一支上百人的 高素质技术研发团队,近两年在视频生成算法、图像生成算法、GAN 生 成算法、音频生成算法等 AI 前沿算法等领域均取得多项技术研发成果, 自 2022 年下半年以来公司视频创意、文档创意、绘图创意等主要产品线均陆续发布了带有 AI 功能的新版本,并推出融入多项 AI 技术的新产 品。在视频创意产品线,2022 年公司完成了万兴喵影大版本更新,上线 了 AI 分割、AI 抠像、AI 降噪、AI 音频重组、AI 文案生成等 AI 功能套 件,并在 2022 年底发布了基于 AIGC 技术的数字人营销视频创作工具万 兴播爆,可以实现文生视频、虚拟人直播等 AI 功能;在绘图创意产品 线,2022 年 11 月公司上线全新的 AIGC 图像生成工具-万兴爱画,支持 AI 文字绘画、AI 以图绘图、AI 简笔画三种创作模式,用户输入一段文 字描述即可获得多种艺术风格的 AI 绘画作品,或者输入图片后将其转 化为绘画作品;在文档创意产品线,公司发布万兴 PDF 的全新版本,引 入 AI 技术,新增翻译等专业功能,提升用户体验。

  万兴科技积极拥抱大模型技术,推动 AI 产品力实现快速提升。2023 年 2 月,公司宣布其在海外运营的视频创意软件 Wondershare Filmora 已 经全面接入了ChatGPT母公司OpneAI的商用服务,在3月份开通了GPT-4 模型的商用账号权限,在 4 月份与微软签订云服务框架协议,双方将在 云服务及 AI 技术领域全面深化合作,未来优先使用微软新品,目前正 在持续推动多个海外产品接入 GPT 大模型。2023 年 3 月 31 日,公司发 布基于 AIGC 大模型的“真人”出海营销短视频工具-万兴播爆,并在 6 月推出桌面版产品,万兴播爆基于 AIGC 大模型可以提供 120 多种语言 的文案脚本快速生成能力以及 60 多种国籍的数字人播报能力,还可以 进行数字人的定制服务,相较传统视频生产模式,万兴播爆可以使成本 投入降低至原先的 1/5,并大幅提升用户的生产效率。

  AIGC 新品为万兴科技带来新的盈利点,有望提升用户 ARPU。公司传 统的万兴喵影个人年费会员定价为 269 元,5 年期会员的年费进一步降低 至 120 元;万兴喵影企业年费会员定价为 3299 元,可支持 5 台设备同 步使用,相当于单设备年费价格为 660 元。公司推出的 AIGC 新品中, 万兴播爆的年费会员定价为 1688 元,相较传统软件产品的定价有显著 提升;万兴爱画则按照创作次数进行付费,10 次图片创作合计 5 元,最 便宜的 100 次图片创作合计费用为 20 元,按次收费的方式在客户需求 侧有更高的成长上限。总体来看,AIGC 新品的定价要高于传统创意软 件,有望为万兴科技带来新的盈利点,提升用户 ARPU。

  2. 智能驾驶是 AI 大模型落地的重要场景

  2.1. 自动驾驶:AI 大模型有助于我们提升覆盖小概率路况的 效率

  2.1.1. 对小概率路况的覆盖是自动驾驶落地的核心问题

  由于一旦发生事故造成的后果极为严重,自动驾驶是一个对小概率情况 非常敏感的场景。由于交通事故将会产生非常严重的后果,对于主机厂 而言,在责任明晰之前,即使是 99.99%的可靠性也是不能接受的,因为 这可能意味着每卖出 10000 台车可能就会产生一起事故。行业特点决定 了要实现自动驾驶就必须先对长尾场景进行有效覆盖。 测试里程的积累是有效覆盖小概率路况的前提。根据广汽的预测,要实现 L4 级自动驾驶所需要的长尾场景覆盖程度,至少需要完成 10 亿个测 试场景,最小测试里程也需要 10 亿公里,这两个数据分别是实现 L2 级 自动驾驶的 10 万倍、1 万倍。

  此前,测试里程的积累主要有两种方式。一种是通过自动驾驶车队来进 行数据采集,以 Waymo 为代表;一种是通过私家车进行数据采集,以 特斯拉为代表。

  通过自动驾驶车队进行路测来覆盖小概率路况的方法效率比较低。 Waymo 是自动驾驶领域的霸主,但是在过去很多年里,感知问题、 行人问题、软件问题等方面,Waymo 的接管频率并没有收敛(基于 加州路测报告)。毫无疑问,Waymo 的自动驾驶能力是逐年增强的。 那么,Waymo 在软件问题、行人问题等方面的表观“退步”就只能 用它在覆盖更多的小概率路况来解释。比如,在高速公路等路况相 对简单的场景下测试获得好的结果之后,Waymo 会把路测地点逐渐 向难度更高的城区街道进行拓展。

  众包方式能在一定程度上提升对小概率路况的覆盖效率。特斯拉采 用影子模式取代测试车队。影子模式本质上是通过众包的方式来解 决场景的快速积累问题。在这一模式下,即使在人进行驾驶的时候 特斯拉自动驾驶系统同样也在进行计算自己会怎么做,然后和人的 选择进行对比。如果自动驾驶系统和人的选择不一致,就对这类数 据进行汇集,然后交由工程师判断自动驾驶系统的选择是否合理。 2020 年 3 月,特斯拉就申请了从车队中获取自动驾驶训练数据的专 利。由于特斯拉的汽车数量远远多于自动驾驶测试车队,影子模式 可以更快地实现对驾驶长尾场景的积累,同时得到的结果也有更强 的统计学意义。截至 2019 年末,特斯拉累计交付搭载自动辅助驾 驶硬件的车辆 85 万辆,AP 激活状态下累计行驶里程已超过 20 亿 公里,远远超过竞争对手(Waymo 为 2000 万公里)。由于特斯拉保 有量持续攀升,其他竞争对手和特斯拉之间在数据积累量以及长尾 场景覆盖程度上的差距将会越拉越大。

  2.1.2. 大模型对于覆盖小概率路况意义重大

  2.1.2.1. 大模型可以大幅提升场景生成、标注的效率

  随着 AI 大模型的出现,我们覆盖自动驾驶小概率路况的效率有望大幅 提升,这种效率提升至少源于两个方面:

  场景生成

  利用 AI 大模型进行场景生成是覆盖小概率路况的新思路。相对于 单纯的路测,直接进行场景生成,并将仿真结果与路测相结合对于 快速实现路况覆盖大有裨益。比如毫末已发布 DriveGPT 雪湖·海 若,可以实现三项能力: 按照概率生成很多个场景序列,每个场景序列都是未来可能会 出现的一种实际路况; 在所有场景序列都产生的情况下,能对场景中最关注的自车行 为轨迹进行量化。可以实现在生成场景的同时就产生自车未来 的行车轨迹; 基于所生成的轨迹,实现决策逻辑链的输出。

  值得注意的是,毫末的雪湖·海若引入了类似于 GPT 系列模型中的 人类反馈强化学习机制。即把系统和驾驶员的判断和决策进行对比, 若对比结果一致,系统会被打高分,反之则会被打低分。这与特斯 拉 FSD 的模式有异曲同工之妙。

  数据标注

  除场景生成外,AI 大模型在自动标注方面同样能够发挥重要作用。 在 AI 的 1.0 时代,数据标注主要依赖于人工,导致数据的标注时间 很长,且成本比较高。尤其在自动驾驶领域,由于路况复杂,存在 大量的标注需求。基于大模型可以实现自动标注,从而大幅度降低 成本,提升效率。如毫末智行的雪狐海若将场景识别能力对外开放。 此前采用普通的标注方案标注一张图片需要约 5 元,而 DriveGPT 雪湖·海若只需要 0.5 元,大幅节约了成本。

  2.1.2.2. 大模型虽难以完全解决小概率路况的问题,但依然对自动驾驶 行业意义重大

  当然,必须承认的是,大模型依然无法帮助我们 100%解决小概率路况 带来的问题。 大模型能力来自于深度学习,而不来自于强化学习。技术路线来看,大模型是“深度学习+人类反馈强化学习”。为了测试强化学习 对于模型能力的影响,OpenAI 分别基于 GPT-4 基础模型和加入强 化学习的 GPT-4 模型运行了一系列考试中的多项选择题部分。结果 显示,在所有的考试中,基础的 GPT-4 模型的平均成绩为 73.7%, 而引入强化学习后的模型的平均成绩为 74.0%,这意味着强化学习 并没有显著改变基础模型的能力,换句话说,大模型的能力来自于 模型本身。根据 OpenAI 的表述,强化学习的意义更多地在于让模 型的输出更符合人类的意图和习惯,而不是模型能力的提升(有时 甚至会降低模型的考试成绩)。

  既然大模型没有摆脱深度学习框架,这就意味着现阶段的 AI 背后 依然是统计学,无法彻底解决残差问题。换言之,“能力的不可解 释性”问题依然无法在根本上得到解决,我们依然无法实现 100% 的正确,只能通过覆盖更多小概率路况的方式来提升安全性。 大模型理论上难以帮助我们实现小概率路况的 100%覆盖。从本质 上来说,利用 AI 大模型进行路况生成虽然能大幅提升效率,但依 然类似穷举。而通过穷举法实现对小概率路况的全覆盖从理论上不 太可能实现,本质的原因在于“路况本身是一个无限场景”。试想 一下,如果我们要打开一个密码箱,我们只需要从“000”到“999” 全部尝试一遍,箱子就必然已经被打开了;同样的道理,在棋类运 动中,每一步可以“落子”的情况都是有限的集合,换句话说,所 有可能性是也是可以被遍历的,所以这两个场景都是“有限场景”, 而公开道路自动驾驶场景则是一个“无限场景”。

  2.2. AI 助力智能座舱交互体验提升

  智能座舱交互属性毫无疑问会不断上升。 从必要性角度:汽车行业正从卖方市场转向买方市场,行业演进的 核心驱动因素由技术与产品转变为消费者需求。传统汽车工业已走 过百年,随着行业的高度成熟,这一市场正逐渐由卖方市场转变为 买方市场,行业向前发展的关键因素也从技术的突破和产品的打磨 转向消费者的需求变化。

  2.3. AI 带动车辆研发设计效率提升

  随着项目周期的压缩,汽车研发效率正变得越来越重要。 汽车的开发周期正逐渐缩短,这使得供应商的项目周期被大幅压缩, 此前项目可能是 2-3 年,而现在可能是 1 年多甚至不到 1 年,同时 主机厂的定制化需求却越来越多,更短的开发周期和更多的定制化 需求对 Tier1 的智能制造能力提出了更高的要求。 随着自动驾驶功能模块逐渐增加,需要测试的里程数快速增加,并 没有完全足够的时间进行路测,同时由于涉及到安全,测试环节本 身不能简化,所以设计、测试的效率在一定程度上正逐渐成为制约 项目能否快速及时交付的重要因素。

  AI 大模型对于汽车设计师效率的提升意义重大。比如中科创达 Genius Canvas 将语言能力、视觉渲染以及特效制作能力结合在一起,可以通过 辅助概念创作、辅助 3D 元素设计、辅助特效代码生成和辅助场景搭建 及制作多方面帮助设计师完成创作过程,从而优化工作流程,并提高设 计师的工作效率。概念创作方面,它能够把 3-4 周的工作周期缩短到 1 周,节省 70%的时间。3D 元素设计方面,它能够把 4~6 周的工作周期 缩短到 3 天,节省 85%的时间。特效及场景制作方面,它能够节省 90% 的时间。

  2.4. 国内智能驾驶公司积极拥抱 AI 新趋势

  2.4.1. 中科创达:推出 Genius Canvas,提升 HMI 交互体验

  中科创达重视 AI 技术,利用 kanzi 推动智能驾驶舱的发展。在 2022 年, 中科创达公布与地平线成立合资公司,聚焦智能驾驶赛道。kanzi 是一 个具有强大实时 3D 渲染能力的工具。中科创达推出的智能驾驶舱 3.0 使用了 Kanzi for Android 这种新技术,使得 Android 系统和 Kanzi 完 美对接,实现了 3D 唱片、可定制实景导航、实时界面个性化定制、跨 屏幕跨系统应用等功能。

  中科创达利用 Kanzi 实现智能驾驶舱多屏交互。由于智能驾驶涉及人机 共驾,智能汽车所承载的驾驶员信息、车外环境信息、车辆信息等越来 越多,需要有更多的空间、分区域地呈现给用户,并确保和驾驶员有良 好交互。基于 Kanzi for Android 支持的多屏联动,在导航的过程中可以 实现地图跨屏,全方位呈现 3D 导航;在导航结束时,可将地图由副驾 驶屏收缩至中控屏。多方选择以适应更多的个性化需求。 中科创达 Genius Canvas 赋能汽车产业发展,打造全新 HMI 交互体验。 Genius Canvas 的一个工具是大模型引擎,它能够把想法和理念转化为文 案,并进一步转化为创意和作品,最终通过技术手段转化为应用程序。 Genius Canvas 的第二个工具来源于 KANZI 产品。Kanzi 与大模型结合 后,能够利用大模型的知识库及创新能力,快速创作丰富多彩的 Kanzi HMI 概念效果及特效,构建多样的 3D 模型及形象库,并且在车机系统 中能够实现实时预览功能。目前,全球已有超过百款车型选用了 Kanzi, 每年有数千万辆搭载 Kanzi 技术的量产车型落地。

  2.4.2. 德赛西威:联合高校推进大模型本地化,赋能自动驾驶

  德赛西威联合高校推进大模型本地化部署。德赛西威已和中山大学、南 洋理工大学等高校合作,通过尝试和布局基于大模型的数字虚拟助手、 图像数据自动标注、自动场景创建、自动编程等,构建技术支撑,相关方案已经在上海车展上亮相。在 AI 大模型本地化过程中,德赛西威能 够为客户提供差异化、全方位的技术支持和解决方案。 AI 大模型技术可以和德赛西威现有技术形成完美融合。比如,AI 大模型 可以在感知融合、感知预测和规划上实现更为精准的数据补充和预测, 从而在行为预测方面给予自动驾驶更多地帮助,并给出更多的控制选择。

  2.4.3. 虹软科技:已发布可商业落地的 AIGC 产品

  公司已发布 AIGC 产品,助力小 B 客户大幅降低商品展示成本。1)商 业拍摄市场空间超 500 亿元,虹软方案能大幅降低对模特的依赖,降低 商品展示成本,实现对于原方案的替代。2)采用目前市场上的方案在 很多细节处存在畸变和失真,虹软的方案能使得商品展示“所见即所得”。 3)公司计划在 2023 年推出静态商品展示图解决方案,包括商品加背景 静态图像的生成,以及商品加数字模特图像生成,后续计划推出动态视 频以及 3D 内容。 商业模式:与公司手机、汽车业务类似,AIGC 商业模式分为会员服务 费和生产流量费两部分。1)在会员服务会部分,公司会根据不同的会 员等级开放不同的功能,比如不同的场景库和模型库;此外,公司可以 针对一些增值的 API 做差异化的定制开发。2)在生成流量费部分,公 司将按照生成内容的实际算力消耗直接定价。

  2.4.4. 经纬恒润:自主开发驾驶仿真测试软件,推出智能座舱 AI 单品

  在自动驾驶仿真方面,经纬恒润自主开发仿真软件,助力驾驶测试。经 纬恒润自主研发了综合驾驶测试仿真软件 ModelBase,这一软件可以被 用于乘用车、商用车的整车电控系统、ADAS 系统的设计、测试和验证。 涉及电控系统的全开发周期,包括早期的算法仿真测试,控制器的硬件 在环测试,半实物台架测试,以及车辆在环测试。目前这一软件已经被 已应用于一汽、东风、蔚来等 50 余个项目中。 在智能座舱交互方面,经纬恒润基于 AI 技术开发了音乐律动氛围灯等 一系列产品。经纬恒润音乐律动氛围灯具有实时歌曲特征识别和离线歌 曲特征识别两种模式。其中离线歌曲特征识别模式的相关功能就是基于 AI 音乐风格分类算法和 AI 音乐段落划分算法进行实现。通过音乐特征 识别,为氛围灯音乐律动提供丰富的效果组合,提升用户体验。

  3. 金融是 AI 落地核心场景之一

  3.1. 金融行业敢于尝试新技术,是 AI 落地核心场景之一

  相比于其他行业,金融行业在新技术应用上有三个特点。第一个特点, 是很重视新技术发展,并且敢于尝试。因为金融行业的日常业务活动涉 及大量交易,技术上的微小进步有可能会为客户带来巨大的收益,因此 金融机构对于新技术很敏锐,会积极追求将新技术应用于日常业务。第 二个特点,是金融行业 IT 预算充足,对于性价比没有其他行业那么敏 感,在 IT 乙方的眼里,金融机构甲方客户往往是最好吃的一块蛋糕。 第三个特点,是金融机构对于系统稳定性和数据安全有极高的要求。这 个特点往往会跟第一个特点冲突,但是系统安全永远是金融机构的底线, 在此底线之上才会去追求新技术的应用。不管是证券、银行还是保险, 一旦核心系统出现故障超过一定时间,就容易收到监管函,相关 IT 部 门领导需要承担管理责任。例如 2022 年 5 月 16 日,招商证券集中交易 系统发生故障,9 月 8 日收到深交所监管函。

  3.2. AI 技术能够大幅提升金融行业工作效率和用户体验

  2022 年 12 月,全球管理咨询公司麦肯锡发布《麦肯锡中国金融业 CEO 季刊》——《今日科技重塑明日金融:影响全球金融业未来格局的七大 科技》,《报告》总结了七大重塑金融业未来格局的新技术,其中就包括 了人工智能。 一是人工智能。从单点尝试走向全面应用,深度融合业务与运营各 环节;在项目/产品落地速度、整体工作效率、综合成本控制、安 全保障上为金融机构提供额外价值。 二是云计算。规模化上云趋势加快,云计算与边缘计算相得益彰; 得以灵活布置的前端网点和后端算力,将解锁一系列高客户感知的 应用场景。 三是元宇宙与全面虚拟技术。虚拟感知构筑虚拟世界,重塑客户服 务与内部运营;空间计算技术、AR/VR/MR 技术的不断发展将重新定 义客户体验和内部运营。 四是区块链与 Web3.0。互联网范式迭代,颠覆未来商业模式;区块 链、数字资产、去中心化架构将颠覆原有的门户平台商业模式,甚 至催生新的金融服务领域。五是下一代通信。高带宽、低延迟、强安全的数据传输赋能技术解 决方案,物联网技术持续推动新用例落地;高通量卫星网络、5G/6G、 低能耗局域网等从天到地的通信技术各自发展和互相融合,将赋能 更快速、更安全的金融产品和应用。 六是下一代集成开发。平民开发、灵活部署、智能辅助、自动开发 将变革传统技术密集的开发流程,进一步降低开发门槛,科技能力 不再是技术企业独有的护城河。 七是信任架构与数字身份。构建数字信任体系,夯实金融科技安全 基石;零信任架构、数字身份、隐私工程等技术保障金融和隐私安 全,增强信任。

  3.3. 上市公司纷纷推出 AI 产品

  3.3.1. 恒生电子:推出智能投研产品,研发金融大模型

  恒生电子基于大模型推出智能投研产品,包含了三个子产品。 第一个叫 CHAT,通过 CHAT 可以问到各种各样的数据。它就像是一 个金融资讯数据的情报员,使用方可以问 F9、问行情、问研报、公 告资讯、问观点提取等等,它底层的关键性技术用到了搜索加上大 模型,通过这样的技术来去调用整个恒生聚源的金融资讯数据库, 从而能够实现语控万数。 第二款产品叫 ChatMiner,是一个指定文档的挖掘器。比如用户自 己有一篇文档,上传以后可以针对这一篇文档去提问,ChatMiner 就可以根据这篇文章里面提到的内容去对问题予以回答。底层的关 键技术是向量数据库加上大模型。 第三个产品 WarrenQ,是一个一站式的数智化投研端。WarrenQ 里 面有非常多的场景、功能,大模型的产品 ChatMiner 也在里面, 再到阅读器、云笔记、原文引文和溯源、演算板、其中的估值模型, 以及在线分享脑图等等都已经在投研场景上去实现全面的打通,所 以它是一个一站式投研平台。

  插件层可以解决数据即时性的问题。第一列是 NL2SQL。比如用 CHAT 去 查恒生电子的行情,它在用这个大模型的接口返回一段话的同时,调了 NL2SQL 接口,到数据源库里面去把恒生电子的行情的时间序列给查出 来,变成一个 K 线图返回,用户就可以看到最及时、最更新的行情;第 二个搜索接口也很重要。第一个 NL2SQL 更多是解决的时间序列格式的 数据即时查询性的问题,搜索接口解决的是文本类的数据,因为第一个 接口没办法获取最新消息、事件、新闻研报公告。 ChatGPT 底层的技术就是向量数据库,它涉及到私域的大量文档怎样去 进行向量化、做相似性的查询和存储。这个插件层很重要,它是金融领 域要做垂域产品非常重要的支撑性力量。结合恒生电子训练出来的金融 大模型一起,向上可以去做各种各样的应用,包括智能投研、智能投顾、 财富管理等服务。 恒生电子的大模型到 9 月 30 号就可以开放试用,年底会进一步优化。 恒生专门为金融行业打造的大模型的能力,已经提升到可用的程度,9 月 30 号会开放试用接口。到年底会把推理性能进一步优化,把逻辑能 力也进一步的升级,使得它和光子配套能够统一构成一个 AI 直通应用 的体系。

  3.3.2. 同花顺:发布人工智能及虚拟人产品

  同花顺早在 2013 年,同花顺便开始布局人工智能领域,首推财经搜索 引擎爱问财,到 2019 年全业务全力推进 AI,目前已经积累了多款 AI 产 品。

  (1)i 问财投研平台:i 问财投研平台提供了多维度的股票、基金、债 券数据,投资者输入自然语言问句,搜索想要的数据和信息。此外还有 条件选股、研报、图表精选策略、产品搜索、短线复盘、策略回测宏观 经济等功能。同花顺 i 问财智能头部数字人致力 i 于用人工智能技术多 模态的交互及富媒体的表达,解决用户个性化的投资问题,提升用户的 投资能力,辅助完成投资目标。

  (2)iFind:iFind 大金融数据终端是一款融合了金融数据专业咨询投 研分析工具的智能终端,目前覆盖了国内全部的证券期货公司,超 80% 的基金和商业银行,大部分媒体高校上市公司私募机构的产品涵盖了全 球主要资本市场的股票、债券、外汇、商品、基金等品种,拥有超 600 万宏观行业指标,年增超 50 万篇,研报 10 余万新闻数据源,为用户提 供全面的市场信息,iPhone 的运用 AI 算法为用户提供智能预测、智能 搜索和智能脉络等创新应用,让用户的体验更加高效便捷。2023 年 iFind 将会借助 AI 技术,aigc 系列,进一步提升用户体验和工作效率。

  (3)AI 短视频平台:当前短视频是财经信息用户获取信息的主流方式, 受限于制作门槛高,缺乏金融数据等痛点,导致短视频的生产效率低。 针对前述痛点,同花顺研发了 AI 短视频平台,该平台是一款基于人工 智能技术的视频制作和发布平台,通过集成先进的 AI 技术,自动化的 处理视频素材,包括剪辑配音字幕等,结合数据的酷炫可视化展示能力, 使用户快速的制作出高质量的短视频,同时该平台还提供了各种丰富的 模板和主题,自动化生产出个性化的短视频。同花顺 AI 短视频提供快 捷有趣的视频创作体验,助力打造附文本向短视频转型的数字化服务体 系。

  (4)数字人交互一体机:数字人具有媲美真人的专业知识人设和情感, 能在银行、证券、运营商、政务、医疗、教育等行业服务场景中,辅助 完成业务咨询办理,营销推广宣传等任务,提升客户体验和营销成功率。 现在大家看到的是具备了金融领域专业知识的数字人,能给用户提供实 时金融数据。

  (5)同花顺虚拟展厅:虚拟展厅是同花顺利用虚拟人、人工智能、云 计算等核心技术,助力企业便捷高效创造素质,实现企业产品和服务全 景展示与交流互动,赋能企业宣传推荐、科普教育等功能的产品。虚拟 展厅以 3D 全景展示线上配合声光动画等特效,可以给参观者带来全身 心投入的沉浸式体验。虚拟展厅突破了时空限制,应用 3D 全景展示线 上产品和服务,配合声光动画等特效,可以给参观者带来全身心投入的 沉浸式体验。虚拟展厅突破了时空限制,全身心投入的沉浸式体验。

  (6)小花探影:上消化道检查功能板块主要功能用术中对检查部位进 行导航提示,漏检部位、视野清晰度和病灶体提示。同时系统会自动截 取部位和病灶图片保存,下消化道检查功能板块主要功能有手术技术术 中识别回盲瓣和回肠末端等解剖位置,对视野清晰度评估和提醒出现异 常病灶进行提示,我们这个产品已经取得了医疗器械二类证,并与多家 知名医疗机构达成合作。

  3.3.3. 凌志软件:通过 AI 技术为日本金融企业提供服务

  公司主要客户为日本的金融保险企业。公司已与日本优秀的一级软件承 包商建立了长期稳定的合作伙伴关系。由于日本一级软件承包商数量较 少,公司与其建立稳定合作关系后,能有效降低公司的销售费用和关系 维护成本,并能提高合作效率。公司在与日本一级软件承包商合作过程 中,积累了丰富的金融、房地产、电信、电子商务等行业经验,在客户 中赢得良好的口碑。目前,公司第一大客户为全球顶尖金融服务技术供 应商野村综研,2019 年野村综研在世界金融科技排行榜上位列第十,是 全球非常优秀的金融科技公司。目前野村综研除了服务母公司野村证券, 也在积极对外输出 IT 能力,尤其是 AI 方面的能力。 公司全面参与海外金融企业 IT 系统建设,并落地 AI 能力。公司参与完 成了众多金融行业核心业务系统开发,包括网上交易系统、客户关系管 理系统等,保险业务的核心系统、营业支援系统、销售平台系统,银行 客户的网银平台、养老金管理系统等,基本做到金融行业各系统全覆盖。 其中基于 OCR、NLP 的工作底稿系统,在包含券商和基金公司的 41 家 客户处上线运行,使用深度学习中的 Transformer 模型和 CV 目标检测算 法,基于深度机器学习的文本纠错、文档一致性对比、招股书审核、债 券募集书审核、多文件交叉审核、通用文档核查等功能也已经完成,已 开始在多家券商进行体验测试,陆续对客户进行升级。

  4. AI 加持,设计与工业软件将实现降本增效

  4.1. AI 对于设计效率提升大有裨益

  4.1.1. AIGC 降低设计软件使用门槛

  目前的 AI 辅助的能力仅限于为用户提出建议并代替部分重复性设计工 作,减轻设计师部分负担,并不能降低软件使用门槛。以最新发布的 AutoCAD 2024 中的 AI 辅助功能为例,‘Activity Insights’可以记录用户 对图形文件的所有操作并对工作流程和操作提供建议,‘Smart Blocks’ 能够根据之前绘图的放置位置对新的 block 进行自动放置。这些功能对 设计师的帮助有限,也无法降低使用门槛。 ChatGPT能够按照开发者的自然语言指示生成 CAD代码,并给出相应 的解释。目前在CAD领域,ChatGPT能够支持Autodesk公司开发的 Visual LISP/AutoLISP 语言、Maya 核心脚本语言 MEL、3ds Max 相关产品的通 用脚本语言 MAXScript,以及用于 AutoCAD 平台二次开发软件包 ObjectARX 的 VisualC++语言等。

  微软代码平台 GitHub 发布编程辅助 Copilot 最新版本 Copilot X,实现 AI 语音交互辅助编程。2023年3月23日,微软旗下代码托管平台 GitHub 发布了编程辅助工具 Copilot 的全新版本 Copilot X,新版本接入 GPT-4。 GitHub 首席执行官 Thomas Dohmke 称,虽然自动补全代码已经大大提 升开发人员的生产力,而全新的 Copilot X 能将开发人员的生产力提升 10 倍。 工业设计软件也将出现自己的“Copilot”,显著降低软件使用门槛并提 升生产力。 工业设计软件有较高的使用门槛,但未来用户可以直接使用 自然语言提出要求和限制调用 AI 进行代码编写和绘图,大大降低使用 难度。同时,设计人员也可以直接利用 AI 省去重复性的设计工作,提 升工作效率。

  4.1.2. AIGC 将进一步提升生成式设计的能力

  AI 可以自动生成大量符合要求的多样化设计方案,使得设计师能在更短 的时间内探索更多设计选项,提高设计效率。传统的设计方法依赖于 “建模然后分析” 的循环,但在生成技术中,AI 能够根据用户要求和 限制比如材料类型、功能要求、性能限制、成本限制等信息,快速生成 大量满足要求的 CAD 解决方案,并最佳解决方案,而无需人工干预。 设计师可以在短时间内探索大量可能性,快速缩小选择范围并选择更优 的解决方案。简化了设计流程,也有助于设计师能够更快地做出决策提 高工作效率。 通过生成技术可以最大限度地降低成本并优化性能。生成技术根据用户 要求和限制去创建优化的产品设计,而不是先制作几何图形再验证,所 以设计会针对最小成本和重量等目标进行优化。这种方法能够有效的减 少材料使用,降低成本。

  4.1.3. AI 打破二维与三维的壁垒,实现精确转换

  AI 多模态大模型有望打破壁垒,实现二维图纸与三维 BIM模型有效转 换,提升设计效率。目前国内仍有大量 BIM 翻模需求,虽然已有插件和 算法能够实现二维图纸翻模三维 BIM 模型,但翻模效果普遍较差,需要 大量人工修正,AI 大模型经过训练后有望提升翻模的准确率与精细度, 取代人工翻模,实现降本增效。

  4.1.4. AI 赋能 EDA,实现降本增效

  Synopsys 推出首个 AI EDA 套件并取得成效,未来可能利用 AIGC 编写 代码。2023 年 4 月,全球领先 EDA厂商 Synopsys 宣布推出业界首个全 栈式 AI 驱动型 EDA解决方案 Synopsys.ai,涵盖设计、验证、测试和模 拟电路设计阶段,旨在帮助客户持续创新,更快实现更高质量的设计, 同时降低成本。Synopsys.ai已获得包括 IBM、英伟达、微软在内的多家 领先企业的率先采用并取得显著成效。瑞萨电子在减少功能覆盖盲区方 面实现了 10 倍优化,并将 IP 验证效率提高了 30%。SK海力士将先进工 艺技术的芯片尺寸缩小了 5%。目前仍由工程师来编写芯片制造的 C 语 音,未来可能由 AIGC 辅助甚至代替。

  4.2. AIGC 将有效提升工业生产效率

  4.2.1. 西门子与微软携手利用 AIGC 提升工业生产力

  AIGC 助力工业 AI 进一步发展。目前 AI 对于工业产品制造阶段的增强 主要在于 AI 算法的制造执行和管理流程,AIGC 的生成和推理能力都将 为 AI 应用带来显著提升,进一步优化执行和管理流程。 西门子与微软合作,共同为 AIGC 在工业方面的运用树立标杆。2023 年 4 月,西门子宣布与微软达成合作,在多个方面使用生成式人工智能 (AIGC)改进其工业控制工作流程,持续提升效率并推动创新。 西门子 Teamcenter针对微软 Teams 打造全新应用软件,增强跨职能部 门的协作能力。双方将西门子的产品生命周期管理(PLM)软件 Teamcenter®与微软的协同平台Teams、Azure OpenAI 服务中的语言模型, 以及其它 Azure AI 功能进行集成。企业的服务工程师或生产操作人员可 以通过移动设备,使用自然语言记录并报告产品设计或质量问题。同时, 通过 Azure OpenAI 的服务,该应用可以解析前述非正式的语音数据,自 动创建总结报告,并在 Teamcenter 中发送给相应的设计、工程或制造专 家。与西门子 Teamcenter 的结合可为无法使用 PLM 工具的工作人员提 供更多支持,使其能够以简单的方式参与设计和制造流程。

  4.2.2. AIGC 能够优化并生成 3D 打印方案,降低使用门槛

  研究发现 ChatGPT能够对 3D打印参数进行微调优化,甚至提供合适的 3D 打印的解决方案,有效降低工作门槛并提高效率。Gcode 是 3D 打印 领域使用的一种编程语言,向3D打印机提供如何打印物体的特定指令。 但是编写 Gcode 需要对 3D 打印流程有深入了解,手动编写非常耗时且 容易出错。生成优化的 Gcode能够确保产品质量并减少漫长的试错时间, 从而节省材料和时间。研究人员发现 ChatGPT 在 1 小时内成功优化了 15 个打印参数并解释了每个参数更改的原因,这项任务本来需要大约三周 才能完成。

  4.3. 设计与工业软件主流玩家均加速布局 AI,并已取得一定 成效

  4.3.1. 广联达:AIGC 技术已被用于其核心产品

  公司 2015 年就已经布局 AI,把 AI 技术确立为公司核心技术,持续多 年重点投入并取得成效。造价业务方面,突破基于深度学习的交互式生 成技术,利用大模型技术提供智能组价和智能算量等服务。施工业务方 面,劳务人脸识别终端实现量产,多项 CV 安全隐患识别算法集成进入 施工蜂鸟盒子产品,助力蜂鸟系统成功入选工信部《国家人工智能创新 应用先导区“智赋百景”》建设施工现场 AI 智能安全巡检应用场景典型 案例。数字施工国际化方面,MagiCAD 发布 AI 辅助设计功能,在核心 区域继续扩大领先优势,在英国、德国、意大利等重点拓展区域保持良 好的增长势头。

  公司也在布局生成式 AI,在设计业务中,概念设计的阶段之前是由设 计师做创意,然后一笔一笔画出来,未来可以让 AI 模拟人的创意快速 生成各种草图。针对智能设计领域,公司目前已有一个专门的团队在探 索,在一些项目上已经进行了初步的试用,但整体上仍处于较早期的阶 段。比如 AI 强排的功能(按照建筑强制性规范布置建筑),在拍地阶段, 几十上百种的方案比选相比目前仅有几种方案的对比有更大的价值量。 目前强排工具已进入用户验证,实时日照分析性能国内领先。 AI 在建筑行业的运用已有先例。Autodesk 与 DAISY合作提高施工设计 流程的效率。DaisyAI 是第一款由人工智能(AI)提供支持的木材设计 CAD 软件,可在 10 分钟内生成符合规范的最佳设计,每天为工程师节 省 2-3 小时,减少 80%木材浪费。Autodesk 的 Kratos 研究项目则使用 AI 方法快速评估包括混凝土在内的多种材料的结构设计。2022 年,Kratos 与 DAISY 合作,使用 Kratos 计算木结构中的承重墙,并将结果输出给 Daisy 来生成详细的平面图,减少了地基中使用的混凝土,降低施工成 本。

  4.3.2. 中望软件:已推出 AI 驱动的生成式设计功能

  在 CAD 方面,公司可以根据已有数据研发内置的生成式设计功能。工 程师可通过 AIGC 向软件指定他们的要求和目标,从而自动生成大量设 计方案。目前 AI 驱动的生成式设计功能已在 Siemens Solid Edge、PTC Creo 及 Autodesk FUSION 360 等主流 CAD 产品中投入使用。 在 CAE 方面,AI 可赋能仿真优化,提升仿真效率,助力公司工业 AI 模型训练。通过与 Ansys Twin Builder 合作,微软 Project Bonsai可同时 运行数百个机器或者应用的虚拟模型,并将这些数字孪生生成的数据, 直接输入大脑对其进行优化。使用大量虚拟模型可以缩短训练时间,降 低成本,并学习了解所有可能遇到的情况,增加工业 AI 模型精确度。

  4.3.3. 中控技术:自研国内首个流程工业过程模拟与设计平台

  APEX 海量数据助力大模型训练从而优化工程装置。2022 年 11 月,公 司正式发布了自主研发的 APEX,成为国内首个流程工业过程模拟与设 计平台。其基于机理模型打通了工艺设计到工厂运行的数据流程,实现 了工艺模拟、工艺瓶颈分析和运行优化等功能,提供从工程设计、工厂 数字孪生、生产运行到全生命周期运维的智能化运营解决方案。通过 APEX 运行得到的海量数据也将投入 AI 大模型对装置进行优化,进一步 提升工厂效率。

  5. AI 大模型背景下网络安全机遇与产业并存,各方 加速布局

  5.1. AI 大模型催化,网络安全产业机会与挑战并存

  5.1.1. “安全”、“AI 安全”与“安全的 AI”同等重要

  网络安全威胁日益加剧。随着互联网应用普及化,所对应的网络威胁数 目随之上升,而且其复杂性也相对增加,对网络安全带来了巨大挑战。 如今移动设备、物联网、云计算在企业中的应用日益普及,攻击面也相 对增加。此外,黑客可以利用人工智能来不断变形病毒/恶意软件,而传 统的静态防御解决方案未必能对此有效检测以及阻断。另外,网络攻击 服务化(Cyberattack-as-a-Service)令网络攻击变得普及,攻击者自身不 须拥有强大的黑客知识亦可以通过支付加密货币获得攻击工具。 人工智能在网络安全方面的作用是帮助组织降低入侵风险,并改善其整 体安全状况。人工智能通过从过去的数据中学习来识别模式和趋势,然 后这些信息被用来预测未来的袭击。人工智能驱动的系统还可以配置为 自动响应威胁,并在更快的时间内对抗网络威胁。随着企业攻击面不断 发展和演变,时而必须处理多达数千亿的时变信号以正确地计算风险。 为了应对这一前所未有的挑战,神经网络等人工智能工具和方法不断发 展,以更有效和高效的威胁检测和威胁消除功能,帮助信息安全团队保 护敏感信息、降低入侵风险、降低安全运营成本、改善安全态势。再者, 随着大模型潮流兴起,网络安全的产品能力、平台运营能力以及安全服 务都有望迎来全面的优化升级。

  综上,新技术浪潮下的网络安全产业需要考虑四重安全。第一步是做好 传统网络安全防护,第二类是用人工智能相关算法或大模型对网络安全 产品进行增强,以及对服务的优化赋能。该阶段要保证 AI 大模型赋能 网安的过程中,AI 系统和网络安全产品的集成能有效融合。第三,要保 证大模型输出的 AI 能力的原生安全(在当前对齐、可解释性等问题尚 未有效解决的前提下,也至少要保证安全风险不能被 AI 放大)。最后, 大模型本身的安全防护也十分重要,因为其作为 AI 能力输出的基石, 本身的安全稳定有着根本性支撑作用。

  5.1.2. 网络安全与人工智能技术结合具备天然优势

  要弄清楚 AI 在网络安全领域中的作用,首先要回顾下网络安全产品本身的构建思路。网络安全的构建思路以红蓝对抗为角度,即根据黑客攻 击的时间顺序来进行对应的防护。首先要进行最大化收敛互联网上的暴 露面,第二步是对边界的防护,也就是根据暴露内容部署相应的安全问 题防护以加固边界,接着要进行区域控制,即监控手段建设,最后一步 是做强控。整个过程按照事前、事中和事后来建设网络安全。

  网络安全单点产品的能力可以基于人工智能算法得到增强。前期的资产 梳理、安全漏洞排查以及边界的防护方面,都需要防火墙、IDS/IPS 等 产品部署,而与传统的软件驱动或手动方法相比,机器学习技术可通过 结合来自主机、网络和云上的反恶意软件组件的大量数据来改进恶意软 件检测;深度学习使用大量数据来训练深度神经网络,此举也能助力防 范各类攻击。比如 Google 利用深度学习来检测难以检测的基于图像的电 子邮件、含有隐藏内容的电子邮件,以及来自新形成域的通信,这有助 于检测复杂的网络钓鱼攻击,包括与垃圾邮件有关的互联网流量模式; 深度学习架构可以用于发现隐藏或潜在的模式,并随着时间的推移变得 更加环境敏感,这有助于识别零日漏洞或活动,例如自然语言处理可以 扫描源代码中的危险文件并标记它们,“生成对抗网络”可以学习模仿任何数据分布,也可以在识别复杂缺陷方面有用。

  5.1.3. 大模型对网络安全产业的供给侧和需求侧带来巨大变化

  大语言模型技术的广泛应用,能够赋能网络安全产业的诸多环节,甚至 可能对部分环节带来颠覆性的改变。以 GPT 为代表的大模型的本质是理 解语言意图并根据意图进行任务分配,从而实现对话、计算、制图等能 力,具有语言体系且流程性工作的占比较大的工作环节能被大模型所赋 能。同时,出于工程落地难度及性价比考虑,大模型更适合用于规模较 大、所需人工较多的环节。 从网络安全厂商供给能力来看,大模型的语义理解及代码生成等能力可 以有效赋能安全产品及服务。网安的日志为计算机领域的语言体系,GPT 在 Github 中预训练之后,对于日志的理解具有天然优势。同时,安全运 营涉及大量流程性工作,部分环节人力需求较多,而大模型的应用有望在安全运营中心(SOC)场景中降低安全服务人员的数量,实现降本增 效。例如在用户行为分析(UEBA)方面,传统的 SIEM 是基于特征和 规则进行分析,而用户行为超越了规则和相关性,可通过大模型的赋能 研究攻击者行为模式,从而更加有效地检测内部威胁、针对性攻击和欺 骗;又例如,在攻击者可以加密数据之前,SIEM 可能会检测到勒索软 件的警报并在受影响的系统上自动执行应对操作,大模型的代码生成能 力可以提升系统的自动响应能力。

  5.1.4. 大模型输出的 AI 能力要有原生的安全性

  虽然大模型能够带来网络安全性能的较大飞跃,但也要考虑大模型所输 出的 AI 能力的安全性。大模型输出能力的安全性,即“安全的 AI”,在 其产业应用过程中跟传统网络安全防护同等重要,本质上是因为 AI 大 模型作为一个工具,应当帮助人们而不是取代人们或对人类社会造成伤 害。基于安全的大模型,其对传统网络安全的赋能的有效性才能得到充 分保证。 “安全的 AI”(AI Safety)思想是致力于构建安全的大模型,模型安全 需要重点考虑三大因素。AI Safety 的具体内容包括:与人类意图对齐 (Alignment)、可解释性(Interpreferability)、鲁棒性(Robustness)。其 中,对齐(Alignment)要求 AI 系统的目标要和人类的价值观与利益相 保持一致,但 AI 对齐的实现也存在三方面挑战,一是选择合适的价值 观,二是将价值观编码到 AI 系统中,三是选择合适的训练数据;可解 释性是指对模型内部机制的理解以及对模型结果的理解;鲁棒性可以理 解为模型对数据变化的容忍度。

  数据防泄漏(DLP)是企业客户目前绝对的头号安全需求。三星半导体 工厂的员工在将源代码输入 ChatGPT 以识别和消除错误并优化程序的 同时,也无意中通过 GPT 向公众泄露了机密的生产数据,另一名三星员 工使用 AI 聊天机器人总结会议记录,导致该会议记录被泄露。上述数 据泄漏事件只是冰山一角,根据 CYBERHAVEN 在 3 月 21 日发布的调 查,8.2%的员工在工作场合使用过 ChatGPT,6.5%的员工曾经将公司数 据粘贴进去过,3.1%的员工曾经将公司敏感数据喂给过 ChatGPT,而敏 感数据占员工粘贴总数据的 11%。

  5.1.5. 大模型本身的安全防护也同等重要

  在 AI 大模型的系统集成阶段,情况就变得更加复杂。人工智能应用的 系统集成不仅涉及人工智能技术本身的安全风险,还涉及车载系统、网 络、软件、硬件的结合点问题,这些威胁包括 AI 数据和模型的机密性、 代码漏洞、人工智能偏见等。 因此,针对大模型使用过程中的隐患点,海外已经出现了专注于大模型 的防火墙公司。Arthur Sheild 是首个用于大语言模型的防火墙,帮助公 司更快、更安全地部署 ChatGPT 等大模型应用程序,保障模型部署和运 行安全。Arthur Sheild 能力可以包括:防止 PII 或敏感数据泄露、防止有 毒的且攻击性的或有问题的语言生成、防止幻觉、用户恶意提示以及防 止恶意注入。

  大模型除了需要传统的企业安全堆栈保护,还有一些区别于其他软件开 发公司的安全防护需求。在传统保护方面,比如使用 Cloudflare、Auth0 来管理流量和用户身份。ChatGPT 在三月份经历了 Redis Bug 导致的信 息泄漏和宕机,这就产生了对例如 Datadog 和 Sumo Logic 等 APM、可 观测性供应商的需求。大模型还有一些区别于其他软件开发公司的安全 防护需求,比如 Prompt 注入攻击等,则对安全公司提出了更高的要求。 海外已出现许多专注于 Security for AI 的公司,比如 HiddenLayer MLSEC 平台是一种基于软件的非侵入式平台,主要用于监测机器学习(ML) 算法的输入和输出,可以阻止对抗性攻击并提供对 ML 资产的健康和安 全的可见性。平台基于不需要访问客户数据或知识产权的云架构,在不 影响速度、效率和可靠性的情况下保护客户的 ML 资产。同时,平台可 帮助客户维护 ML 算法,保护其免受推理、数据中毒、逃避或模型注入 等攻击,并防止敏感训练数据被公开。

  5.2. AI 网络安全市场高速增长,海外巨头布局迅速

  全球 AI 网络安全的投资呈现高速增长态势。物联网的日益普及、对数 据保护的担忧不断增加以及网络攻防对抗持续升级等因素推动着 AI 在 网络安全行业的发展,越来越多的网络安全厂商加大对 AI 安全市场的 投资力度,抢占“AI+安全”制高点。MarketsAndMarkets 调研数据显示, 2023 年 AI 在网络安全市场规模为 224 亿美元,预计到 2028 年将达到 606 亿美元,CAGR 为 21.9%,同时,MarketsAndMarkets 认为在预测期 内,北美将占据 AI 网络安全市场最大份额。

  海外头部安全厂商也持续加码 AI 相关产品应用。IBM Security Qradar Suite 产品嵌入 AI 和自动化,加快了安全团队对攻击链每个步骤的响应 速度;CrowdStrike 公司与 Cribl 联合推出 CrowdStream,旨在提供更加快 捷和准确的网络安全数据采集与分析;Fortinet 打造的 FortiXDR 是首款 利用 AI 进行事件调查响应的解决方案,可以完全自动化完成通常由经 验丰富的安全分析人员处理的安全运营流程,因而能够跨广泛的攻击面 更快速地缓解威胁。

  5.3. 国内厂商 AI 能力积淀已久,大模型方向纷纷加码

  5.3.1. 奇安信:把握 AI 新机遇,深入探索网络安全蓝海

  把握新技术浪潮,推出最贴合市场的新产品和新服务。针对生成式人工 智能(AIGC)技术,公司结合“内生安全”理念,利用多年以来的海量安 全大数据和知识积累,积极训练专有的类 ChatGPT 安全大模型,计划在 安全产品开发、威胁检测、漏洞挖掘、安全运营及自动化、攻防对抗、 反病毒、威胁情报分析和运营、涉网犯罪分析等领域实现广泛应用。奇 安信在 AI 技术赋能安全方向成果颇丰,其研究成果广泛应用于公司产 品中,在数据挖掘、异常检测、复杂网络分析中都成功使用了深度学习 和机器学习技术。

  5.3.2. 深信服:AI 布局前瞻,大模型领域先发优势显著

  坚持 AI First 理念,以 AI 技术研究及应用赋能云产品升级。公司采用“AI First”理念构建云全产品体系,超融合、托管云服务、桌面云、存储和数 据库管理均需用到 AI 技术。基于该新推出的全新产品体系架构,可以 全面提升性能、可靠性、安全和运维管理方面的能力,并把这个能力称 为 AFOPS、AIRUN 和 AISEC。AISEC 保证上云即安全;AIRUN 使得 客户使用云的时候更加方便、有效、快捷;AIOPS 使得使用云的时候维 护能力提高,自动化的水平提高,而不再需要更多的人力。

  5.3.3. 天融信:AI 与产品深度融合,竞争力持续提升

  创新融入 AI,持续增强产品核心竞争力。天融信在 AI 安全领域布局较 早,且早在 2019 年与 IDC 联合发布了国内首个《融入人工智能的下一 代防火墙》白皮书。公司主要运用 AI 技术进行威胁情报分析、网络应 用分类、未知威胁检测等,并已实际应用于公司产品,已发布的产品有 防火墙、入侵防御、僵木蠕、沙箱、大数据分析、态势感知、EDR、数 据防泄漏等。2022 年订阅收入 3.13 亿元,其中至少一半来源 AI 生产的 知识。同时,公司自 2020 年开始部署和使用类大模型,目前已训练出 用于安全服务的基础模型,同时正在训练用于非核心模块(例如自动化 测试)的代码自动编写模型,提升开发效率。

  5.3.4. 绿盟科技:打造 AI 实验室,加码 GPT 智能应用

  积极探索以 AISecOps、SecXOps 和安全知识图谱为代表的新型 AI技术。 公司于 2016 年成立了八大实验室,其中天枢实验室专注于 AI 方向的研 究,积累深厚,目前已取得多项研究成果,包括:发布了安全知识图谱, 推出了 AI SecXOps 概念和产品,以及与高校研究机构合作发布了白皮 书等。公司高度重视以 ChatGPT、GPT-4.0 为代表性的大语言模型对安 全产业的影响力,开展了对安全攻防、安全运营、GPT 内容识别等领域 类 GPT 技术的研究;凭借长期积淀的攻防知识、运营数据与威胁情报, 将在 2023 年第三季度发布基于类 GPT 技术的智能安全服务机器人,旨 在把大模型能力用到代码安全、安全运营效率提升、安全分析研判准确 度提升等方面。

  5.3.5. 安恒信息:数据安全体系完备,AI 赋能下优势凸显

  安恒的大数据及数据安全相关产品广泛使用了 AI 技术,产品力逐年提 升。数据安全是安恒的重大战略方向,而数据安全与人工智能也具有天 然的结合性,公司常年来的产品打磨中均有效利用了 AI 技术优势,产 品力持续提升,尤其体现在 AiSort 数据安全分级、AiMask 数据脱敏、 AiGate 数据安全网关、AiThink 行为分析以及 AiTrust 零信任等产品体系 中。

  5.3.6. 启明星辰:“盘小古”助力 AI 安全研发运营一体化

  人工智能赋能安全一直是启明星辰重点探索的方向。公司自主研发的人 工智能安全建模和赋能平台,被威胁检测、安全大数据分析、威胁情报、 UEBA 等多个产品广泛采用,全面提升了安全数据治理、安全模型构建、 模型安全检测、模型推理赋能等能力,实现了基于 ModelOps 和 AIOps 的人工智能应用快速搭建、模型全生命周期管理和多重赋能,助力流量 检测技术、威胁检测技术等实现智能化,推动公司网络安全产品向自动 化、智能化进阶。 启明星辰于 2022 年发布了“PanguBot(盘小古)”安全智慧生命体。公司基 于人工智能技术的智能化安全运营解决方案,构筑了以全生命周期人工 智能安全服务、运营(AISecOps)为目标的 AI 安全研发运营一体化平 台。“PanguBot”由启明星辰盘古人工智能平台提供模型运行算力和环境, 以 Chat 为窗口,应用基于安全运营专用语料库训练的自然语言模型,能 够接收文字、语音、图片、视频等方式的信息输入,通过文字和图片的 形式向用户反馈,并能够整合各种运营工具,实现安全分析处置自动化, 此成为启明星辰智能化安全运营的有力支撑。

  来源:未来智库

大巡礼
新浪声明:新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述

微博

HOT RECOMMEND

关于新浪VR | 论坛社区

Copyright © 1996-2015 SINA Corporation, All Rights Reserved 京ICP证000007  京网文【2017】10231-1157号

北京幻世新科网络科技有限公司 版权所有