突破 AI 大模型“焦虑症”,政企行业寻获“最优策略”

发布时间:2024-07-17 文章来源:本站
   自 2022 年末起,随着 ChatGPT 的惊艳亮相并持续迭代,全球范围内各国、各行业在面对 AI 大模型时似乎都患上了 FOMO(Fear of Missing Out,错失恐惧症),纷纷积极行动,唯恐错失良机。


   但截至目前,在热火朝天的“打造大模型”进程中,除英伟达收获颇丰外,其余参与者尚未摸索出稳定且可持续的商业模式。相反,随着参数规模不断扩大,模型训练所需的算力成本愈发高昂,在巨大投入却难见产出的状况下,新的“焦虑情绪”开始蔓延。


   在大模型“竞赛”最为激烈的美国,资本市场几近陷入“疯狂”状态。这两年来,美股市场中但凡与 AI 相关的股票都大幅上涨。苹果举办一场 AI 进展发布会,次日市值就飙升 2142 亿美元;以微软领衔的美股“Big7”的市值,更是达到前所未有的 14 万亿美元,在标普 500 中占比 32%,纸面市值远超实际价值,“疯狂”程度空前。投行分析师们开始担忧一场比互联网泡沫更为庞大的 AI 泡沫即将来临。


   在中国互联网领域,巨头们在为与美国的差距而焦虑的同时,开始不断压低每 Token 的价格,提早展开简单直接的价格战。其中,字节跳动的豆包大模型将通用模型 pro-128k 版的推理输入价格设定为 0.005 元/千 tokens,相比行业水平骤降 95.8%;阿里通义千问把主力模型 Qwen-Long 的 API 输入价格降至 0.0005 元/千 Tokens,降幅达 97%;百度甚至宣告将文心大模型的两款主力模型 ENIRESpeed 和 ENIRELite 完全免费。


   例如,一些小型科技公司在这场大模型竞争中,由于资金和技术的限制,面临着更大的压力和挑战。

走出AI大模型“焦虑症”,政企行业找到了“最优解”

   一方面是 AGI 的宏伟愿景,另一方面是 ROI 的冷酷现实,面对 AI 大模型这趟驶向未来的列车,不上车不行,上车后找不到好位置、无法坚持到终点也不行,究竟该如何抉择?


   在中国的政企行业,一群具有远见卓识的先行者把通用大模型与特定行业的专业知识相融合,构建属于自身的专属大模型,以加快行业 AI 应用的落地,切实实现大模型的价值,为业界摆脱 AI 大模型“焦虑症”找到了“最佳方案”!


   中国大模型摆脱“焦虑症”,破局关键在行业


   自全球“大模型竞争”开启以来,“中美在 AI 领域的差距究竟多大”始终是公众关注的焦点话题,说法从 1 - 2 年到 8 - 10 年不等。


   不得不承认,我国在算力、算法和数据方面实际上并不占优势:高端算力卡被英伟达限制供应,短期内自身的制程和设计难以跟上;在算法领域,虽然模型数量众多,但大多是基于国外开源架构进行优化,缺乏自主性和领先性;在数据领域,我们的开放数据与国外不在同一量级,中文语料严重匮乏。


   这些差距在短期内难以抹平,在这种情况下,缩短差距的正确方式,显然不是以自身短板去对抗他人长处。


   换个角度看,我国拥有全球独一无二的全工业门类、最庞大的金融消费群体以及规模最大的政务和城市体系,由此产生了丰富的场景和私有数据,这些都成为发展行业大模型的天然条件。因此,比拼应用成为中国大模型破局的一条有效途径,通过大模型为一个个行业细分场景赋能,最终实现战略突破。


   凭借差异化优势入局,可以预见,当下率先拥抱大模型的行业企业和组织,将会迎来划时代的重大战略机遇。


   政企行业大模型面临诸多挑战,工程化能力决定成败


   当然,站在新时代的起点,政企行业打造大模型困难重重,因为大模型的应用本身就是一项复杂的系统工程,除了单点技术的持续突破外,更需要根据场景和需求匹配适宜的技术,通过全链路、多技术融合的系统性创新来整体推进。


   首先,大模型并非孤立的技术,必须注重软硬件基础设施的协同发展。除了大模型自身,我们还需关注其背后的技术生态系统,涵盖开发工具、计算架构以及硬件设施如算力、存储和网络。在设计和验证过程中,必须考量性能、可靠性、可维护性和兼容性,以确保系统的高效稳定运行。


   其次,行业大模型需要 AI-Native 的基础设施。一般企业可以直接选择公有云来享受充足的算力,但对于政府、金融、电力等大型政企来说,为满足安全合规要求,混合云才是更优选择,即先借助公有云的强大算力和数据训练基础大模型,再在私有云里结合私有数据进行二次训练得到企业专属大模型,最后在边缘云进行推理以实现场景化应用。


   再者,大模型需要建立 AI 开发工作流,推动模型的确定性交付。大模型的开发是一个复杂的系统工程,需要跨团队协作和迭代开发。为提升开发效率和质量,需要构建一站式的 AI 开发工作流,实现标准化和自动化,降低开发过程中的不确定性。


   第四,大模型需要重视数据工程,构建优质数据集。高质量的数据是大模型成功的关键。当前中文数据集与英文存在差距,需要通过建立数据工程能力,优化数据的供应、流转和使用,为大模型提供高质量的数据。


   第五,行业大模型不适宜单打独斗,需要大力培育产业生态。生态是发展大模型不可或缺的要素,这需要政府和行业头部企业从技术生态、数据生态、模型生态和应用生态四个层面,构建 AI 时代开放、可闭环、高质量的生态体系。


   最后,大模型不是一劳永逸的,需要持续运营和优化。大模型的运营和建设同等重要,持续的运营和优化对于大模型平台的长期价值至关重要,这要求企业建立合适的流程、组织结构和人才队伍,不断优化现有场景并探索新的应用领域。


   简而言之,行业大模型考验的并非单项能力,而是全流程融会贯通的工程化能力。


   先行者稳步前行,行业大模型前景光明


   综上所述不难发现,尽管当前大模型在技术和价格方面竞争激烈,但实现其价值的“主路径”在行业,真正的竞争点在于落地。在行业大模型的赛道上,不盲目追求算力和参数量的堆砌,而是聚焦技术与场景的深度融合,踏踏实实地积累工程化能力,推动行业大模型的落地才是关键。从这个角度来看,AI for industries 的华为云与政企行业先行者的联合创新实践,走在了正确的道路上。


   去年,华为云率先发布了业界首个大模型混合云华为云 Stack。在近期的华为开发者大会上,华为云进一步发布了大模型混合云十大创新技术,包括多样性算力调度、算子加速、云边协同等等。既有核心技术研发实力,又拥有业界最全面的 AI 大模型全套工具链和软硬件产品,华为云 Stack 的一系列举措,让行业大模型的焦虑得到了很大程度的缓解。


   例如,从 2022 年起,山东能源集团与华为云基于混合云打造了全球首个矿山大模型,已在煤矿领域的 9 个专业 40 多个场景进行应用实践。今年 1 月,鄂尔多斯与华为联合构建了内蒙古首个以行业 AI 大模型为核心的工业互联网平台,在煤矿领域的提升、主运、安监、防冲、采煤、掘进、辅运、洗选、焦化等 9 个专业实现了 26 个场景的智能化,实现了可视、可管、可溯的规范化作业,在提升安全生产能力的同时有效提高了生产效率和效益。


   更值得关注的是,先行政企的行业大模型不仅是自用,还在牵头打造示范场景并积累经验,向外输出为行业赋能。比如,鄂尔多斯工业互联网平台目前已完成 44 个 AI 大模型应用开发,上架 270 多款商品,为 28 家 AI 企业、16 家矿鸿企业共 44 家应用开发者以及当地 300 多家矿山生产企业提供了开放可靠的交易平台。


   展望未来,相信在华为云及产业上下游各方的共同努力下,依托我国丰富的场景优势,大模型必定能够开拓更广阔的行业智能化空间,加速迈向智能世界,释放出更大的经济和社会效益!


   例如,在一些传统制造业中,通过引入行业大模型,实现了生产流程的智能化优化,大大提高了生产效率和产品质量。


   声明:本站所使用的图片文字等素材均来源于互联网共享平台,并不代表本站观点及立场,如有侵权或异议请及时联系我们删除。


10年+

行业经验

100+

认证品类

5W+

通过证书

98%+

客户满意度

90%

覆盖行业

关注资力企服

工作时间: 周一至周日:8:00-22:00

咨询热线: 400-666-7008

Copyright © 2018-2024资力企服 All Rights Reserved 浙ICP备2020035072号