自从现象级模型ChatGPT问世引发全球关注,大模型与人工智能的快速迭代,不断刷新着新闻的头条、人们的认知,以及对于未来商业的无限想象。百模大战、大模型与小模型的比拼、大模型幻觉、评估标准不一、数据集稀缺……随着人工智能能力边界的不断拓宽,人们对于它的下半场去往何方,涌现着越来越多的讨论。在2023bet356亚洲体育官网入口企业家峰会的行业分论坛上,我们邀请生态圈企业家,来一场关于人工智能的“中场讨论”。
从ChatGPT问世到目前,人工智能的发展仿佛被按下了加速键,今年一年的发展速度已经超过了以往任何一个时代。看这么多的大模型,赛道非常热闹,动辄大几十亿的资金,那么未来的终局是什么?终局,可能是未来3—5年,算力会成为基础的工业设施,类似于制造业企业所需要的天然气、水和电。在实际生产和生活中,无论你是否愿意,都会存在。
以未来一定时期来看,卡脖子的算力是行业的痛点。但我们必须也认识到,在算力的竞争力上,还是有差距。目前国家在以集大成的能力去布局相关算力领域的研究和搭建,比如在北京、上海,把算力集中,以一种类似基础设施的模式去提供给创业者和企业,这里面会伴随很多算力中心、云计算等相关的机会。另外,我们也提出了如稀疏计算、张量并行这样的概念,尝试通过软硬协同来补算力的缺口。
另外通用模型,是不是就能解决所有的问题呢?这可能是一个终极目标,但是在当前的演化过程中,大家也逐步发现,是不是可以通过通用模型+垂直应用模型这样的组合,去形成一定的商业形态?在整个落地的过程中,还有很长的路要走,需要更多的资金来支持,更多的场景来支撑,大模型开发和实际产业化应用落地的路途依然任重道远。
经过近几年的发展,bet356亚洲体育官网入口在AI领域已投资了40余家企业,从基础层、技术层、应用层都做了一些投资布局。我们相信在新一轮的科技革命和产业变革当中,AI企业将能找寻到新的发展机遇,当然也面临着新的挑战和困境,我们应该做好充分的准备。
谷歌云大中华区软件生态总经理李云出席论坛,深入探讨了GenAI行业的技术趋势、市场格局和行业应用。
大模型爆发这一事件的重要程度相当于工业革命和互联网的诞生。随着技术的快速发展,未来AIGC应用场景非常广泛。投资界、企业界以及学术界都十分看好AIGC,认为AIGC是未来5-10年的核心方向,将会是一个万亿级市场。但我们也应该注意,在AIGC的大厦上,还飘着一朵安全问题的“乌云”。
一个达到万亿级的市场,必须要谨慎考虑AIGC的安全话题,其最大的风险来自生成式人工智能的内生安全。首先,大模型的生成机制使它非常容易“一本正经胡说八道”,不可避免地输出一些不存在的事实。其次,由于大模型是靠大量人类语料训练的,所以语料整体呈现的价值观最终将影响大模型的价值观。最后,数据收集的延迟也会导致信息的可信度下降。今后人类判别信息真实性的成本将越来越高,特别是到了2030年训练数据主体来源为AI时,如何辨别真假?这是未来的严峻挑战之一。
中国对AIGC监管方面十分重视,行动也非常迅速。今年1月执行的《互联网信息服务深度合成管理规定》,要求深度合成内容需要提供必要标识,要告诉别人是生成的。今年8月《生成式人工智能服务管理暂行办法》执行,要求数据、发布需要合规等。
对于如何提供安全的解决方案,中科睿鉴也提供了不同层次,面向国家、行业、个人和人类需求的AIGC安全产品解决方案体系。比如睿鉴在面向个人安全AIGC检测工具和服务方面,发布了睿鉴AI微信小程序,访问量非常大,各个行业的人都在用。当个人用户被用伪造视频诋毁声誉时,就需要用到检测工具,去随时随地查询图像、视频或文本是否是伪造的,希望这个工具可以服务到大家每一个人,造福人类。
人工智能安全最大的问题是不知道安全问题究竟在哪里、有多少。因此必须不断地探索它的安全边界,里面有无数开放问题,最重要的有三个:第一,深入剖析AIGC大模型机理,需要打开大模型黑箱,理解安全问题产生内在原因并解决它。第二,要发展可控的AIGC大模型。让它的学习目标是受人类控制的,AIGC大模型应当(尽可能地)要为人类可控。第三,审慎发展超级智能。低智能体无法控制高智能体,当AI智能超越人类的时候,人类没有安全可言了,包括图灵奖得主Hinton也说到了这个问题。未来会怎么样?人类如何面对超级智能?如何不被AI所控制?这些是非常开放的问题,我们需要一起面对和解决。
中国科学院计算所“数字内容合成与伪造检验实验室”,是国内少有的以伪造检测命名的专业实验室,依托实验室积累,孵化了企业“中科睿鉴”,取睿智鉴定真伪之义。
今年7月,华为云在开发者大会上发布了盘古大模型3.0,引起了很大的关注热潮。华为从2019年就投入了大模型的研发,核心是要解决AI落地行业的难题。2021年,华为就发布了盘古大模型第一个版本。
可以说,大模型给华为云AI项目落地带来很大的变化:1、泛化的问题,一个大模型覆盖几十、上百种小模型的场景;2、解决小样本的问题,很多行业场景的AI训练不像通用AI模型,在互联网上有足够的通用数据,少量样本无法训练达到预期效果,大模型可以通过小样本数据训练实现高精度;3、解决AI门槛的问题,以前AI工程师和业务人员需要长时间沟通,理解行业的问题,才能开发AI模型,现在有了大模型以后,很多时候,企业具有一定AI知识的业务人员,就可以自己通过微调的手段,来生成具体的场景模型。这些是大模型给行业AI应用落地带来的最大变化。
华为盘古大模型,不是一个模型,而是模型族,包括了各种不同能力的模型,盘古大模型从设计之初,就是面向行业,基于行业需求设计了盘古大模型的三层解耦架构。陈李认为,华为云除了要做好自己的盘古大模型,还要支持好千行百业打造大模型。在我国AI算力受到限制的情况下,华为云的昇腾AI云服务可以提供澎湃的AI算力,供大家训练大模型,同时昇腾AI算力也已经适配好了主流的开源大模型,大家可以在云上直接调用。华为就是要做黑土地,赋能好百模千态。
智谱AI团队脱胎于清华大学计算机系知识工程实验室,是国内比较早投入大语言模型的团队。2020年可以称作是大语言模型的元年,智谱也是那时开始All in大模型研发工作。2022年8月,智谱推出了GLM-130B,发布之后在国内外引起了非常大的反响,今年3月,智谱正式上线了ChatGLM千亿基座对话模型,今年5月发布多模态对话模型,6月升级ChatGLM2模型,8月C端产品智谱清言正式上线,代表智谱发展过程和追赶世界顶级水平的步伐不断的加速和提升,这个过程中bet356亚洲体育官网入口作为投资方给了很多的帮助。
我们认为,人工智能的涌现呈现出特殊的增长曲线,前面是慢性、线性的增长,越过临界点之后是井喷式的增长,技术喷发、爆发以及应用成熟的拐点是千亿基座模型。经过算法、加速一系列技术的研发努力之后,GLM-130B发布,引起了学术界和科技公司的广泛关注,到现在为止,已有70多个国家,1000多家机构使用这个模型。基于这样的基座模型,智谱在3月上线了ChatGLM,参考了ChatGPT发展路径,加入了代码预训练和微调等一系列技术,并把这个模型做成APP,今年8月31日第一批通过监管部门审批,正式上线。
我们一直认为,任何技术最终都会走向应用,创造更多的用户价值,所以智谱很早就开始布局商业化路径。对于大模型,智谱有全栈的服务,包括模型训练的方法、框架和模型本身的AIaaS等方面,支持更多的企业开发自己的应用,去赋能自己的行业,这是智谱比较早的提出的MaaS概念,在现在进入生成式AI第二阶段之后,在这个基础上取得了更好的商业化落地的效果。
在传统的软件发展过程中,有大量的应用是聚集了大量的用户,这样的应用通常最后会把自己变成大的平台,比如说搜索引擎Google、Bing等产品,让更多的开发者和应用借助这个平台,变成这些平台当中的应用,比如一个APP,或者一个插件。在那个阶段,大家关注的是产品当中用到的算法,这些算法要借助产品的平台转化成用户所需要的价值。而现在这个阶段不一样的地方,是现在要关注的是大模型本身,思考的是从大模型出发,如何开发新的应用,能够比较好地展现大模型原生的能力,而不是简单地当成替换的零件(替换原有产品当中某一个模型的模块),因此思考的方向是不一样的。
现在的大模型在改变原有的软件的开发方式和生态的应用方式。早期建立的平台,用户的功能、漏洞靠软件开发者定义和实现,而当大语言模型产生之后,大家更期待在这样的模式背后,大模型真正赋予软件生态智慧,更自动、更智能地打通APP背后的数据、逻辑、流程。比如说你需要规划3天的旅游行程,需要搜攻略、订票、配合时间、安排行程,比较价格、方案,但是现在只需要大语言模型作为核心的AI助手,告诉它有3天假期,去什么地方,同行的有老人、孩子,它就可以自动在网上获取信息,甚至帮你订机票、订车、订酒店。智谱已经做了类似的事情,这也是大家所想象的未来的大语言模型原生应用开发的方法。目前,智谱已经推出了面向金融行业的办公场景、知识共享场景等多种行业解决方案。
在医疗AI这个赛道里,数据和技术壁垒很强,医疗也是个严谨的行业,所以在医疗行业里人工智能的进展远远没有通用大模型(比如OpenAI)走得这么前沿。但是医疗是非常重要的B端赛道,关系到民生,所以医疗方向里做人工智能的企业还是非常多的。
人工智能发展要跟场景、数据、商业等很多元素结合到一起,通过人工智能的技术解决真正场景里面的问题,场景里面客户也愿意为这个技术和产品买单,这是非常重要的点。国内上市的政策、制度都在逐步变化,现在不盈利的企业上市难度比原来大很多,所以技术更需要和场景的痛点结合,一开始就要思考做的产品,如何盈利。
首先医学影像人工智能企业是最多的,比如肺结节的筛查,就是通过人工智能的学习,把医生以前5-10分钟看一个病人,提高到10秒钟,大幅度提高效率,减少漏诊。比如脉得智能,是GE医疗合作非常深入的超声人工智能企业。超声通常来说对医生个人手法是要求很高的,超声设备的企业会做图像质控方向的人工智能应用,但在图像识别和诊断方面,会和国内人工智能企业展开合作,像脉得的AI应用就和GE的台式超声机做了整合,医生既可以看到超声出来的原图像,也可以动态实时的看到人工智能处理过的图像,价值非常高。影像人工智能在大的医院可以提高效率,基层医院可以进行分级诊疗,应用空间是很大的。脉得人工智能的应用,是实时,多模态、多种图像格式的,还可以给到很多量化分析,特征分析,以前医生采集标注非常麻烦,边上还需要一个人帮忙记录数据,整理报告,现在有了超声AI可以处理完自动出具结构化的报告,操作非常的便捷,这很有临床价值和实际意义。
医疗影像的人工智能这几年发展迅速,根据初步的统计,目前已经有70多个产品拿到NMPA三类证,走进临床使用。早期这么多应用同质化的比较多,但是现在已经所看到几家头部的企业慢慢成型,活到最后的才是赢家。另外,医疗人工智能还用在医疗芯片、医疗机器人、医疗可穿戴和元宇宙、健康管理、病例文献、基因检测、药物合成等方向。AI在医疗的赛道很宽广,需要差异化地来选择人工智能的创新方向。
医疗器械大公司的数字医疗及医疗人工智能,主要是几个方向:1)智能的设备,怎么把以前的设备做得更加的智能,怎么样把设备、医院的数据流、工作流、重大资产、绩效管起来;2)智能的临床,怎么样把很多诊疗一体化做得更加智能,把就诊流程做得更加顺畅。近些年随着外企把产线转到中国来,很多合作伙伴,供应商,成为赛道里面隐形的冠军,在这个转产过程中许多供应链和核心零部件都需要人工智能的应用,都是需要在本地找到供应商、合作伙伴的,慢慢地会跑出来一些企业。
Q:今天的圆桌我们请了聚焦在AI细分领域应用的企业嘉宾,一起探讨目前大浪潮下AI的商业化落地,就是在目前的环境下面怎么通过技术赚钱,应该也是各个企业在未来发展的最重要的核心要素。首先请各位简要介绍一下大家在AI的上半场,已经做了哪些布局和取得的进展。
百家云-马义:百家云是一家以音视频技术和AI技术驱动的技术服务公司,主要是做TO B技术服务,最早从服务教育行业开始,后延展至多个行业,去年底在纳斯达克上市。我们一直密切关注AI技术浪潮的发展,因为对于我们做TO B技术服务的公司来说,这是一个生死的坎,做对了就会有大的发展,做错了就会再也没有机会了。
倚澜科技-戴翘楚:倚澜科技是一家做元宇宙数字化营销的公司,通过自研的虚实融合引擎为品牌提供数字化营销解决方案,覆盖了渲染和虚实交互以及底层内容技术,为应用于品牌的产品全生命周期数字化营销,目前已服务的品牌,包括特步集团、太平鸟服装等。
博特智能-戴亦斌:博特智能主要是围绕内容产业链用人工智能技术进行赋能,比如,AI内容创作、AI内容安全、AI内容信息检测和过滤,即在互联网上、政企客户和专业机构,他们对外需要发布的内容,以及信息进行识别和合规检测。今年新的业务,主要是针对大模型的应用和AIGC的安全评测。
恒力华振-刘涛:恒力华振是做装备智能化和数字化企业,宗旨是让装备好用,让人用好装备。我们来做这件事情,主要是看到很多工厂里的操作人员,对设备不是很了解,或者对设备的掌握使用会随着老工人的离开而流失。我们希望通过对装备做数据收集、管理和数据模型,把这些工人的经验和企业管理的经验沉淀到设备上面,让设备越来越智能。目前我们在精细化工、机加工等行业,以及一些卡脖子设备上开展工作,并取得较好效果。
脉得智能-侯雨:脉得智能专注医疗人工智能,目前业务分布在两个方向:第一,围绕着超声医学影像所涵盖的临床方向,包括甲状腺、乳腺、前列腺、肝脏等一系列的临床疾病的分类,来做超声相关的人工智能的专家诊疗系统和平台的建设;第二,在医疗方面的布局,围绕基因组学的生物信息分析,加入人工智能的应用和落地的结合。我们希望在严肃医疗的场景下,人工智能也可以发挥积极的作用。目前在国内,我们从细分赛道的市场占有率和覆盖,应该是排名第一,全国TOP100的医院超过90%都是我们覆盖的客户。
Q:目前的背景是“百模大战”,也请各位分享一下,在下半场,各自的思考和布局是什么?
百家云-马义:我们这样的企业,更多关注的行业落地。在行业领域当中,我们更了解客户的需求,如何帮助用户提高效率,在这方面会比我们在C端应用和其他方面的应用,能结合更快、更早一点,还是有很大的机会,这是我大概的想法。
倚澜科技-戴翘楚:现在大模型感觉布局初具规模,但我们在做具体的品牌化数字化营销的时候发现,其实大模型的成本非常高的,落到实际的行业当中,我们会更关注小模型一些,因为它在特定的领域当中,能更快速地落地,实现产业化的规模,这是我们公司关于“百模大战”的实战想法。
博特智能-戴亦斌:我们做互联网的内容运营平台和内容发布(直播、短视频等)的内容审核,传统的内容审核方法是AI做初筛、人工做二次审查。第一道AI的审查就是传统的的文本分类、关键词匹配、图像识别、人脸识别等,可以使用各种小模型来审查,对文本、音视频、图像等进行审核;而人工二次审核是行业的痛点,无论是大企业,还是新兴企业,人力成本都是一个不小的负担,而且人员素质,能力参差不齐,也会带来主观判断和标准把握尺度不一,造成不小的安全风险遗漏。
在内容安全风险面前,我们倡导用铁面无私的机器来做判官,把安全性提上去。所以我们通过大模型的技术手段来替代人工二次审核,大模型技术用在一次审核成本太高,效果也达不到,但是用在做二次审核是非常好的,我们在这方面投入了很多资源和精力研究,目前也取得了非常不错的效果,成本降低到人工二次审核成本的四分之一或五分之一。最关键的是,通过我们独有的“意识形态数据集”训练的安全大模型,在解决大模型社会主义核心价值观对齐、消除歧视偏见、遵守法律法规、个人权利的维护等大模型疑难杂症层面得到了很大的质量提升。这是我们在大模型应用方面的收获和体会。可以说大模型在未来各个领域都有非常高的实践价值。
恒力华振-刘涛:从模型角度来讲,我们在今年上半年,也试着训练了轴承的故障诊断、齿轮箱故障诊断的小模型。跟传统的深度学习、传统的工业计算模型相比,小模型的精度有一定的提高,可以提高20%-30%的效果。后续,我们也是想进一步地把这些新的功能逐步加入,把辨识的精度和效率做得更好。
另外,我们主攻的工业场景当中,很多的合作单位,他们对数据质量要求和数据完整性要求越来越高,所以很多企业其实都在建数据系统和积累自己的数据,希望通过的自己的数据训练出来适合自己工厂的诊断模型和经验生产的模型,提高生产质量和生产效率,降低生产成本,这也是目前的趋势。
脉得智能-侯雨:大家一直分享的通用型大规模的预训练的模型,对我们做医疗行业的来说,现阶段可能是比之前嘉宾介绍的更早期的阶段,所以我们更加专注的是符合个性化需求、临床需求的专业方向的行业大模型。基于这样的情况,我们现在跟全国多中心联合,帮助医院搭建人工智能中心,基于这个中心围绕几个维度做事情,像医院管理、精准治疗和方案设计到最后的康复、随访等环境都会涉及。在我们这个行业,现在更多是像锤子钉钉子,解决行业当中具体的细分需求,这是我们在医疗细分赛道做的前期布局。
Q:关于AI的商业化,我们也希望探讨一下,在真正销售的过程中,客户是否会买单,或者会不会存在这种情况,就是现在推销产品的时候,如果不提大模型、不提AIGC,产品就卖不出去了?
百家云-马义:现在我们对产品上落地AIGC,我们是这样考虑的:现在大家熟悉的所有的应用,可能在未来几年内,整个界面都会发生变化,因为大家的交互方式会发生变化,不是以前的鼠标、触摸屏,而是会发展到AI语言的交互方式,如果你的模块没有做智能升级,对用户来说,TA的操作体验感越来越差。
另外,基于大模型在这个阶段的特性,我们认为更大的可能性,还是会用在一些比较可以代替的基础性人体劳动的地方,代替一些大众可以做的事情,把人解放出来,规模化来获得利润空间。
倚澜科技-戴翘楚:其实这个市场变化非常快。随着AIGC大模型这两年火热了,更方便客户理解这项技术是如何帮助行业的发展,我们发现客户也在成长,无形之中成为了AI技术和产业联合的桥梁。其实在早期,高科技公司去落地这件事情是非常困难的,通过AIGC大模型的宣传,反而让客户更加愿意去拥抱新技术给行业带来的变化,我们感受到,目前客户也是非常地热烈地去拥抱这项技术,并且更愿意和我们这些高科技产业进行合作。
博特智能-戴亦斌:从我们实际的体会来说,在AIGC商业化的时候,主要考虑两个方面,一是应用效果,能帮助客户解决实际问题的效果;再就是成本,在中国做TO B应用都是高难度的应用,既要效果好,又要价格便宜,所以一定要平衡好成本和效果。
在让客户付费和商业化方面,我个人有一个认识,就是我们尽量来做存量市场,因为存量市场有现成的预算,通过大模型和AIGC,可以降低成本,这个客户相对来说用得不那么费劲,我们也跟客户达到了双赢的效果。
恒力华振-刘涛:AIGC和人工智能在工业领域,还是比较热门的,这次GPT出来之后,让我们的客户对人工智能新的发展的有了更高的预期。今年我们可以明确感受到,在客户做新项目的时候,会更多地考虑把人工智能的想法和功能带进去。但同时,工业企业对成本的要求也是非常严苛,每一次都考虑投资回报率,所以在这一点上我们必须做好权衡,满足我们客户要求的效果,同时成本又可以控制住。所以我们也在思考,是不是可以有轻量化的产品,结合人工智能,更容易在工厂落地、让工厂变得智能。
脉得智能-侯雨:当前我们的医生和医疗的相关资源,其实是分布非常不均衡的,存在短缺的问题,但就诊和医疗的需求,又非常旺盛,随着老龄化的到来,会进一步加大。目前没有办法通过常规节奏的手段,来响应爆炸式的井喷的现象,所以需要人工智能和大模型的技术,用关键的模型来做关键性的事情,弥补中间的差异。
另外一点,在严肃医疗的方向上,世界各个国家对严肃医疗都有着很高的准入门槛,从整个注册证的获批,到物价收费条码落地,再到院内对患者进行收费,其实是比较漫长的过程,所以这个转化的过程中,不是说这个产品具备了很多的应用的场景和价值就可以很容易的变现,它必须先解决好资质的问题,再在这个基础上,逐步变现。另外还有一点需要注意的是,对于消费者或者是患者来说,TA是最在意的,就是这个AI的结果和生成的内容的质量和可信度,这是非常重要的。