当前位置:首页 > 知识

十问澜舟科技周明:做大模型,为什么说中小企业“不要急,先观望”?

  文 丨 新浪科技 周文猛

  ChatGPT横空出世近一年后,问澜望国内宣布推出的舟科中大模型产品已早早破百,更多有关大模型的技周蓝图绘制和人员招募,也已基本走完。大模下一步,型为先观练出大模型后如何与真实场景结合落地?如何成功变现?成为考验大模型玩家的什说终极考题。

  近日,企业新浪科技《科创100人》采访了中国计算机学会副理事长、不急澜舟科技创始人&CEO周明,问澜望就时下大模型行业发展、舟科中未来走势等进行探讨。技周对话中,大模周明指出,型为先观“作为初创公司,什说想要在通用人工智能领域与OpenAI直接竞争可能是企业不划算或得不偿失的,当模型达到一定水平后,必须立即加速落地,通过行业知识和场景数据构筑竞争壁垒。”

  据他介绍,澜舟科技在领先业界完成通用模型的建设后,如今已经转移至行业模型、场景模型的制作,致力于解决大模型“最后一公里”的落地问题。他认为,大模型的出现,将进一步改变软件开发的范式,这一波浪潮中,大企业如果不积极参与,“将面临落伍被淘汰的宿命”。但对于中小企业而言,由于投资布局成本太高,建议先观望行业头部企业的大模型落地情况适时推进。

  2020年末,时任中国计算机学会副理事长、创新工场首席科学家的周明,提前预感到通用人工智能技术的变革突破,在国内率先开启了大模型相关技术的研发孵化,并带队成立澜舟科技。今年3月,当ChatGPT国内初热时,澜舟科技便率先推出孟子GPT生成式可控大语言模型,成为国内初创企业中最先实质性推出大模型的企业。

  创立澜舟科技前,周明曾长期担任国际计算语言学学会主席、微软亚洲研究院副院长,是全球 NLP领域领军人物,在全球乃至于国内NLP领域有着极大影响力。以下,新浪科技罗列了本次采访过程中周明亲自答复的大语言模型领域十大热点问题,供读者参考。

  1、澜舟科技比业界提前两年开始布局大模型,您是如何提前捕捉到这一轮AI技术浪潮的?

  我在微软亚洲研究院工作了21.5年。经过多年努力,我在微软的使命基本达成了。我所领导的研究部门(自然语言计算组),无论是研究、技术转移、大学合作、影响力都超过了我的预期。我们培养了20余名博士生、20余名博士后,500余实习生。现在他们已成为各大公司的科技负责人、技术骨干,或者是知名大学的院长、教授。

  当我完成了该做的事情后,我认为应该寻找一个更具吸引性和挑战性的事情。2020年底,我注意到了预训练模型——也就是如今大家都在谈论的大模型的前身。我认为预训练模型将来会成为工业界类似水、电、油这样的基础设施,于是我决定把它作为创业方向。我得到了李开复和创新工场的支持,于是我在2020年底离开微软,在创新工场着手孵化一个团队。2021年6月正式创立了澜舟公司。

  从2020年底到现在,我们已经做了快三年的大模型核心技术,去年年底ChatGPT火了之后,我们已经积累了两年多的经验,所以我们得以从容地布局。

  2、澜舟做了很多垂直领域的行业模型,为什么倾向于做垂直行业大模型?

  通用模型基本采用GPT风格,目前技术相对透明,只要有数据和机器做训练,大概都能达到GPT3或者GPT3.5的水平。但接下来便需要与OpenAI竞争,而OpenAI在不断进步,拥有领先的技术、充足的数据和非常优秀的人才,作为一个初创公司,在起步阶段就与世界上最强的AI公司直接竞争是不现实的。

  我认为一旦模型达到一定水平,必须立即落地。通用模型在某些行业可能无法取得成功,它在某些领域却表现不佳,因为必须将行业的知识数据融入,重新训练一个行业的模型,才能取得理想的结果。例如金融模型,如果你只依赖通用模型,即使是ChatGPT也无法取得成功,因为它涉及金融特别细微的任务。我在国内算是最早主张做行业大模型的了,两年多前创业时,我们就已经开始布局做通用模型、行业模型和场景模型。

  场景非常重要,我们将通用模型训练到国内一线后,便迅速开展了行业模型和场景模型的训练。只有完成了行业模型和场景模型,才能对用户产生价值。否则,通用模型对用户的场景支持不足,最后一公里的落地效果不佳。

  我在微软做了很多NLP研究和落地工作,知道这个过程需要迭代,需要双腿走路线,不能只做通用模型却不考虑实际落地。即使是微软这样的大公司,也鼓励研究员多做有用的研究。做大模型需要行业数据的反哺和持续的迭代,才能最终胜任期待的工作。

  3、大模型与行业结合的最佳形态是什么?Agent、插件还是其他形态?

  都有,有些企业需要我们的行业模型,他自己在上面开发应用。而有些企业并不关心背后使用了什么模型,只关心你的产品能不能满足自己想要实现的功能,这就需要有所谓的场景模型。

  在具体的行业中,AI Agent实际上是一个自然语言人机接口,用户将自己需要完成的任务用自然语言表述出来,大模型将任务分解成子任务,每个子任务由一个大模型调用合适的API或数据库来完成,然后串接起来完成一个大任务,这就是所谓的AI Agent。

  在实际操作中,AI Agent更多是面向非码农业务人员或管理人员,而场景模型则是面向专业人员。再往下是行业模型和通用模型则面向研发人员,他们调用行业大模型或通用模型完成自己的事情。站在我们的角度,只要有客户需求,无论是哪一层的模型和能力,我们都可以提供解决方案输出。

  4、大模型带来了哪些颠覆性改变?

  大模型使得研发成本大幅度降低,有效解决碎片化问题。AI服务企业的时候,在基础架构的基础上增加了一个模型层,这个模型层对软件开发具有重要意义,因为它是数据驱动的。将来,如果你想改进能力,可以不依赖过去的规则方法或统计机器学习方法,需要专家调整系统,而只是需要增加数据,重新训练模型。这样做系统维护变得简单。

  5、具体会如何改变开发范式?

  一方面,现在的工程师必须掌握模型调用以及模型配套工具。要学会根据场景适配大模型,并且测试大模型是否满足要求。同时,也要掌握大模型跟数据库、搜索、API调用这些都是周边的工具。大模型和周边工具的掌握是工程师的基本功。

  另一方面,由于大模型带来了编程优化,例如使用自然语言进行编程,对编码人员的要求和技能也降低。

  此外,大模型的维护主要依赖数据驱动,无需找很多专家去写规则。例如,金融领域的细节问题,以前需要找许多专家去做规则算法等,现在不用找那么多专家了。只要有数据,大模型自己学习就可以沉淀出认知。这样一来,开发效率大幅提升了。

  以上几个方面加起来对软件开发形成了一种新的范式。

  6、你认为大模型时代的杀手级应用会以何种形态出现?

  以B端金融营销为例,用户只需描述自己想做的事情,然后大模型分解每个步骤执行,最后将结果联系在一起,输出一个标准报告或H5显示页面等。

  另外,在C端消费环境下,有可能形成超级应用。现在我们手机有大约上百个App,每个App主要完成一个特定目标。将来假设存在一种新型的超级应用,你只要告诉他想要干啥就行,然后他便会内部调动各种能力和工具,找到满足你需求的答案,然后排序罗列给你,我们也称他为智能助理。我认为这件事是未来有可能实现的。

  7、落地过程中,对不同类型客户有何建议?

  对于中小企业而言,我们可能最好先等待大客户把平台做好,把案例呈现出来,然后直接借鉴大公司的做法。否则自己投入需要承担很多,如购买GPU,招聘人员等,这些费用都很贵,对中小企业而言压力太大并不现实。所以,建议他们关注大企业的进展,一旦有成熟且经济的解决方案,可以快速引进。

  对于大型企业而言,他们必须争当排头兵。因为一旦在这方面竞争落后,整个公司的效率将比竞争对手差很多,而且船大不容易掉头,这样在新一轮经济竞争中就可能落后。到竞争对手已经布局成功的时候,你再开始布局可能就晚了。

  因此,大型企业应该早日落实,中小企业的发展最好看大型企业的表现。

  8、大模型企业该如何推进商业化?避免陷入上一轮AI企业的盈利困境?

  实际上,我认为大模型未来与互联网有所类似,如果客户愿意注册成为你的会员,或者某个平台或APP流行时进行一些广告投放,又或者做很多好用的模型直接解决客户的问题,这些都会获得付费的机会。

  在这一波大模型技术浪潮中,无论BAT还是初创公司,过去10个月主要是练习大模型、组织队伍、购买服务器、购买算力和各种数据,练出了自己的模型。目前这场战役已经结束,各参赛队伍都练出了自己的模型,优秀的企业大概能追到GPT3.5的水平。但落地仍存在问题,包括OpenAI的落地也遇到了问题,他现在的营收也不太理想。

  无论国内还是国外,无论是To B还是To C,理想的商业变现模式都还没有走出来,可能还需要更长的时间来把握。毕竟,现在刚练出大模型,接下来才是开始考虑真刀真枪的变现时候。

  9、这一轮技术浪潮中,许多大模型企业和云厂商深度绑定到了一起,你看好这种组合吗?

  训练大模型需要很多算力,两者结合后,云厂商负责管理,不太关注模型,也不需要分析和处理。而模型厂商也能够更好地获得云资源支持,这两者合作是有道理的。但这也需要合作双方具备相似的文化基因,云平台要真正愿意支持大模型团队进行各种创新,而不仅仅是为了挣大模型团队的钱。

  实际上,我认为还是需要更好地实现不同商业机构之间的互动。因为,没有免费的午餐,我是云厂商,你大模型团队用我的资源,我也得考虑赚钱。要么你的大模型为我的客户服务,要么你给我带来更多的云流量。

  10、你同时也担任中国计算机学会副理事长,学会在促进大模型生态繁荣方面会做些什么?

  中国计算机学会是中国计算机界的最高学术学会组织,目前有10万以上注册会员,在国内注册交费学会中名列第二。我们每年会举办几百场/次各种规模、层次的学术会议、产业与技术论坛和培训,开展评奖、竞赛、计算机职业资格认证、科学普及、计算机术语审定等系列活动,促进交流和学习。

  另外,华为、百度、腾讯等企业也是我们的会员单位,他们也能提供基金,可以开放给国内外的老师或研究机构研究员申请。在申请完成后,他们将研讨一些核心技术,发表造福全人类的内容,实现滚动发展。

  我很荣幸以学会副理事长的角色,主管学会对企业的服务和学会会员的发展。在过去四年间,在学会秘书处、学会理事和会员的支持下,我们创立了把各个单位的技术负责人联系在一起的C3活动品牌。此外,面向工程师培训,我们扩大技术前线(TF)的讲座选题、频次和规模。我们每年在CNCC大会举办CTO论坛,在10月24日前后举办CCF工程师文化日。通过这一系列的活动,有效地服务了广大企业的技术高管和普通工程师,帮助他们掌握最新的技术动态,交流技术管理经验。

分享到: