·“ChatGPT(新必应)智力水平无疑是很高的,我认为在L4附近甚至更高(但拟人化程度较低)。Bard可能稍微低一点,但外界可测的信息很少。”

随着ChatGPT爆火,一系列AI对话机器人出炉,其中最棋逢对手的应该就是谷歌的巴德(Bard),这两者对比如何?

发起制定了全球首个《AI对话系统分级定义》的清华大学计算机科学与技术系长聘副教授、聆心智能创始人黄民烈对澎湃科技(www.thepaper.cn)评价道,“ChatGPT(新必应)的智力水平无疑是很高的,但拟人化的程度比较低,还是非常明显的机器属性。Bard综合能力上可能稍微低一点,但外界可测的信息很少。”

根据《AI对话系统分级定义》,L0级的AI对话系统完全没有自动对话能力或无法给出较高质量的对话;L1级能完成单一场景的较高质量对话,但无法处理场景之间的上下文依赖;L2可以同时完成多个场景的较高质量对话,具有处理跨场景的上下文依赖和自然切换能力,但是无法完成新场景较高质量的对话;L3级能针对大量场景开展高质量对话,同时在新场景中也能有较高质量的对话;L4级不仅在新场景中有高质量对话能力,还有较高的拟人化程度;L5级则在L4级的基础上,还能主动学习和持续学习,具有多模态感知与表达能力。

清华大学计算机系长聘副教授,北京聆心智能科技有限公司创始人黄民烈。

黄民烈认为,国内科技公司的难点不是在于什么时候推出中国版的ChatGPT,而是在这股AI浪潮中到底是否能够有深入的远见和创新性的想法,才能够迎面赶上甚至超越。

对于中国哪个机构最有机会做出类ChatGPT的产品,位于深圳的粤港澳大湾区数字经济研究院(IDEA)认知计算与自然语言中心文本生成算法团队负责人王昊对澎湃科技(www.thepaper.cn)表示,从技术实力、数据和计算资源来看,国内百度等大型企业具备开发类ChatGPT的实力。但是在新兴领域,尤其是人工智能领域,没有历史包袱的初创公司也有很大机会。在大量投资及核心算法人员支持之下,这些公司通常拥有更加灵活的战略规划。总的来说,最有机会的一定是能够坚定不移地执行其战略规划,并拥有足够的技术实力和创新能力的团队。

粤港澳大湾区数字经济研究院(IDEA)认知计算与自然语言中心文本生成算法团队负责人王昊。

那么,ChatGPT对市场真正会产生哪些影响?法国里昂商学院人工智能管理学院(AIM)院长、全球商业智能中心(BIC)主任龚业明则对澎湃科技(www.thepaper.cn)谈到,长期来看,ChatGPT的影响在于发展AGI(通用人工智能)市场。“对AGI市场应用有不同的理解,很多中国专家认为功能性或专业性人工智能更有商业价值,AGI的商业价值不大。通用人工智能在用户体验上更好,这两类人工智能会有不同的市场面。ChatGPT会推动这两个市场和融合和重构。”龚业明说。

法国里昂商学院人工智能管理学院(AIM)院长、全球商业智能中心(BIC)主任龚业明。

算法进步可能加速成本降低

澎湃科技:能否梳理下AI对话技术发展的几个重要阶段?目前阶段出现了令人惊艳的ChatGPT,这一阶段最核心的技术突破是什么?

黄民烈(清华大学计算机科学与技术系长聘副教授):回顾早期聊天机器人的对话,大部分都是基于规则的,第二代在技术上混合了一些规则和机器学习的方法。到了第三代,就是以Transformer为基本架构的大模型作为技术底座,实际上还是在一个新的神经网络架构下,结合我们大量的数据和算力优化去做到的,所以技术上有了显著的一些进步。由于对话本身就是在语言处理中最重要也是最难的任务,也就是最近一两年,才因为大模型的发展使得聊天机器人在性能上有接近人类的表现。

ChatGPT的最大特点是通用任务助理,也就是在一个模型之内可以完成如此之多的开放任务,同时它在上下文理解、安全伦理方面也有相当好的表现。

这里面的技术突破是一个技术、工程、数据的综合性工程创新,是一个长期积累从量变到质变的过程。比如从GPT-3到代码,到加instruct,到RL,以及数据和模型的之间飞轮,造成了这些质变。

澎湃科技:全球首个《AI对话系统分级定义》由黄教授发起制定,你怎么评价ChatGPT、Bard、新必应(Bing),他们分别处于什么样的水平?

黄民烈:ChatGPT(新必应)智力水平无疑是很高的,我认为在L4附近甚至更高(但拟人程度还是很低)。Bard可能稍微低一点。

澎湃科技:单位算力的芯片成本随时间指数降低, 像ChatGPT这样的大模型训练成本会随之快速降低吗?甚至算法的进步会让成本降低更迅速?

王昊(IDEA研究院认知计算与自然语言中心文本生成算法团队负责人):是的,单位算力的芯片成本通常会指数级下降,意味着我们可以以更低的成本训练相同参数量级的ChatGPT,这也就意味着随着算力的进步,可以训练更大的ChatGPT模型以实现更强大的能力。

此外,算法的进步也可能加速成本的降低。比如,训练超大稀疏模型(编者注:稀疏模型是一种特殊的神经网络,对于给定的token或样本只激活模型的一小部分,从而在拥有很大参数量的同时也能做到计算友好)。研究表明大模型推理时仅部分子网络连接参与,所以设计并训练超大稀疏模型可以同时减少训练和推理成本。

黄民烈:相比2020年GPT-3推出来的时候,这个成本已经降了很多了,我们最近做的加速算法,能提速3-5倍,所以这个肯定是大势所趋。

澎湃科技:ChatGPT和Bard在多轮对话后有时还是会对一些有道德风险的问题作出回答,大模型解决此类问题的可能思路是什么?

黄民烈:AI本身不具有政治立场,因为它是一种技术,不具有意识、情感或主观意见。但是AI可能受到人类的政治立场、价值观和意识形态的影响,从人类产生的数据中学习到偏见。技术本身是中立的,只不过在模型训练的过程中,可能会由于人类群体性的立场问题而出现不可避免的“AI立场”,这需要靠数据和算法,包括结合应用场景的特点来优化。我认为首先我们任何技术的使用都应该遵循道德和法律的原则,也不可避免地需要考虑社会和政治因素的复杂性,来让AI技术发挥出更大的作用。本质思路就是对齐到人类的价值观、伦理和道德观。

王昊:从源头上,要对预训练语料进行充分清洗,最大程度地排除包含有道德风险内容的数据。最终解决可能还是靠在人类反馈学习中纠正模型应对这些有道德风险问题的回答。

促进通用人工智能市场发展

澎湃科技:ChatGPT对市场真正的影响是什么?

龚业明(法国里昂商学院人工智能管理学院院长):在短期,ChatGPT对交互市场的初步影响:ChatGPT通过大量文本数据训练和算法生成与用户问题相关的回答,并用听起来自然的方式写出来。ChatGPT可用于文本生成、代码编辑、搜索引擎等多种应用场景。

在中期,ChatGPT会拓宽应用领域,提升AI商业生态。除此以外,微软、谷歌等公司将会利用ChatGPT等类似技术,获取新的利益增长点。微软最近又追加了100亿美元的投资,将在其产品中全面集成ChatGPT,包括Office,Bing,Azure,甚至Windows操作系统。如果要问真正的影响,这可能是。其他头部科技企业也要做同样的事情,此时就不是简单的聊天或者一个应用程序的问题了,而是整个商业生态的转变,未来会在科技产业掀起巨浪。

ChatGPT还会提高内容可信度和降低交互成本。由于内容可信度还不是特别高,以及交互成本高,很多市场分析人员认为ChatGPT对市场真正的影响有限,这种看法可能对这个技术的商业价值理解不是特别深刻。目前也只是处在ChatGPT发展的早期,内容可信度会随着训练与算法的提高,逐步解决。

在长期,ChatGPT会促进AGI市场发展。对AGI市场应用有不同的理解,很多中国专家认为功能性或专业性人工智能更有商业价值,AGI的商业价值不大。通用人工智能在用户体验上更好,这两类人工智能会有不同的市场面。ChatGPT会推动这两个市场和融合和重构。

AIGC(人工智能生成内容)将成为元宇宙生产工具。ChatGPT等AIGC应用程序将显著提升数字人的制造效率,内容生成快、成本低且可定制。AIGC能显著提高数字人多模态交互中的识别感知和分析决策能力,成为元宇宙世界重要的生产工具。AIGC有望成为元宇宙搭建的重要工具,并推动Web 3.0的发展。

澎湃科技:怎么看待AI对话系统的商业化方向?

黄民烈:未来的人工智能将达到AGI的水平,具备功能属性和人格属性。前者对应智商,后者对应情商,两者结合成为一个完整的类人生命体。ChatGPT定位是通用任务助理,强调功能性、机器属性,所以作为工具,提高生产力效率、降低入门门槛无疑是非常直接的。它可能会再造未来搜索、推荐、手机助手等系列信息获取形式,对信息产业和AI行业产生非常深刻的影响,并且已经具备了实际落地的能力,像国内已经有很多公司在准备研发自己的模型,未来算力成本也会持续下降。

我们在做的是把功能和拟人化特征结合在一起,打造未来的AGI Companions,与人类建立情感和社会链接,能建立信任。

“我们有较大的差距”

澎湃科技:实际上在DALL·E发布后,国内已有多次反思为何中国没有出现OpenAI,在ChatGPT之后这样的讨论越来越多。怎么看这个问题?中国的AI领域发展呈现什么样的特点,有何优劣势?

黄民烈:就底层技术而言,中国有很多团队和公司都有,但在最终体现的系统能力上,我们有较大的差距。 这里面有企业家精神、资本环境、人才、技术理念等多方面的因素,非常复杂。比如大模型研究,我们是做一个项目,还是实现AGI的最终理想?比如资本,是为了短期逐利,还是能够坚持长期投入?

我认为国内科技公司的难点不是在于什么时候推出中国版的ChatGPT,而是在这股AI浪潮中到底是否能够有深入的远见和创新性的想法,谁能在这条路上走多远。

从数据和应用的角度来说,中国的科技企业目前来看有比较大的优势。从数据角度来说,国内其实是产出了大量数据的,但数据的准确性和可靠性如果能够提上去,对于模型的学习和生成来说都会帮助很大。而国内的应用场景和市场其实是更加广阔的,在新闻、广告、教育等领域,而应用市场越广带来的优质数据也会越高,这样其实是能够实现双飞轮的运转,从而加速AIGC领域的成长。

澎湃科技:有观点认为,ChatGPT背后的GPT-3.5领先国内大模型一个代差,你怎么看?这样的差距来源于什么?

黄民烈:基本认同。最主要的是一些基础模型的能力打造,数据-模型之间的飞轮转得很快,在中国这样的方式还没有怎么建立。

澎湃科技:中国哪个机构最有机会做出类ChatGPT的产品?

王昊:从技术实力、数据和计算资源来看,国内百度等大型企业具备开发类ChatGPT的实力。但是在新兴领域,尤其是人工智能领域,没有历史包袱的初创公司也有很大机会。在大量投资及核心算法人员支持之下,这些公司通常拥有更加灵活的战略规划。总的来说,最有机会的一定是能够坚定不移地执行其战略规划,并拥有足够的技术实力和创新能力的团队。

澎湃科技:目前,OpenAI的GPT对中国禁用,英伟达的A100等高端芯片对中国禁售。你认为在接下来的竞争中,国内AI领域应该如何实现有效追赶?

黄民烈:需要系统性的追赶。从底层的GPU芯片、计算架构、基础模型、应用层面,中国是落后的。从人才培养、资金投入、环境建设等方面,我们应该真正聚焦在关键核心问题上,每个方向聚焦打破,才能形成新的突破。特别重要的一点,需要有情怀、远见的企业家、资本来支持。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *