本文独家发布于知乎“AIGC 入局者”栏目。
作者丨王瑞
编辑丨邹蔚
姜迅,中国“AI四小龙”之一的云从科技的数据研究院院长,主导了云从数据研究院在大模型项目的开发工作。
云从科技的核心产品是人机协同操作系统(CWOS),基于数据,整合了视觉、语音、NLP等多个领域大模型。通过开放的人机协同操作系统实现技术平台化,为智慧金融、智慧城市、智慧治理、智慧商业、AIGC等领域提供信息化、数字化和智能化的人工智能服务与行业解决方案。
5月18日,云从科技自研的“从容大模型”正式亮相。发布会现场展示了从容大模型在问答、阅读理解、文学创作以及解题方面的能力。2周后, 5月30日,云从从容大模型宣布正式开启公测。
云从科技内部对于AIGC赛道接下来的布局逻辑是怎样的?铅笔道联合知乎对姜做了专访,以下是对话精华。
铅笔道:您对AIGC未来的发展怎么看?是乐观吗?
姜迅:我对未来的判断是乐观的。关于AIGC,我有一个越来越强烈的感觉,它会超越公司与公司之间,国家与国家的竞争,可能会是人类命运共同的钥匙。手持这把钥匙,我们可能正在跨越人类历史上最重要的一个门槛,进入AGI(通用人工智能)。
铅笔道:如何看待ChatGPT?
姜迅: 我觉得ChatGPT像一个学习了全世界各种语言(计算机语言也是语言的一种)和知识的优等生。因为他(不是它)学习了对同一个客观实在用不同的语言的表述,比如用6岁的小孩能理解的语言描述月亮,中文、英文、法语、日语、甚至冰岛语,不同的语言、不同的文化、不同的价值观对月亮这同一个客观实在的描述的角度都是不同的,而Attention机制,让计算机通过一个更高维向量的方式,从更多不同角度理解了同一个客观实在,通过这种机制,有更抽象,更客观,更全面的概念表达。在它之前,并没有任何一个人拥有这种理解能力,所以ChatGPT对于文字的理解能力,可能超过我们所有人。
看待ChatGPT有很多种不同的观点,有些观点认为ChatGPT是一个大号的鹦鹉,只会复述,没有内生的智慧和知识。我的看法相对乐观一点,以ChatGPT为代表的预训练生成式人工智能,或者说未来的AGI,会是人类有史以来最伟大的发明,没有之一。
我自己使用ChatGPT,一次又一次的,回复的质量超出我内心预设的标准和期望,让我不由自主的内心发出“哇!”这样的感叹,至今我仍然无法清楚的界定ChatGPT的上限在哪里。
我们经常说文无第一,在人工智能的技术路线上有很多种不同的流派,观点不同,在不同的场合有不同适用的观点。但正是ChatGPT给每个人带来极致的用户体验,让越来越多的人感受到这项技术的魅力。工程师们对技术路径快速地达成了共识和一致。
正是这种共识,让无论是商业公司,还是开源社区,都万众一心的朝着一个技术方向去努力。人们在这种共识下迸发出来巨大的力量。
从去年11月份ChatGPT发布开始,这个领域在以日行千里的速度进化,几乎每周都有新的进展出现。
注:注意力机制(Attention Mechanism)源于对人类视觉的研究。在认知科学中,由于信息处理的瓶颈,人类会选择性地关注所有信息的一部分,同时忽略其他可见的信息,上述机制通常被称为注意力机制。2017年google发表的《Attention is all you need》提出了transformer架构,是这场技术变革的起点。
铅笔道:2022年11月,OpenAI率先拿到了钥匙。能说说他们为什么能成功吗?
姜迅:ChatGPT的成功,有很重要的一点是他们对技术哲学的信念和坚持。在技术上,他们坚持单向的decode-only,他们坚信人类说话是一个字一个字往外蹦的,每说出(预测)下一个字,都是基于前面N个字构成的概率场的表达。正是这种对技术哲学的一条路走到黑的坚持,让他们走到了当前的成功。
另一个重要的原因是引入了人类反馈,让机器和人类对齐。OpenAI在2020年就已经完成了GPT3模型的训练,GPT3的模型已经包含了人类历史上大量知识,这些知识在模型中是以只有机器能理解的方式存储,他听不懂人话,他说的话人也听不懂。用不太恰当的例子来说是“人同机讲”,双方在不同的世界中相互对话。
OpenAI从2020年到2022年用了2年多的时间,通过被称之为人类反馈的强化学习(RLHF)的技术,让机器和人的知识对齐,模型可以听懂人话,他说的话人也可以听懂。结果大家也看到了,ChatGPT成为了历史上增长最快的应用。
铅笔道:云从开发了哪些基于大模型的产品?
姜迅:目前开发其中一个产品是“书语”,在我们的发布会上也有展示,是标准化文档的再造。在toB领域,标准化文档可以有很多种形式,比如某个设备的操作手册,某个标准的SOP流程等等,怎么让这些文档更好的被企业员工所掌握,从数据中台升级为知识中台,从数据的查询服务升级到知识服务,是这个产品想要核心解决的问题。
To B场景相对于to C场景,有更高知识密度,是更严肃的场景,面对的客户实际的问题,我们的产品要能真实的解决客户问题带来价值,而不是一本正经胡说八道的AI幻觉。这个产品在我们的发布会也有演示,同时它还具有多模态理解能力,不但文字、图片也有一定的理解能力。
铅笔道:在行业落地方面,我们还会在哪些领域发力?
姜迅:云从内正在把大模型引入到人机协同操作系统(CWOS)之上,希望在to G 等方向发力。例如在智慧城市场景中,AI 能在城运指挥大屏上,快速响应用户的自然语言指令,提供实时人流车况、自然景观分布等情况。大模型还将为智能化的管理和生产创造了更多可能性。
云从已宣布将与中国中检、神州信息、深圳报业、佳都科技、今世缘、游族网络、艾登科技等公司合作推出不同领域的行业大模型。
从云从内部孵化的项目看,大模型在消费级领域也有很好的应用前景。大麦数字人直播平台,能够实现直播间智能搭建、直播预热预料提供等全流程功能。
铅笔道:云从内部的员工怎么看AIGC带来的影响?
姜迅:AIGC对于我们公司带来的是范式的变化,过去每一个任务都需要做单独训练,尽管能看到各行各业对于AI技术旺盛的需求,有时候会有一些非常细碎的场景,比如检验螺丝钉有没有裂纹等等,由于这些场景对于单个用户在前期阶段很难覆蓋研发成本,这导致这些场景想要建立正向的商业循环是比较困难的。
预训练大模型其实很好地解决了这个问题,预训练模型在大规模无标签数据上完成一次训练后,可以在多个具体任务上做指令微调。这使得预训练模型,能够在不同领域和任务中实现迅速的迁移和泛化,减少了在小样本数据下过拟合的风险。我们确定了基础模型以后,只需要在这个基础上加入新的知识,原有投入训练成本得到了保护,对于整个社会的算力资源也是一种保护。这种范式的变化,让我们可以更好地用同样的、甚至更低的成本服务更多的用户。
开发效率的提升,是显而易见的。比如原来技术人员看到数据发生了变化,由于沟通链条比较长,从看见到数据分析师再去分析,最后反馈到产品经理,业务负责人,时间周期都很长,也很复杂。有了大模型之后,整体的工作效率和to B的交付质量都提升很多,缩短了交付和沟通的链条。
除此之外,还有一个非常重要的影响是,AIGC通过让业务人员直接操作数据,和系统、数据的距离更近了。还是上面数据分析的例子,销售主管想要分析最近的销售趋势,从汇总的数字上看,销售的数据没有明显的波动和变化。技术人员在开发功能的时候,可能看到了在A区域有明显的上涨,在B区域有明显的下跌,技术人员如果没有业务敏感性的话,这些异常的数据波动被当做数据噪音处理掉了,最终的报表体现为没有波动;这种距离的拉近,不仅仅是节省了几个开发人员,还有可能带来业务的数据洞察,从而带来巨大的商业价值。
云从的使命是“提升人类潜能”,AIGC非常好践行了我们公司的价值观。举例来说,每个人都追求美,都想按照自己的想法画出美轮美奂的照片,但是奈何画画技术只能画一些简笔画。我们在文博会上发布了一款产品,左侧是用手画的简笔画,右侧就可以让AI脑补出来图画的细节,颜色,成为一张更好的画作。
云从和深圳报业集团联合成立的AICG联合实验室,在第十九届文博会亮相,并在央视被报道。在AI绘画与AI阅读体验区里,普通人只要在屏幕上随心所欲画上两笔,短短几秒就能通过你的几笔草图生成一幅栩栩如生的画。
云从和深圳报业集团联合成立的AICG联合实验室,在第十九届文博会亮相,并在央视被报道。在AI绘画与AI阅读体验区里,普通人只要在屏幕上随心所欲画上两笔,短短几秒就能通过你的几笔草图生成一幅栩栩如生的画。
铅笔道:您过去经历了哪些公司?
姜迅:从阿里的B2B开始,后来在盛大,再后来在平安;先后搭建了阿里巴巴B2B的数据中台,盛大集团数据中台,平安好医生的数据中台。经历了完整的互联网全过程。
2018的12月,云从科技的创始人周曦(我们内部都亲切的称呼为周老师)找到我,问我要不要加入,让这些年积累的数据经验在人工智能的领域发挥作用。
我做了这么多年大数据,可以再次回到技术的前沿,让数据成为人工智能发展过程中的燃料,也很兴奋。在云从的这几年,在实际工作中越来越能感受到数据对人工智能发展的重要性。现在,数据已成为重要的生产要素,写进了《国家“十四五”规划纲要》。
铅笔道:工作这么多年,有什么经验想要和年轻人分享?
姜迅:最大经验就是做自己擅长的事。只要你留在牌桌,奇迹就一定会发生。“Be the last man standing.”
铅笔道:最后聊聊对数字化的世界在你心中的样子,有哪些特点?
姜迅:不管愿意还是不愿意,喜欢还是不喜欢,我们处正在现实物理世界与比特科技构建的数字世界的十字路口,更重要的是,发展的速度是以指数级数的加速度在进入数字世界。既然变化不可避免,我们想要顺应世界的变化,先去了解他,然后去拥抱他。让AIGC成为你能力圈的朋友。
数字化的世界,我总结了以下几个特点:
资源可复制
首先,数字化的世界在人类历史上第一次的,某个生产资料不会因为被使用而消耗,反而会越用越多。也就是说,我们可以对世界复制。这个变化从长期来看,会带来竞争策略的变化,从原来的“一手交钱一手交货”的“你有了我就没有”的零合模式变成会有更多的合作的策略出现。
但这也是一把双刃剑,因为数据复制的成本实在太低,数据会像癌细胞一样,把资源有限的存储资源全部消耗掉。通过大语言模型对数据完成有效的治理,会是一项长期而有意义的事,这些高质量的数据,又会反过来提升模型的性能。
空间可触达
在数字世界中,所有的数据对象被光缆连接起来,他们之间的传播速度是光速,这种在空间上的变化,在过去的十多年的互联网发展过程中,体现的淋漓尽致,世界成为一个地球村。
如果说数据是一种资产,那么作为资产有个重要的指标是资产的周转率。数据传送的速度和资产周转率是成正比的,传播的速度越快,资产周转的速度越快。在数字化之前,信息的传播是不畅的,传播不畅导致了信息的生产不足。在匮乏的信息生产背景下。这是一个负循环,而更高速的信息和数据传播,让数据数据资产的高速周转提升成为可能,同样一份数据,周转的次数越多,价值就越大。
时间可倒流
我们生活的四维空间中,在空间维度之外的第四个维度是时间维度。和空间维度的长、宽、高这个三个维度不同,在空间的三个维度中,运动的方向是可逆的,而时间作为一个特殊的维度,只能是单向前行的。时光倒流只存在于魔法的幻想中。
我们在对世界完成复制的同时,还会通过在附加上被称之“时间戳”的东西来记录这个对象被复制时的时间。正是这个看上去不起眼的时间戳,可以通过一个被称之为“快照”(snapshot)的技术,让我们在数字化的世界中,部分或者整体的做时间上的回溯,可以回到任意一个时间点上。我们可以确定性的往前追溯,然后站在任何一个过去的时间点上,顺着时间之河开一个平行宇宙,改变一些参数,往前预测。
能力可加载
在人工智能算法的助力下,比如“翻译”、“下围棋”等需要人类花费大量时间学习的能力,都会“封装”为可加载的模块。我们的大脑的能力边界会获得极大的拓张。
在过去使用搜索引擎,需要非常关键字才可以检索到知识。而在数字化的世界中,学习和记忆的方法都会发生改变,谁的索引组织能力越好,提问的能力越强,对问题的描述越细腻,收敛性越强,区分度越高,知识的能力也就越强。背住答案只能解决一个问题,能独立思考,能提出问题会更重要。
铅笔道:那未来整个社会会有哪些变化?
姜迅:数字技术创造了无数的机会,让人得以利用自己独一无二的分散化知识,造福整个经济。这样一来,在技术的促动下,形成“微型跨国企业”的机会越来越多。这些企业,只有十来名员工,却利用世界各地的供应商和合作伙伴网络,向全球客户销售产品和服务。总而言之,人工智能革命与工业革命的不同之处在于,人工智能不会停下来,而且会越来越智能,这将是世界从未经历过的变革。我们正在经历和见证一场进化,在未来,知识的学习方式、公司的组织结构、甚至经济规律、社会规律都可能会发生巨大的变化。最后还是那句话,我们想要顺应世界的变化,就去拥抱他吧!
【版权声明】本作品的著作权等知识产权归铅笔道所有,知乎享有本作品信息网络传播权,任何第三方未经授权,不得转载。