对话云从科技姜迅：大模型可大幅降低成本，数据是核心丨AIGC 入局者

xiaolong www.icpchaxun.com (4) 5小时前

本文独家发布于知乎“AIGC 入局者”栏目。

作者丨王瑞

编辑丨邹蔚

姜迅，中国“AI四小龙”之一的云从科技的数据研究院院长，主导了云从数据研究院在大模型项目的开发工作。

云从科技的核心产品是人机协同操作系统（CWOS），基于数据，整合了视觉、语音、NLP等多个领域大模型。通过开放的人机协同操作系统实现技术平台化，为智慧金融、智慧城市、智慧治理、智慧商业、AIGC等领域提供信息化、数字化和智能化的人工智能服务与行业解决方案。

5月18日，云从科技自研的“从容大模型”正式亮相。发布会现场展示了从容大模型在问答、阅读理解、文学创作以及解题方面的能力。2周后， 5月30日，云从从容大模型宣布正式开启公测。

云从科技内部对于AIGC赛道接下来的布局逻辑是怎样的？铅笔道联合知乎对姜做了专访，以下是对话精华。

ChatGPT带来的变化有哪些？

铅笔道：您对AIGC未来的发展怎么看？是乐观吗？

姜迅：我对未来的判断是乐观的。关于AIGC，我有一个越来越强烈的感觉，它会超越公司与公司之间，国家与国家的竞争，可能会是人类命运共同的钥匙。手持这把钥匙，我们可能正在跨越人类历史上最重要的一个门槛，进入AGI（通用人工智能）。

铅笔道：如何看待ChatGPT？

姜迅：我觉得ChatGPT像一个学习了全世界各种语言(计算机语言也是语言的一种)和知识的优等生。因为他（不是它）学习了对同一个客观实在用不同的语言的表述，比如用6岁的小孩能理解的语言描述月亮，中文、英文、法语、日语、甚至冰岛语，不同的语言、不同的文化、不同的价值观对月亮这同一个客观实在的描述的角度都是不同的，而Attention机制，让计算机通过一个更高维向量的方式，从更多不同角度理解了同一个客观实在，通过这种机制，有更抽象，更客观，更全面的概念表达。在它之前，并没有任何一个人拥有这种理解能力，所以ChatGPT对于文字的理解能力，可能超过我们所有人。

看待ChatGPT有很多种不同的观点，有些观点认为ChatGPT是一个大号的鹦鹉，只会复述，没有内生的智慧和知识。我的看法相对乐观一点，以ChatGPT为代表的预训练生成式人工智能，或者说未来的AGI，会是人类有史以来最伟大的发明，没有之一。

我自己使用ChatGPT，一次又一次的，回复的质量超出我内心预设的标准和期望，让我不由自主的内心发出“哇！”这样的感叹，至今我仍然无法清楚的界定ChatGPT的上限在哪里。

我们经常说文无第一，在人工智能的技术路线上有很多种不同的流派，观点不同，在不同的场合有不同适用的观点。但正是ChatGPT给每个人带来极致的用户体验，让越来越多的人感受到这项技术的魅力。工程师们对技术路径快速地达成了共识和一致。

正是这种共识，让无论是商业公司，还是开源社区，都万众一心的朝着一个技术方向去努力。人们在这种共识下迸发出来巨大的力量。

从去年11月份ChatGPT发布开始，这个领域在以日行千里的速度进化，几乎每周都有新的进展出现。

注：注意力机制（Attention Mechanism）源于对人类视觉的研究。在认知科学中，由于信息处理的瓶颈，人类会选择性地关注所有信息的一部分，同时忽略其他可见的信息，上述机制通常被称为注意力机制。2017年google发表的《Attention is all you need》提出了transformer架构，是这场技术变革的起点。

铅笔道：2022年11月，OpenAI率先拿到了钥匙。能说说他们为什么能成功吗？

姜迅：ChatGPT的成功，有很重要的一点是他们对技术哲学的信念和坚持。在技术上，他们坚持单向的decode-only，他们坚信人类说话是一个字一个字往外蹦的，每说出（预测）下一个字，都是基于前面N个字构成的概率场的表达。正是这种对技术哲学的一条路走到黑的坚持，让他们走到了当前的成功。

另一个重要的原因是引入了人类反馈，让机器和人类对齐。OpenAI在2020年就已经完成了GPT3模型的训练，GPT3的模型已经包含了人类历史上大量知识，这些知识在模型中是以只有机器能理解的方式存储，他听不懂人话，他说的话人也听不懂。用不太恰当的例子来说是“人同机讲”，双方在不同的世界中相互对话。

OpenAI从2020年到2022年用了2年多的时间，通过被称之为人类反馈的强化学习(RLHF)的技术，让机器和人的知识对齐，模型可以听懂人话，他说的话人也可以听懂。结果大家也看到了，ChatGPT成为了历史上增长最快的应用。

大模型是提升产能、节约成本的利器

铅笔道：云从开发了哪些基于大模型的产品？

姜迅：目前开发其中一个产品是“书语”，在我们的发布会上也有展示，是标准化文档的再造。在toB领域，标准化文档可以有很多种形式，比如某个设备的操作手册，某个标准的SOP流程等等，怎么让这些文档更好的被企业员工所掌握，从数据中台升级为知识中台，从数据的查询服务升级到知识服务，是这个产品想要核心解决的问题。

To B场景相对于to C场景，有更高知识密度，是更严肃的场景，面对的客户实际的问题，我们的产品要能真实的解决客户问题带来价值，而不是一本正经胡说八道的AI幻觉。这个产品在我们的发布会也有演示，同时它还具有多模态理解能力，不但文字、图片也有一定的理解能力。

铅笔道：在行业落地方面，我们还会在哪些领域发力？

姜迅：云从内正在把大模型引入到人机协同操作系统（CWOS）之上，希望在to G 等方向发力。例如在智慧城市场景中，AI 能在城运指挥大屏上，快速响应用户的自然语言指令，提供实时人流车况、自然景观分布等情况。大模型还将为智能化的管理和生产创造了更多可能性。

云从已宣布将与中国中检、神州信息、深圳报业、佳都科技、今世缘、游族网络、艾登科技等公司合作推出不同领域的行业大模型。

从云从内部孵化的项目看，大模型在消费级领域也有很好的应用前景。大麦数字人直播平台，能够实现直播间智能搭建、直播预热预料提供等全流程功能。

铅笔道：云从内部的员工怎么看AIGC带来的影响？

姜迅：AIGC对于我们公司带来的是范式的变化，过去每一个任务都需要做单独训练，尽管能看到各行各业对于AI技术旺盛的需求，有时候会有一些非常细碎的场景，比如检验螺丝钉有没有裂纹等等，由于这些场景对于单个用户在前期阶段很难覆蓋研发成本，这导致这些场景想要建立正向的商业循环是比较困难的。

预训练大模型其实很好地解决了这个问题，预训练模型在大规模无标签数据上完成一次训练后，可以在多个具体任务上做指令微调。这使得预训练模型，能够在不同领域和任务中实现迅速的迁移和泛化，减少了在小样本数据下过拟合的风险。我们确定了基础模型以后，只需要在这个基础上加入新的知识，原有投入训练成本得到了保护，对于整个社会的算力资源也是一种保护。这种范式的变化，让我们可以更好地用同样的、甚至更低的成本服务更多的用户。

开发效率的提升，是显而易见的。比如原来技术人员看到数据发生了变化，由于沟通链条比较长，从看见到数据分析师再去分析，最后反馈到产品经理，业务负责人，时间周期都很长，也很复杂。有了大模型之后，整体的工作效率和to B的交付质量都提升很多，缩短了交付和沟通的链条。

除此之外，还有一个非常重要的影响是，AIGC通过让业务人员直接操作数据，和系统、数据的距离更近了。还是上面数据分析的例子，销售主管想要分析最近的销售趋势，从汇总的数字上看，销售的数据没有明显的波动和变化。技术人员在开发功能的时候，可能看到了在A区域有明显的上涨，在B区域有明显的下跌，技术人员如果没有业务敏感性的话，这些异常的数据波动被当做数据噪音处理掉了，最终的报表体现为没有波动；这种距离的拉近，不仅仅是节省了几个开发人员，还有可能带来业务的数据洞察，从而带来巨大的商业价值。

云从的使命是“提升人类潜能”，AIGC非常好践行了我们公司的价值观。举例来说，每个人都追求美，都想按照自己的想法画出美轮美奂的照片，但是奈何画画技术只能画一些简笔画。我们在文博会上发布了一款产品，左侧是用手画的简笔画，右侧就可以让AI脑补出来图画的细节，颜色，成为一张更好的画作。

云从和深圳报业集团联合成立的AICG联合实验室，在第十九届文博会亮相，并在央视被报道。在AI绘画与AI阅读体验区里，普通人只要在屏幕上随心所欲画上两笔，短短几秒就能通过你的几笔草图生成一幅栩栩如生的画。

铅笔道：您过去经历了哪些公司？

姜迅：从阿里的B2B开始，后来在盛大，再后来在平安；先后搭建了阿里巴巴B2B的数据中台，盛大集团数据中台，平安好医生的数据中台。经历了完整的互联网全过程。

2018的12月，云从科技的创始人周曦（我们内部都亲切的称呼为周老师）找到我，问我要不要加入，让这些年积累的数据经验在人工智能的领域发挥作用。

我做了这么多年大数据，可以再次回到技术的前沿，让数据成为人工智能发展过程中的燃料，也很兴奋。在云从的这几年，在实际工作中越来越能感受到数据对人工智能发展的重要性。现在，数据已成为重要的生产要素，写进了《国家“十四五”规划纲要》。

铅笔道：工作这么多年，有什么经验想要和年轻人分享？

姜迅：最大经验就是做自己擅长的事。只要你留在牌桌，奇迹就一定会发生。“Be the last man standing.”

数据在AIGC时代会爆发魔力

铅笔道：最后聊聊对数字化的世界在你心中的样子，有哪些特点？

姜迅：不管愿意还是不愿意，喜欢还是不喜欢，我们处正在现实物理世界与比特科技构建的数字世界的十字路口，更重要的是，发展的速度是以指数级数的加速度在进入数字世界。既然变化不可避免，我们想要顺应世界的变化，先去了解他，然后去拥抱他。让AIGC成为你能力圈的朋友。

数字化的世界，我总结了以下几个特点：

资源可复制

首先，数字化的世界在人类历史上第一次的，某个生产资料不会因为被使用而消耗，反而会越用越多。也就是说，我们可以对世界复制。这个变化从长期来看，会带来竞争策略的变化，从原来的“一手交钱一手交货”的“你有了我就没有”的零合模式变成会有更多的合作的策略出现。

但这也是一把双刃剑，因为数据复制的成本实在太低，数据会像癌细胞一样，把资源有限的存储资源全部消耗掉。通过大语言模型对数据完成有效的治理，会是一项长期而有意义的事，这些高质量的数据，又会反过来提升模型的性能。

空间可触达

在数字世界中，所有的数据对象被光缆连接起来，他们之间的传播速度是光速，这种在空间上的变化，在过去的十多年的互联网发展过程中，体现的淋漓尽致，世界成为一个地球村。

如果说数据是一种资产，那么作为资产有个重要的指标是资产的周转率。数据传送的速度和资产周转率是成正比的，传播的速度越快，资产周转的速度越快。在数字化之前，信息的传播是不畅的，传播不畅导致了信息的生产不足。在匮乏的信息生产背景下。这是一个负循环，而更高速的信息和数据传播，让数据数据资产的高速周转提升成为可能，同样一份数据，周转的次数越多，价值就越大。

时间可倒流

我们生活的四维空间中，在空间维度之外的第四个维度是时间维度。和空间维度的长、宽、高这个三个维度不同，在空间的三个维度中，运动的方向是可逆的，而时间作为一个特殊的维度，只能是单向前行的。时光倒流只存在于魔法的幻想中。

我们在对世界完成复制的同时，还会通过在附加上被称之“时间戳”的东西来记录这个对象被复制时的时间。正是这个看上去不起眼的时间戳，可以通过一个被称之为“快照”（snapshot）的技术，让我们在数字化的世界中，部分或者整体的做时间上的回溯，可以回到任意一个时间点上。我们可以确定性的往前追溯，然后站在任何一个过去的时间点上，顺着时间之河开一个平行宇宙，改变一些参数，往前预测。

能力可加载

在人工智能算法的助力下，比如“翻译”、“下围棋”等需要人类花费大量时间学习的能力，都会“封装”为可加载的模块。我们的大脑的能力边界会获得极大的拓张。

在过去使用搜索引擎，需要非常关键字才可以检索到知识。而在数字化的世界中，学习和记忆的方法都会发生改变，谁的索引组织能力越好，提问的能力越强，对问题的描述越细腻，收敛性越强，区分度越高，知识的能力也就越强。背住答案只能解决一个问题，能独立思考，能提出问题会更重要。

铅笔道：那未来整个社会会有哪些变化？

姜迅：数字技术创造了无数的机会，让人得以利用自己独一无二的分散化知识，造福整个经济。这样一来，在技术的促动下，形成“微型跨国企业”的机会越来越多。这些企业，只有十来名员工，却利用世界各地的供应商和合作伙伴网络，向全球客户销售产品和服务。总而言之，人工智能革命与工业革命的不同之处在于，人工智能不会停下来，而且会越来越智能，这将是世界从未经历过的变革。我们正在经历和见证一场进化，在未来，知识的学习方式、公司的组织结构、甚至经济规律、社会规律都可能会发生巨大的变化。最后还是那句话，我们想要顺应世界的变化，就去拥抱他吧！

骨盆的解剖及評估

2021年印度尼西亚一级行政区人均GDP，最高接近2万美元

发表回复取消回复

请先登录账户再评论哦

对话云从科技姜迅：大模型可大幅降低成本，数据是核心丨AIGC 入局者

ChatGPT带来的变化有哪些？

大模型是提升产能、节约成本的利器

数据在AIGC时代会爆发魔力

发表回复取消回复

相关推荐

静压、动压、全压、余压，在装中央新风系统之前一定要搞清的概念

書籍的本質到底是什麼？我們為什麼要讀書?

防雾眼镜布是智商税吗？哪种防雾眼镜布是真的有用？

如何與命運抗爭？

那些恐龍時代的巨人

对话云从科技姜迅：大模型可大幅降低成本，数据是核心丨AIGC 入局者

ChatGPT带来的变化有哪些？

大模型是提升产能、节约成本的利器

数据在AIGC时代会爆发魔力

发表回复 取消回复

相关推荐

静压、动压、全压、余压，在装中央新风系统之前一定要搞清的概念

書籍的本質到底是什麼？我們為什麼要讀書?

防雾眼镜布是智商税吗？哪种防雾眼镜布是真的有用？

如何與命運抗爭？

那些恐龍時代的巨人

发表回复取消回复