涌现36人

发布者:上下五千年 2024-9-18 19:17

欢迎关注“智能涌现”

文|周鑫雨

编辑|苏建勋

2023年以来,默默无闻已久的百度文库就像一匹“黑马”,突然在AI角斗场上杀了出来。

根据“AI产品榜”,百度文库AI功能的访问量,在2024年4、5、6月蝉联国内总榜第一。百度副总裁、文库事业部负责人王颖告诉《智能涌现》,百度文库的商业化已经跑通了。百度最新2024年Q2财报显示,二季度,百度文库的订阅收入同比增长超过15%。

这份成绩单,让这款有着15年历史的产品,在百度内部成了焦点。百度创始人、董事长兼首席执行官李彦宏多次强调,百度文库是“AI重构最彻底”的产品之一。

重要性的提升,还体现在架构的战略变动上。《智能涌现》曾独家报道,2024年春节后,曾隶属于互娱和垂类平台的百度文库升级为独立的BU(事业部)。

然而,2022年接手百度文库,对2021年加盟百度的王颖而言,更像是临危受命——毕竟这款具有15年历史的产品,有着既定的工作惯性和市场认知。

让她感到幸运的是,大模型的出现,给了百度文库二次逢春的机会。

要用AI重构一款老产品,这位雷厉风行的资深产品人,向《智能涌现》搬出了她的改革“三板斧”:改工作流,重新组织团队;找刚需场景;与文心大模型团队协同满足产品的需求

在她看来,原有“产品提需求,研发满足需求”的工作流,不完全适用于AI创新业务:“每个人都要深入了解业务,目标要一致。在产品需求讨论阶段,产品策略就要选模型,技术也要决定工程架构怎么实施。”这就要求,产品和策略要懂大模型技术,研发也要理解用户需求。

在全行业都在卷AI应用的当下,王颖觉得,一个能够让用户立刻给出“好”或“不好”评价的刚需场景,是百度文库的切入点。

很快,她选中了智能PPT,原因是AI对PPT制作的提效明显,并且相较于文档生成,用户对PPT的好坏有直观的评价:“内容丰富、切题、好看”。

智能PPT功能推出一年,用户和市场反馈,验证了这一决策的正确性。根据月狐研究院数据,百度文库智能PPT市场份额已达八成。

智能PPT行业市场用户规模份额情况(2024.06)

以及,在业务体系庞大的百度,团队也要精细地衡量技术的效率和成本。在2023年初,文库就开始尝试使用效率更高、成本更低的MoE(混合专家模型)架构。

2023年7月,王颖对组织进行了大刀阔斧的调整;8月,百度文库宣布重构为一站式AI内容获取和创作平台,智能PPT、智能文档等多项AI功能全面开放。同年9月,百度文库就尝到了AI初步变现的甜头:当月总会员主动开通付费率年同比增速超过50%。

这一套“文库经验”,也开始持续为百度文库孵化出更多的AI功能和产品:2024年4月,百度文库推出了智能画本、智能漫画等跨模态AI功能,5月又上线了网页端产品“橙篇”,主打专业检索问答、超长图文理解和生成、深度编辑整理以及跨模态自由创作,还支持10万字长文生成能力。8月,“橙篇”又推出了APP端。

“我们每个月甚至每周都有重大的功能迭代。”王颖对《智能涌现》如此形容文库的速度。

百度文库AI产品矩阵

带着文库在AI风口中狂奔,王颖感觉百度文库重构这段时间里,周一到周五都不是真实的世界,想的全都是未来的事。只有到了周末,她才能短暂回到真实,回到当下。

当结束周末,回归工作,如何保持持续增长就成了王颖的多巴胺。“原来我干的都是追赶别人的业务。追赶太难了,你一旦落后,再去追赶就很辛苦。”王颖表示,“现在我终于有机会让别人追赶我,这是我职业生涯没有做过的事情。”

以下是《智能涌现》和百度副总裁、文库事业部负责人王颖的对话。内容略经编辑:

团队的迭代,就跟训练大模型一样

智能涌现:文库这个产品,已经存在很多年了。你来做重构的时候,会觉得那么多年的历史,是资源还是包袱?

王颖:都有,但我觉得要做的是,如何更好地利用资源,将资源转化为优势。AI时代,如果重构的足够好,也容易产生口碑效应。

智能涌现:从你接触一线业务的体感来看,AI技术带来的剧烈变化具体体现在哪里?

王颖:在最开始的时候,是技术突破带来的想象。因为原来AI技术的突破是从感知到认知,但在创作上一直做不好。所以很长时间里,用户的需求是被压制的。(ChatGPT)出来之后发现创作的需求原来可以这样满足。

智能涌现:你觉得文库之前最被压制的需求是什么?

王颖:第一个,之前文库更多的是提供内容和资源,没有复杂的编辑器,无论是前期交互,还是后链路实现都非常复杂,如果要做就得从头开始。

第二个,很多时候你知道用户上下游是有需求的,但是基于那个时候的技术和能力储备也不具备做改进的条件。

智能涌现:这种状态持续了多长时间?

王颖:2022年,我接手文库的时候,也顾不上什么别的。工欲善其事,必先利其器,去努力做好基建,包括基础的体验、内容的分级等等,花了很长时间把内容生态重新建立。

智能涌现:文库之前十多年的工作方式,有要改的地方吗?

王颖:从组织上就要改。之前产品负责提需求,研发负责交互。交付的目标是上线,这是一套很成熟的产品流程,但放在做全新的事情上是不OK的,每个人都需要去深入了解别人的领域,目标要变得一致。以及目标不是为了上线,而是为了满足用户的需求。

智能涌现:这套流程是怎么改变的?意识层面吗?

王颖:从Day1开始,我就从第一个环节全程参与,比如做智能PPT,从产品调研到产品交互,我都会拉着UI和产品一起把流程推下去。

之后在写产品文档阶段,我要求研发和策略一起进入,不是等产品文档给了他们才开始做,而是在产品需求讨论阶段,大家就要深度参与,产品策略就要选模型,技术也要决定工程架构怎么实施。

在这个过程中,我们有三轮效果测试和反馈。第一轮测试找了种子用户,第二轮邀请了没有用过文库的人,第三轮找了一些对国内外大模型很了解的极客。三轮测试做好了,我们才能上线。

智能涌现:VP一起来做测试,一线员工的压力会不会挺大的?

王颖:会的,因为新的东西,还没有建立标准,其实团队的迭代就跟训练大模型一样,后面文库AI功能上线速度非常快,就是因为整个团队有了一套好的标准。

大模型最本质解决的就是创作问题

智能涌现:我们把时间线往前推到2023年3月16日,文心一言发布。那时候百度各个业务都在寻求和文心大模型做结合。当时百度互娱垂类这么多产品,你需不需要做一个选择?决定哪个先和AI结合。

王颖:需要的,我们称之为“雁行式行为”,第一行有一个排头兵,后面跟着形成一个“人”字型。业务怎么排先后,就要根据我们对用户需求理解的深刻程度,还有业务跟大模型结合的紧密程度。

我们先把精力都放在排头兵上,必须在一个业务上先形成方法论,再将成功经验复制给后面的业务。在我这里,排头兵是文库。

智能涌现:当时文库在发生什么?你们的思考是什么?

王颖:我们从2022年底,ChatGPT刚发布那会儿就开始关注这个事儿了。2023年2月春节回来,我就跟团队开始看我们应该做什么、怎么做。那个时候文心一言还没推出,我们知道早晚都要做,不如提前把产品大概的想法做成demo看看。

智能涌现:当时的逻辑是什么?

王颖:我们认为,百度文库可以成为内容创作的起点。

智能涌现:为什么更关注创作?

王颖:大模型整个从辨别式到生成式,核心最本质解决的就是创作的问题

创作这件事本身跟我们之间对百度文库的思考很像。你会发现,用户来找内容也好,来理解内容也好,最根本的需求是创作需求。因为我要写一个东西,得先知道一些素材,然后再变成我自己的东西。

就好比我最根本的需求是解决吃饭问题,买米只是其中一个环节。

智能涌现:你觉得现在技术的进步,能够满足文库的产品需求吗?

王颖:说实话,我们对需求的理解以及想要做的事,在反向推动大模型来解决问题,比如长文本的理解和生成等等。

智能涌现:你们怎么和文心大模型团队合作?

王颖:我们产品、技术都有周会,更多是做信息同步。大模型是设备,百度文库是工厂,你没道理说自己工厂的人都不会用设备,或者不知道怎么改造和调试设备。我们需要变成一个生产线,供应链和生产线都得我们自己建。

智能涌现:对技术的理解,反映到产品设计是什么?

王颖:大模型跟原来有个很不一样的地方,它能够进行多轮对话,整个交互方式就变了。但是多轮对话有几个问题,第一,对话越多,成本就越高,第二,对话越多,越不一定能解决实际问题。

我们做产品的时候认为,对话不是为了时长和轮次,而是要解决问题。我们要考虑在多少轮对话范围内解决问题是合理的,既能减少模型的调用,又能提升对话效率。

智能涌现:结合AI以来,文库的数据有什么变化?

王颖:我们的显著变化是用户年轻化了,40%都是大学生。

智能涌现:现在最受欢迎的产品功能是什么?

王颖:举个例子,我们推出了智能PPT,一句话就能生成PPT,而且能够实现直接可用。这个超出了很多用户的心理预期。

我们在2023年4月份,就做完了文本续写、扩写、润色的功能,但没有推。到了7月我们开始专攻PPT。过了一个半月时间,到8月31日,我们把产品先给市场同学看,因为我们很久没有推过这样的产品,也让很多用户试用,大家都表示很有信心。

智能涌现:为什么先推了智能PPT?

王颖:因为文档续写、扩写,大家都能做,但是用户很难分辨好不好。

做智能PPT有几个好处。第一,原来做PPT的工程量很大,从找素材、模板,到设计版式、配图、逻辑,用户天生觉得这个是难的,百度文库能做出来,用户就觉得很强。

第二,PPT的配图是否精美、是否与主题内容匹配、内容是否准确,用户一眼就能看出好坏。我们没办法给每个用户派一个产品经理,去讲解产品有多好,我必须让他们心里能判断出来

智能涌现:百度文库核心解决的是用户创作的需求,这是团队第一天就拉齐的共识吗?

王颖:对。产品经理很大的问题,就是把自己的需求认为是用户的需求。我们当时有了假设后,做了用户调研,结果刚好和假设是一致的。

智能涌现:之前你想过如何做好百度文库这件事吗?

王颖:之前很多时候我干的都是追赶的业务。追赶太难了,你一旦落后,再去追赶就很辛苦。现在我终于有机会让别人追赶我,这是我职业生涯没有做过的事情。

健康的扩张才是目的

智能涌现:用AI重构文库,前期你的思考逻辑是什么?

王颖:事实上,我们改变了文库的定位,从文档检索平台,变成了一站式AI内容获取和创作的平台。所以回到本质,第一,要做一套大模型的编辑器;第二,要对大模型做很多了解。

之前我跟一个朋友聊天,他说那些发现大模型能干什么,他就干什么的人,都“挂了”;但发现大模型不能干什么的人,都活下来了。

所以我们从Day1开始就了解大模型的逻辑,再看它的特点和产生的问题。同时,我们通过MoE去解决大模型可能产生的问题,让大模型能力变得完整。

智能涌现:所以你们更关注AI不能做什么。

王颖:就关注三点。第一,现在的大模型跟以前的模型有什么不一样;

第二,发生根本性的变化后,大模型在做一个完整的任务时,可能会出现怎样的问题,我们通过什么样的模型组合去解决;

第三,关注效率和效能。首先,它能力要强,得足够好地满足用户需求,其次要有效率,成本要低。所以,AI Native(AI原生)一开始就不只是用一个模型的尺寸,而是要采用多模型的结构。

智能涌现:你们做MoE的时间在行业里相当早。

王颖:对。这跟你对大模型的了解程度有关,你会发现大模型不经济,不会因为你调用次数多就便宜。这个时候就要考虑怎么解决成本问题。

智能涌现:文库现在的商业化成绩是什么?

王颖:我们现在是全国MAU最大的AI产品。

第一,我们的商业化路径早就已经跑通了,AI功能的推出,也显著提升了用户付费率和留存率。

第二,我们在商业化上也不会采取激进策略,我们的AI功能都是做好了才会推,而且大多数功能都是免费和限免的。

第三,我们在提升能力的同时,也在大幅降低成本。

智能涌现:一言以蔽之,商业模式的健康度最重要。

王颖:我们不只看单用户有多少利润,而是要保证用户留存率,如何做到持续获客。同时我们通过能力、权益建设,让用户持续留下来,体验我们更多的服务,形成商业上的正循环,而不是一直在输血。

挣钱不是目的,在首先满足用户需求上,实现健康的扩张,才是我们的目的

智能涌现:文库的商业模式之后会改变吗?

王颖:会,我们后续会有很多的玩法。

技术的领先,是为产品争取时间

智能涌现:谈点现实的,文库有现在的成绩,是因为工作方法的改变起到非常关键的作用吗?

王颖:对,一个是工作方法起到了关键作用,第二个是团队对于工作方法的理解和践行也很快。

智能涌现:这个工作方法能保持住吗?

王颖:现在我们一个月就能做一个新产品。

智能涌现:把AI这件事拆分成技术、产品、商业化实践,你现在对哪部分关注最多?

王颖:我觉得产品和技术吧。因为首先你的产品能不能找到刚需需求,能不能被用户买单,这个很重要,要不然就变成了炫技,用户也不用,会浪费时间和资源。

第二点,在产品需求下,我们的技术有没有领先性,这个很重要。技术的领先性是为我们争取时间的,因为技术的领先是有保鲜期的,比如就3-6个月,这期间能不能迅速让用户形成心理认知、产品认知,与用户形成稳定的联系,或者建立产品力的门槛。

这两点是比较重要的,也是循环作用的。

智能涌现:你怎么验证产品力的好坏?

王颖:看用户数据、用户增长趋势、用户留存趋势、用户使用时长、用户付费情况。

智能涌现:你会觉得你和初创公司的产品在竞争吗?

王颖:我觉得没有必要谈竞争。我觉得更长尾的需求,更需要合作。像最硬核的、对于用户留存和用户体验产生最直接影响的部分,我们还是会自己做,这样对质量才可控,才能迭代得快。以后,我们也会选择优质合作伙伴,解决用户更长尾的需求。

智能涌现:外界技术的迭代、产品的发布,比如OpenAI的动作,会影响你吗?

王颖:它们大多数解决的是环节效能的问题,我们从第一天开始就没有做环节的东西,最后的目标就是做产品的交付。至于怎么交付,我想办法用更好的技术,想办法用多种模型的组合交付。

用户对产品背后的技术是没有感知的,所以我们就是要端到端的解决用户的需求,给他们直接可用的成品。

智能涌现:你现在对百度文库的期待是什么?

王颖:你可以认为是百度文库就是创作领域的OpenAI。在任何时间、地点,不管是PC还是APP,用户给到百度文库的任何材料,可能是一句话、随手拍的图片、也可能是一篇或者多篇文档、链接,甚至是短视频,百度文库都能加工成你想要的任何形式,你想要的地方。

百度文库智能体平台

欢迎交流!

大家都在看