看两个现象:
上周,我和一个做电商朋友聊天,他正研究干果品类市场趋势。聊着聊着,他说,现在 AI 搜索不太好用。我问为什么,他说:
" 我想知道上个月哪种干果卖得火,抖音上真实用户评论怎么样,以及未来的销售趋势会如何?但是,AI 搜索后,得到一堆关于整个行业的研究总结,这些信息既不够深入,也不够精准,帮助不大。"
当时我没太在意。结果,昨天这种情况又出现了。
在微信上,聊到工作流,一个在医疗行业做培训的朋友说,他经常要查阅很多学术报告;报告大多从知网之类的平台下载,然后用豆包 AI 帮他做本地化总结和提炼关键内容。
同时,也会用夸克、知乎直答垂直 AI 搜索工具。但问题是,工具能找到一些博主写得不错的问答,当想更深入地了解问答背后知识时,就卡壳了。
其实,我更想要其他维度的内容,类似于案例分析,数据解读之类的。但 AI 搜索只能给出总结性的结论,有些失望。
所以,这两次无意识聊天让我感受到,要让 AI 搜索真正满足用户的需求,要找到具体场景。
一、什么是具体场景?怎么理解 AI 使用场景呢?
得从用户任务下的行为方式看。我们每天从早到晚活动,都围绕完成特定任务展开,用户使用产品、服务时,根本目的也是为了完成任务。
昨天,有个朋友和我说到他使用 AI 搜索的方式。
他日常工作是监测品牌声誉,使用 AI 搜索工具会设定一些关于品牌名称、相关话题讨论情况的提示语,然后,用它们捕捉网上每天关于品牌的评价;最后,利用这些信息,制作成日报,反馈给领导。
也就是说,他把 AI 搜索当作一个信息聚合工具,利用它来索引、总结当天的重要反馈和评论。
还有人使用 AI 基于话题形式。比如说高考,众多家长在面对孩子高考后,不知道如何填报志愿、不知道怎么选专业。
这时,会用 AI 搜索获取帮助,AI 搜索像一个专业顾问,能够依据家长、学生提供的具体情况,(兴趣爱好、学科优势、未来职业规划等)进行综合分析,进而做出针对性选择。
从这个行为来看,用户主要关注两方面:一,功能性;二,实用性。
所谓功能性,即,AI 完成搜索任务后,能基于结果进一步生成思维导图,制作图标,提供多维度数据对比工具,甚至能做中英文互译等等。
而实用性,是把知识答案作为起点,去解决具体问题。实际上,每个问题都是一个场景,问题的聚合代表着大量资源的挖掘。
我前段时间看徐峥导演的《逆袭人生》,想写篇文章。
写作过程中,我想查查全网关于徐峥的各类话题数据,我用 AI 搜索找好久,最终,只能找到一些其他媒体的数据;其实,我更希望当我问 AI 时,它能帮我搜索、总结一下,然后用工具做成表格,直接拿来用。
最近各家公司都在发布财报,我如果能对 AI 搜索说,帮我找一下瑞幸 2024 年中期报告,比较一下和 2023 年的数据,并把毛利、净利做成表格,那该多好。
显然,目前 AI 搜索产品还做不到这一点。
或者说,大家都在卷 AI 搜索、把 AI 总结前置化思维方式,限制了产品经理的思考,他们没能从任务角度出发,用问题、话题索引信息源后,再总结,再用工具串联起来。
Perplexity 标语叫做 "Where Knowledge Begins"(知识从这里开始),我觉得,用这句话来形容 AI 产品的用途很合适。这意味着,AI 帮助我们从知识的起点开始,解决实际的问题。
二
把用户任务前置化的思维方式很重要。不信,冷静下来想一想,不论是什么样的 AI 搜索产品,它们主要目的是什么?
说白了,只有一个:用 AI 力量,帮用户找到他们真正需要的内容,让他们能拿到更准确的信息。
过去用传统搜索引擎时,很多用户需求都没被好好满足。如果我们要找个答案,可能得先把问题分成 A、B、C 三部分,然后一个个地输到搜索框里。
搜索引擎用爬虫技术在网上抓信息,然后,按自己的逻辑排个序,列出结果。我们拿着这些信息,自己再分析、总结一番,最后才能用来支持决策。
但有了 AI 搜索产品后,一切变简单了,你不用再走 A、B、C 三步。只要提出问题,AI 就直接理解你的意图,拆解问题,并找到相关网页。然后,大模型会分析信息,最后整理成结构化的结果直接给你。
但问题是,单单列出 A、B、C 还不够。我们希望在信息被列出后,还能用工具进一步深入分析,然后再总结,最后生成报告。这才是关键。
这个过程像建筑师设计房子:
先画出草图(提出问题并进行拆解),然后,找合适的材料(收集和分析信息),最后,精心挑选材料,确保每一步都非常精准,这样才能建造并完成精装,保证房子既坚固又好看。
可问题是:现在 AI 帮我们收集和分析了信息,但选择材料的权利没给用户,也没提供足够的工具,就直接总结了。这跟以前有什么区别呢?
因此,在创造新需求之前,AI 搜索要先满足传统搜索没解决好的需求;也就是说,过程中被忽视的需求。
虽然现在看起来 AI 降低了搜索产品的门槛,实际上很多产品很相似,都像 AI 版知乎直答,它们主要任务是简化搜索流程,把来自不同渠道的信息集中起来。
所以,我说 AI 搜索卷错了方向,那么,自然也就出现,很多人经过一段时间尝试之后,又回到传统搜索引擎行为上,因为传统搜索引擎提供的信息更全面。
显然,如果想让用户把 AI 搜索变成一个真正提高效率的工具,必须深挖并满足传统搜索技术没满足的需求,这才是刚需。
三
因为所有 AI 搜索,本质上,都在解决三种题型:
第一种,填空题。这种时候,用户其实已经心里有个问题:" 这是什么?"
比如:他们想查查最新的新闻,或者想知道某个名人最近怎么样了,又或者想知道一家公司去年挣了多少钱。这些问题,传统互联网搜索已经能解决得很好了。
第二种,证明题。这时,用户已经有了自己的想法,可能会说:" 我觉得是这样,因为…… ",他们需要的是一大堆事实来支撑这个看法。
这种情况就像老板给你个想法,你得去找证据来证明它是对的。这种任务,听起来简单,其实挺费劲的,要花不少人力、物力和时间。
比如说:
如果要证明某家公司的某个看法,我得去翻这家公司过去几年的各种数据和信息。就像我想写徐峥导演的《逆袭人生》,本质上也是个证明题,要通过数据来证明我的观点,那就得找准确的数据。
实际上,AI 搜索产品都在尝试解决填空题、和基础证明题,所谓的基础证明题,是有明确标准答案的问题,但它们处理复杂证明题的能力还需要提高。
我觉得最难的是论述题(discussion question)。
什么是论述题呢?这种题像:" 我也不太清楚,帮我在网上找找看?" 这种问题和前两种的区别在于更像语文和数学。
数学有明确对错,语文没有。高级证明、论述,就像写作文一样,没有固定对错,分数更多是老师主观给的。
搜论述题挺复杂,你找的是关于一个问题的各种观点,本来就没有绝对的正确或错误。搜完后,还得自己头脑风暴一番,最后才能总结出个答案。
可以看出来,这三种题型,难度一级比一级高。要回答好 " 高级证明题 " 和论述题,不光需要工具,还得人工参与一下。
这是啥意思呢?
现实世界里,复杂问题很常见,因为无论是在工作还是生活中,很多问题都没有绝对的对错,常常是因为不同人的价值观、看法不同。
我们人类又有点懒,总希望 AI 能一步到位帮我们搞定这些复杂的问题。但用过几次后,发现 AI 没那么给力,用的次数就少了。
还有,要回答这些问题,比如我找了好多论据,到底哪个最靠谱,哪个最有力,你得一个个筛选;如同写论文一样,为了支持一个观点,得查很多资料,还得想清楚怎么表达得简洁明了。
现在,ChatGPT 都解决不了高级证明题和论述问题。比如,你问它一个问题,它回答后,你说不对,它会马上改,改成你想要的答案,尤其是文科类。
四
那为什么大语言模型搞不定这类问题呢?因为大语言模型是根据前一个词来推理下一个词,它是在猜高频词。
但问题是,出现最多的词,不一定是最好的答案,有些词或句子出现的次数很少,但可能就是关键的见解。
比如:
好的学术论文,平时可能没多少人看,用得也不多,但要你想深入研究一个问题,这些论文就特别重要。法律、医疗、政策研究、市场分析的专业报告也是一样,这些深入和具体的内容通常不太流行,但对做决策超重要。
还有一点,AI 不太会拆解复杂问题,我们得把问题拆得特细,一步步来,才能找到答案。所以,要解决证明题、复杂论述题,就得让用户参与进来。
这个过程就是:AI 搜索后,用户可以选择优质语料、剔除不太准确的信息,然后扔进工具里,自己再总结一下,最后才能得到满意的答案。
举个通俗的例子:
你想研究全球变暖,对北极熊生存环境的影响。一般 AI 搜索,只能给你一些基本的信息和新闻报道。
但作为研究者,你要找到相关的学术论文、和详尽的环境研究报告。可是,第一次搜索结果里,你会发现很多过时的或者不相关的内容。
这时,为了拿到真正有用的数据,你就不得不一个个地筛选包含严格科学研究和具体数据分析的文章;这一步做完后,你就可以把精选的资料扔进一个分析工具里,或利用某些功能,做成图表、PPT,插入一个页面中,最终制作出自己需要的报告。
前一段时间,GitHub 热榜上,曾经有位 AI 大神仅用 500 行代码就打造了一个 AI 搜索引擎的 Demo ,我还体验了一次,不仅响应速度快、回答的内容也能跟进最新时事。
所以,想要 AI 搜索产品脱颖而出,最关键条件是什么?
一方面,是数据,尤其是垂直细分的数据。垂直细分的数据要通过具体的场景、话题、主题来引导用户分享,并参与提问。
另一方面,想应对低门槛挑战,要努力打造自己产品特色,AI 搜索产品是由用户需求驱动的,不是单纯的技术驱动。
用户价值可以通过这样的公式来表达:用户价值 = 新体验 - 旧体验 - 迁移成本。想想看,如果一个 AI 搜索工具能提供明显优于传统搜索的结果,但,同时使用起来又非常简单,那么,用户自然更愿意转向使用这种新工具。
我最近老看大模型的文章,文章都在哪找的呢?
主要是两个地方:一个是技术社区,另一个是知乎直答上的一些专门写这方面的博主。每次我搜索这些内容时,它们几乎总能给我找到需要的东西,所以,我现在挺依赖它的。
这就是用户价值。
因此,从这个角度看,国内 AI 搜索产品的发展路径,不能完全模仿国外 Perplexity。外媒平台 Decoder 一周前发表了一篇文章,介绍了 Perplexity 的现状。
文章中提到,Perplexity 首席业务官 Dmitry Shevelenko 表示,Perplexity 每个月要处理 2.5 亿个问题,增长速度令人惊讶。虽然谷歌仍然是搜索市场的主导者,每天处理 85 亿次查询,但 Perplexity 的增长速度也非常迅速。
Perplexity 是希望打造知识平台,成为生态入口,它的定位是 LLM+ 搜索引擎的中间态,将二者优点结合,侧重搜索体验的产品力而非基模型。
对比国内的搜索环境,传统搜索引擎已经占据通用搜索场景。如果新的 AI 搜索产品知识库规模不够大,使用效率不够高的情况下,还在努力处理填空题、基础证明题,那么,很难在市场脱颖而出。
所以,国内 AI 搜索产品,每家要找到自己独特的发展路径,或许,在特定垂直领域深耕,利用 AI 优势来提供更精准、更垂直细分的内容,才能有机会瓜分市场。
总结
到场景任务中去。
场景、任务里,存在着许多尚未开采的金矿,未来 AI 搜索要么成为工作流中一部分,要么,走向 UGC+AIGC 路线,但后者要具备庞大知识系统,构建起来要烧更多钱,何其容易。
来源:王智远