总的来说,2024 大伙都更加务实,无论是投资者还是创业者,不再宏大叙事,转为探索的落地业务。
Cursor 能帮我补齐短板,虽然我不会对应语言,但我能看懂代码对不对◆■★,也知道要如何调试,它能帮我快速做 产品 Demo■◆■★■★。
有人梭哈 All in 搞 AI,有人稳坐观望★◆,有人还在学规则,或许也有人已经 Out 了。
这种辅助应该是无形的、自然的★★■★◆◆,就像旁边有一个写作大神和你一起,既不打扰你的思路,又能在你需要的时候给出恰到好处的建议。
总结我对 AI 产品的付费动力:看起来,买的是产品能力,但本质是是为了 AIGC 的产物付费,是为优质的内容买单。
三高就是:高频刚需、高错误代价、高机械性。一准就是:AI 生成产物只需评价准不准,而不要评价好不好★★■■。
首先是稳定性,Demo 展示最优路径,环境可控◆◆,万事俱备,而且大家都能接受存在一些 bug◆■;而实际场景下◆◆★◆,用户输入千奇百怪■◆■★★,各种边界情况层出不穷,用户的使用习惯更是难以预期
所以■★,我们在做完 Demo 之后◆◆★,就开始往回收◆★,然后思考下面三个问题■★■,尝试找到产品化的必要性。
而且 prompt 很难实现边界条件的处理■■,当场景复杂的时候■■■◆★◆,真的就是调试和迭代变得极其复杂。
去年,几个算法工程师和产品经理坐在一起,可能就能打造出很很棒的 demo;因为场景简单,需求明确;过程中完全不需要一个“中间角色”来协调工作★■■◆★★。
比如简单的图像识别,或者套壳◆★◆、Agent 工作流★◆■,大概几个小时■★◆★◆◆,一个下午的时间对齐就能搞定。但当 AI 应用逐渐走向工业化,我觉得情况可能会有所改变。
比如◆◆■★★◆:生成一张图要等 30s,用户能等么?一天要烧几十万 Token,能撑得住么?
举个例子,基础的 Prompt 工程师负责优化 AI 功能实现时的提示词■★◆,他可以聚焦
我一般按照这样的象限进行划分,对于更多用户遇到的高频场景,又需要专业资料的,可以考虑优先做;而对于资料需要内建或者依靠用户积累的,可以稍微降低优先级;
相同的需求,使用不同的提问方式,或者让 AI 扮演的角色不合适,产生的答案差异也较大。
可能大家会疑惑,这个和 VS Code 的 Copilot 有啥区别★■?我觉得■★◆★,最关键的差异■■,可能就是… 用户不会在行文过程中写注释。
VSCode Copilot 成功之处,很大程度上得益于程序员们的写注释习惯。
2024 飞逝而过■★■,我们踩着坑,跌跌撞撞摸着技术摸着行业,也摸着用户前行◆■★,逐渐积累了一些新的小小认知★★◆。一直希望与朋友们分享■★■★◆,以致敬技术爆炸的 2024 年■★■★。拖延症发作至今… 再不写就过点儿啦■★★◆,后文中,我努力体系一些,分为为三个篇章讲述:
看似只是在出功能方案,实际要懂 RAG、要懂 PAL◆★★◆★、 懂 Ranking。样样都不能少。
程序员们在编码时,自然而然写下大量注释,解释代码的功能、参数和逻辑。训练时,AI 学习了规范的、有逻辑的代码★★■◆■。
比如现在的 AI 岗位:Prompt 工程师、AI 产品经理、模型训练师★★■◆★.★★◆.■◆★★◆◆. 看着都挺不错。但每个岗位背后■★■,都需要扎实的功底■◆■◆,并不是说转就转■◆◆■★。
我一直在思考,在文字或办公层面★◆,是否能够像图形一样,具备可控生成能力,因为目前 LLM 写作遇到最大的问题,就是大模型的思维逻辑严丝合缝,普通用户修改压力大■★★◆,一旦在过程中出现表达异常,会毁掉后面全部内容。
产品丰富度上呈现显著断层,这主要是因为面向全球市场的产品往往追求规模效应■◆★★,导致大 DAU 产品占据主导地位。如果创业面向全球市场,“小而美”的策略或许仍然奏效◆★■。
爸爸被女儿拿捏的死死的,刚被女儿玩头发玩烦又瞬间妥协 网友:这发量,让我女的都羡慕
首先■◆,过度依赖单一模型能力。在模型解决不好需求的时候,考虑的是调 prompt 而不是换模型或者换技术手段。因为他们可能不了解新的技术手段。
TE = 效率得分(越高优先级越高)■◆◆、U = 用户覆盖率(或者渗透率)、C = 付费转化率(或者留存)★◆★◆■★、P = 客单价(或者付费意愿)、T = Token 消耗
但这些毫无例外◆★,都是“资本加持◆■”的产物■◆◆◆,对于创业者而言,可能需要避开在内容生成层面卷,而要考虑解决少部分用户,小细分场景,把付费做起来,先活下来★◆★◆■,避免陷入同质化竞争。两边的市场都呈现:从通用平台向垂直应用的演进,可以看到 DAU 稍小的 AI 产品的增量都较为显著。
Claude 作为封号狂魔■◆◆,使用的成本极其高昂,换账号换麻的我,找 poe 作为平替★★■★■;本质是需要 Claude 3.5 Sonnet 的优质内容;
如果不了解底层原理■★★◆◆,很容易陷入两个极端■■:高估 AI 能力,设计无法实现的功能低估 AI 潜力,错过创新机会,我在与各类公司伙伴沟通时发现,一些产品经理高估了 AI 的能力★★■,低估了产品化过程中的困难。
两个多月宝宝发量惊人,妈妈一松手,宝宝头发瞬间炸开 网友■◆◆★◆:真的是旱的旱死,涝的涝死
国内 AI 产业蓬勃发展,同时催生挺多新岗位★■◆■★◆,目前是一个大趋势是许多产品经理转型为 AI 产品经理。
而且,这些产品提供了我基础能力以外的认知,比如前端代码的能力■■◆。如果我不买使用这个■■■■,我的同事可能会使用这些能力◆■,进而产出超越我能力的工作质量。
GPT 市场份额毫无悬念的断崖第一★★,紧接着就是 canva 和 Gemini。全球市场在 OpenAI ■★、 Google 等公司主导下,体现出典型的赢家通吃局面,马太效应明显。
用户难以像编辑 PPT 一样,直观地对 LLM 的生成结果产生■★◆“所见即所得■◆◆”的预期。
2023 年我觉得:■■★★◆“垂类”空间挺大★■★,但随着 AI 基础模型的持续迭代,纯依靠内容生成的创业优势正在被快速削弱,创业团队优势会越来越少。
比如:文案创作依然聚焦于生成 - 修改 - 优化的核心流程;游戏原画依然围绕构图 - 调色 - 细节的基本需求;办公效率依然围绕输入 - 处理 - 输出的工作模式■■。这也解释了为什么很多纯堆功能的产品很难真正打动用户■■★■★。技术和能力只是噱头和手段★★,解决用户需求才是目的。所以在规划和设计产品功能时:与其追求大而全,不如做透一个功能,思考用户需要什么,再动手。
未来,大模型升级或许能适配更少的提示词,或者用户慢慢学会与 AI 交流,都可能带来更好的结果。
《编码物候》展览开幕 北京时代美术馆以科学艺术解读数字与生物交织的宇宙节律
今年是 AI SOTA 起伏跌宕的一年,AI 技术爆炸◆★★★■,而产品却线性增长。
如果希望 AI 生成好结果,前提是用户得提出好问题,写出好 prompt ,而目前大部分用户不具备写出好提示词(5W1H 、 详细描述背景、 提出明确要求等)的能力。
其次是用户对 AI 服务的价值认知不够◆★■■,比如 kimi 、豆包和秘塔等产品都能搜索◆■■■★,只要有产品收费,用户就会转移到其他不收费的产品。
在 2024 年,我们尝试对用户前文进行内容识别,基于前文的受控生成,取得了非常好的效果,用户反响热烈★★。请看录屏效果。
接着上面关于 “内容质量★◆”的话题,如果用户对内容有诉求★■◆,而且养成重试习惯,持续炼丹 带来 Token 成本上升。
首先■◆★,产品的演进需要较长时间打磨,对于大部分公司而言◆◆■■■,从发现新技术,调研与 Demo★◆■■,再到产品落地,结合过程中沟通协调、迭代测试… 走到上线 个月的时间。而在这段时间之内,技术很可能已迭代了多版。我们也能看到■★◆◆■,一些大厂采用后发先至的策略,以稳定的方案结合流量抢占市场…
徐奕成,金山办公 WPS AI 产品总监◆★,10 年产研经验◆■★,7 年 AI 相关产品设计经验,主导设计基于 Agent 范式的 WPS AI 伴写功能。曾供职于天美 J3 工作室,西山居等,创业 AI 产品《米羊写完啦》被金山办公收购★◆★★◆,曾负责多款腾讯游戏安全业务,天美 DevOps AI 项目管理系统开发等◆◆★,拥有 2 项专利,多次获腾讯公司级技术突破奖■■◆◆★、成本优化突破奖◆★★◆。
就像训练智能驾驶端到端模型,使用老司机上路的行为,不一定能开好电动车(因为电动车的路况更复杂)★■■。
因为这样设计,用户不用评价内容好不好,价值就在那里,明明白白■■★◆,也能促进付费决策★★。用 WPS 举个例子,下面场景抓得比较准确◆■。
落地之后紧接着发现◆■★■:这个技术已经过时了■★◆★◆。我在与许多团队沟通的时候,他们表达:评估是否采购新兴能力时,对于技术被快速淘汰的疑虑大于新能力的渴望。
就像 1999 年的互联网那个时代,那个时候的产品复杂度,需要的协作度还不庞大时,当时的产品经理需要技术出身(比如张小龙大佬),对各种技术有深入理解时★◆◆★★■,开发主导,能设计出许多可靠好用的产品。下面是简单罗列产品经理能力雷达★■◆◆★,仅做示意★★■。
大部分用户仍然采取:★■◆◆■★“一次不行就多试几次◆■◆■★”的策略,同时,用户很难第一次就问对问题或者表达清楚诉求◆■★■■,同样的★■★■★, AI 返回的内容也无法直接满足用户。用户和 AI 往往需要交流 3◆■★★★◆.5 次以上才能获得较好的内容■■◆。
而反观国内的市场,却呈现了“百花齐放◆■■◆★■”的姿态■★★,更加注重实用,且不同于互联网 “BAT”竞争大格局,细分领域都赛出了赛道黑马,比如搜索(夸克 6700W)、Chatbot(kimi、豆包)、音视频(即梦、可灵)等★★◆■,
写材料◆■◆★★◆,找素材找半天,调格式调到吐,改表格改到眼晕◆■★◆;回邮件,一些套话回复要组织语言,事项要加 TODO.★■★■..
它需要分析用户已经写下的内容,捕捉行文脉络,预判下文走向,在用户需要的时候适时提供帮助。
对于创业团队而言◆◆,用户量窄不打紧,只要用户群对功能有诉求并有付费意愿,就可以优先开发◆◆■◆★★。
这种所见即所得的体验,让用户始终掌握着写作的主动权,避免了那种AI 牵着鼻子走的被动感。
我从收集整理了全部的资讯与产品,整理了 2023 年与 2024 年资讯词云,一些有趣的变化:
今天的 AI 产品刚刚起步,产品经理可能也面临类似处境■■■◆:AI 技术还在快速迭代,能力边界也不稳定。
简单来说,在 token 相同的场景下、要么能换用户量、要么能换付费转化◆■★■、要么能换高单价。三头总得保一头。如果三头一个都保不了■★■★★◆,那在商业化层面◆■■,可能没有太好的预期。
技术焦点从 ChatGPT 和 模型向 模型应用转移,kimi、豆包、即梦等声量提升
其次是成本★★◆★◆★,Demo 可以为了达到目标不计代价(甚至性能代价)■■;而实际商业化应用★◆◆★◆◆,每一个 Token 都要精打细算,实际应用中,响应速度、并发数、成本控制…Token、算力烧起来都是真金白银,每一项都是拦路虎■◆■。
疑似有洛杉矶电影工作室人员,扛着机器上街拍特效素材,网友◆■■■:真正的百万特效
对账时◆■★,漏掉一笔收入或多记一笔支出,差个一分就要老命;投标时★■■◆■★,格式不规范被否★◆■◆★,条款不完整被退,错过截止全没了;分析时,一个指标算错,汇报时被发现,那就…写材料,领导讲话引用错★★■,那就…
这样的 TAIPM(Tech AI PM)看似只是在写提示词■■★,实际要懂 NLP◆■■■★、懂业务、懂优化、懂成本◆■■■◆...
有句话说◆■■★◆:所有产品都值得用 AI 重做一遍。”但我觉得还有一句话更重要:选择比努力更重要。 那究竟什么样的产品值得用 AI 重做?一些功能稳定的产品◆◆★,比如计算器◆★★★■★、日历、天气这样的工具,不需要急着 AI 化★★,优先级可以往后放。
以游戏行业为例,TA(技术美术) 和 TD(技术策划)他们分别融合了 开发和美术;开发和策划。他们是开发中最懂美术效果的人;是美术中最懂写代码的人◆■◆■;
这波 AI 浪潮来得太快,GPT-4 刚出来★◆,Claude◆★、Gemini 又来整活,国内模型往死里卷。每天刷到的自媒体都在说■★◆◆■■:
如果要求用户像程序员那样写注释◆■,反而会打断用户写作思路,增加不必要的负担■◆■■。
图片、视频的创作覆盖行业更广,对于用户基础能力要求更高,带来的收益也越大,团队有足够的动力学习使用可控图形或者视频生成。但在文字场景中,对于普通用户而言,可控 AIGC 仍是个痛点■◆◆◆★。
去年,无论是内部还是外部★◆■◆,一些产品经理把 LLM 当作函数在用★★★★,用户的原文或者请求作为输入,AI 生成的结果就是输出。
特别声明◆★◆■★◆:以上内容(如有图片或视频亦包括在内)为自媒体平台◆■“网易号”用户上传并发布,本平台仅提供信息存储服务。
这也解释了用户遇到 “ 为什么同样用 GPT,我在官网用和这个应用◆★◆,结果差这么多。◆◆◆■■■” 现象的原因◆■。
如果项目规模较小★■◆■■◆,或者已经有非常成熟的解决方案可以直接使用,那可能并不需要专职的 AI 技术策划。
Monica 工具箱超多的功能,能非常快速整理资料◆■■★■,规则地转为我自己的知识;
大部分用户根本不知道也不关心是否有 LLM 参与,他们只希望更好解决他们的工作★◆,节省出时间来摸鱼■★★★★■。
最关键的一点◆■★:AI 生成内容不可避免幻觉或者不稳定,如果结果需要用户评价“好不好”,
2名中国女游客在日本被撞身亡,有游客亲历:我也被困危险区域,万幸电车走的远道★◆★■,最后操作得当才脱困
震惊!AI 要替代这个...、颠覆!AI 要颠覆那个...直播上各种贩卖焦虑:完了完了,这下真要失业了◆★■■、再不学 AI◆■,就要被淘汰了★■、XX 行业要完蛋了■◆■■...
作为以前的游戏开发,我对 C++、python 都驾轻就熟◆■■■★◆,但对于 Web 前端比如 VUE 、TypeScript 几乎一窍不通…
AI 难为无米之炊,对于数据源的拆段■★、向量化和召回等环节,也可以深入设计。说白了,得在内容生成之外找差异化竞争点…毕竟模型迭代太快◆◆,光靠堆 prompt 已经玩不转了…
最关键的是价值★◆■■◆,Demo 未必能解决用户痛点,即便解决了,用户也未必买单。变现模式需要探索■◆★■★,ROI 更是难以评估。比如◆■◆■◆:这个功能确实挺好★■★★,但用户说:又不是不能用…而且为什么要花钱…
其次,低估运营和维护成本。对于不同的模型★■◆◆,接入代价不一样■◆◆★,不同的技术方案要求的技术栈也不一样★★★■,需要产品经理对方案有足够的了解,才能更好与开发一同制定功能策略,才能选择最适合的模型来解决具体问题,而不盲目追求最新最强…
其次,AI 技术与产品都处在快速发展的不稳定态,新的模型★■■★◆■、算法层出不穷■◆★◆★,但如何将这些技术转化为稳定可靠的产品功能★◆,仍需要时间的沉淀。一方面,并不是所有的 SOTA 都适合落地;另一方面,SOTA 技术落地到用户应用中,并不是简单的过程◆★■★,更别说一些 SOTA 包含宣发★■■★、营销等目的,刷榜、刷数据…
用户不知道怎样描述需求才“对”;因为人的沟通往往是基于“感觉”与◆■◆“直觉■★■■”, 而现阶段大部分 LLM 仍需要 明确的指令与完整的上下文。
WPS AI 伴写功能录屏◆★,有兴趣可以更新 WPS 版本到最新, 新建 docx 文档后,点击右上角免费体验。
2024 ◆◆,更讲“落地”、★■■“场景”;而并非去年更宏观的“产业”、技术、★■◆■■◆“发展”
ChatGPT 引爆了人工智能领域,2024 年技术层面百花齐放,而相比于 2023 年,产品的迭代明显跟不太上节奏。
但对于那些需要深度定制、规模复杂、要求持续迭代的 AI 应用来说■★◆,这个角色就变得不可或缺了。
与其盲目跟风,不如先摸清自己的底牌■★■★◆★,看看手里有什么筹码★◆■,等待合适的机会◆★★。反正牌局还长着呢■★■◆◆,慌也没用★★■★■■。毕竟市场有起有落◆■★■◆,风口有来有去■■★◆◆,能留在牌桌上,就还有机会。
大部分的 AI 应用对用户的请求做封装,固定的 system prompt 会干扰用户命题导致结果质量下降★★。
有的时候,甚至寄希望于一个 ◆■■◆■“完美的 prompt”解决所有问题◆◆■★■。实际上,prompt 越写越长,维护成本会直线上升,
OpenAI 等大公司快速迭代和带来标准的统一,在很长的一段时间★★◆,友商只能跟进★★◆■★★。
解决★◆:写完 ppt 套自己公司模板的问题,把半个多小时的调格式的时间节省下来,内容不在“好不好”★◆◆■★★,而是格式“对不对★★◆■★◆”上■■◆★★■。
更为关键的是,AI 生成的内容必须在用户的掌控之下。让用户可以一眼看出修改建议,并自主决定是否采纳。
特别是办公室用户,有大量的写作要求★★■■★,不但要求想法全面、用词准确、结构合理等,还要避免一眼 AI ,规避行为不端风险。
TPM 既要理解引擎的能力边界,又要知道怎么做出好看的效果。两个领域都要精通(熟悉),才能创造价值。
年初花大量精力优化内容质量,下半年模型一升级◆■,好家伙,我们的努力几乎被直接取代…对于自家产品迭代◆★◆,走了一些弯路不打紧。最怕是… 友商后发先至◆■★★■◆,通过新模型 + 砸流量 + 砸资源不但端了我们的饭碗■■,掀了我们的桌。
AI 行业的持续迭代,需求与解决方案逐渐复杂◆◆★★◆■,必然也会产生横跨技术、模型和产品的 TPM。能力融合是必然的趋势■★。而且… 这个岗位在短期内可能不会消失★◆。
很多人认为 AI 的出现会改变一切,但我觉得:用户的核心需求从来没有改变。反而因为有了 AI 之后,用户对内容质量和响应速度的要求更高了。
以数据为例,大模型生成的内容泛、不聚焦,看起来能用实则不好用,那么结合专业资料 RAG 技术能提升 AIGC 内容质量基线。
下面是基于 aibase 最新一期产品榜单整理的散点图★■◆★■◆,对比国内与全球,
以文生图的场景为例,可灵、即梦、元宝等在亚洲人绘制上远超 Midjourney,对东方美学的理解更为准确◆★■■,在古风、国潮等风格上尤为出色,对汉服★◆■★◆、古装等传统服饰的细节还原度更高。
工程化同时,需要关注 LLM 升级方向,避免被模型升级取代。过去一年, 我们在内容生成优化上吃了不少亏。
我在想,如果我还在继续创业■◆★◆,我可能会:结合我之前的经历或者能明确接触到的专业群体★■■★◆◆,绕开豆包简单 prompt 就能覆盖的内容,找到明确的刚需场景◆◆■,通过独特交互,结合 LLM 能力★■◆,切非常小的场景打磨透◆◆,先提供差异化的★■◆■■■,内容优化的差异化体验,把留存做起来,可能存在一定商业化空间◆■◆◆★。
虽然用户对基础能力的付费意愿低,但用户对于优质内容有需求;特别是对于超出用户现有能力的优质内容★◆■★★◆。以我为例■■◆★■,我之前购买了 ChatGPT、VS Copilot、沉浸式翻译等…
游戏有个概念叫 beautiful corner,简单来说就是在理想环境下■◆,通过堆料证明效果,在该场景中不计成本地展示。
在 AI 大模型技术如汹涌浪潮席卷软件开发领域的当下,变革与机遇交织,挑战与突破共生。2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开■◆★,以 “智能融合,引领未来” 为年度主题,汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。「更智能的企业 AI 搜索实践」、「反卷 “大” 模型」■◆◆◆、「多模态大模型及应用」等热点专题,直击行业痛点,解锁可复制的经验与模式。现在报名可以享受 8 折优惠,单张门票立省 1360 元,详情可联系票务经理 咨询■◆■★★。
在团队资源有限的时候,假设有相似的市场预期,选择同样纠结★■■◆★◆。我会根据上面的规则,拆成★◆◆■◆“高频程度■★”、“出错代价★◆■◆★◆”、“预期体量★★■■”几个指标进行优先级评估★◆■。
就像文生图或文生视频领域一样,许多团队在日常工作中已经充分使用 ComfyUI 等产品进行内容生成。
写 PPT 的时候■★★■◆,天天要改字体、调间距、换配色、改边距... 每次要交材料■■,都要全文替换标题★■■◆◆、逐页检查段落、重新排版、统一页码★■★.◆■◆.■◆★★★. 每次处理表格■■◆◆◆★,不是要求加粗就是斜体,今天改行高明天换背景色...
原本对于国内外模型的限制,我很担心产品效果会打折扣■★◆★,事实上,我相当多虑。在过去一年◆◆,我见证了国内模型能力的快速追赶。从最初★■◆◆◆■“接近 GPT4 水平”,到现在在一些领域成为 “SOTA”。
另外掌控感对用户而言非常重要,这也是我希望 AI 和用户达成的默契★◆★◆■★:顺应用户的写作习惯,而不是强迫用户改变习惯去适应 AI。
AI 时代,想法更加不值钱了。如果有通用的需求和场景,大厂只需要花一周就能把交互抄过来。所以■■★◆◆★,只能找大厂 ROI 不高的场景入手,找到小众但能给钱的群体,先让公司活着(上线就必须要收费)◆◆■★,再想办法融资。
但无论是模型端,还是用户端,都需要时间。现阶段◆■★◆◆★,就需要从产品端出发,让用户更少提供提示词甚至不需要提供提示词,就为用户提供更有效,更好的内容。
对于创业团队而言★■■★,就会陷入两难境地■★★★■:功能不收费,成本罩不住★■★◆;收费,用户会流失。不过这或许并不是无解的问题…
毕竟■★◆,技术再酷炫,不解决问题就是玩具■◆。Demo 再惊艳,不赚钱就是负债。
相同品类产品的技术路径高度相似,形态千篇一律(遮住 logo 就难以区分)◆★◆■;
而基于工作流的产品(用扣子■★◆、dify 等产品快速搭建的小应用)★◆,或纯套壳的产品,在友商的激烈竞争围剿下■■◆★◆,难以再积累 To C 优势。所以可能不会再考虑生成更通用内容的产品。
那完了,用户就会开始炼丹■◆★。因为用户总会对“下一次◆★★◆”抱有很高的期待★★■■,我们的 Token 和算力就在燃烧。所以我们可能会聚焦在◆★◆◆“准不准”的场景,比如:数据对不对■◆★★■,格式规不规范◆★■★■■,内容全不全★■★◆◆◆,逻辑通不通◆◆★◆■■。
一些复杂的场景■◆■■■,如果在实现层面没有用 扣子、dify 这些流,在程序上也要与开发达成流的概念◆■,多次调用 LLM 完成一次请求。比如一个客服场景,AI 要同时完成:意图识别★★◆★◆、情绪判断、话术生成,结果就是一个超长 prompt,既要判断又要生成。
换到文档写作场景,用户可能正在写一份工作报告或者方案,他们不会也不该在写作过程中添加各种注释和标注◆★■■◆。