AI时代的产品经理手册

PM熊叔

产品经理是一群打破规则创造规则的人。在这里,我们会讨论设计、体验、商业、技术、算法,一切认知将为你所用,“有价值没边界”即是我们规则。做最有质量的产品播客!欢迎关注的,我的公众号:“PM熊叔”

  • 2 minutes 44 seconds
    一起微调llama3,做自己的大模型!

    随着Llama 3的发布,国内各路英雄豪杰纷纷开启了炼丹之旅。Llama-3 8b在惊人的15万亿令牌上训练,而Llama-2仅为2万亿。毋庸置疑,Llama 3目前是开源大模型中能力最强的!其跑分成绩已经赶上了GPT-4。




    然而,Llama3的优势不仅限于此。作为开源大模型,每个人都可以对其进行个性化的定制,这意味着相比GPT,它具有更强的定制性和安全性。另外,Llama3 8B的模型可以在内存只有8G的树莓派上运行,对于计算机资源的依赖比以往都要低,人人都可以本地部署Llama3,可应用于针对B端企业和各种场景下的自然语言处理、机器翻译、文本生成、问答系统、聊天机器人等场景。


    目前,我们主要通过微调(Fine-Tuning)来定制所需的模型。例如,Llama 3原生不支持中文,但我们可以通过微调让它支持中文。

    什么是微调(Fine-tuning) ?这是机器学习和深度学习中的一个术语。它指的是在预训练模型的基础上,使用特定任务的数据集进行额外训练的过程,目的是让模型更好地适应特定的任务或问题。通过微调,我们可以调整模型的参数,使其更精准地解决特定问题。


    就像一个已经非常了解世界的成年人。现在,我们需要它去学习一些更专业或更具体的知识。微调的过程,就像是对这个成年人进行一些专业培训,使其在特定领域更加精通。

    为了帮助大家更好的理解什么是“微调”,我前天写了一篇轻松的入门教程《Llama3微调教程:超简单,人人都可以打造属于自己的GPT!》:

    地址:https://mp.weixin.qq.com/s?__biz=MjM5NDIzOTg0Mw==&mid=2448257753&idx=1&sn=627c94e8b0d66bc9866ab4a42edaaa73&chksm=b29316d585e49fc312553b5efaca684af566be55237b8c4e2a1d9a472dd31f7ee74157c08163&token=1764237450&lang=zh_CN#rd


    就算你不懂技术也没有关系,通过这个简单的Llama 3微调案例,我们可以免费体验整个大模型微调的过程。你可以学习到AI工程师是如何进行环境配置、数据准备、模型训练、模型运行、模型保存以及本地模型使用。


    这对于大多数普通人来说,这是一个免费体验AI工程师工作方式的机会;如果你想转入AI行业,这也是一个很好的入门案例。
    你可以通过我的微信公众号“PM熊叔”浏览。


    另外在Shownots中,我列出了目前已经微调好的Llama3作品,大家如果有兴趣可以体验一下。


    愿每个人都能从中受益,开启自己的AI探索之旅!

    以下是一些微调的llama3的作品:


    llama3-Chinese-chat-8b:https://wisemodel.cn/models/shareAI/llama3-Chinese-chat-8b
    Instruct + 进行中的中文sft版本:https://modelscope.cn/models/baicai003/llama-3-8b-Instruct-chinese_v2/summary
    联通微调版本:https://www.modelscope.cn/models/UnicomAI/Unichat-llama3-Chinese/summary
    Openbuddy微调版本:https://www.modelscope.cn/models/OpenBuddy/openbuddy-llama3-8b-v21.1-8k/summary
    破解安全限制系列(目前仅支持英文):
    Unholy:https://huggingface.co/Undi95/Llama-3-Unholy-8B
    neural-chat:https://hf-mirror.com/Locutusque/llama-3-neural-chat-v1-8b
    聊天机器人:https://huggingface.co/cognitivecomputations/dolphin-2.9-llama3-8b
    Bunny-Llama-3-8B-V(多模态图文版本):**https://wisemodel.cn/models/BAAI/Bunny-Llama-3-8B-V

    我的公众号:


    26 April 2024, 5:08 am
  • 10 minutes 57 seconds
    人工智能经典《苦涩的教训》聊聊背后的思考

    今天要介绍的这篇文章《The Bitter Lesson 苦涩的教训》是由知名计算机科学家,阿尔伯塔大学、DeepMind的神经网络专家Rich Sutton 在 2019 年发表的,主要讨论了在人工智能研究中一个重要的观察:当简单的算法能够利用大量的计算资源时,往往会胜过依赖于人类专家洞察力的复杂算法。



    在回顾AI历史上一些关键进展时,Sutton指出,虽然研究人员曾多次尝试通过设计复杂且模仿人类理解的算法来提升机器学习模型的表现,但通常更简单、更基本的方法,只要能通过增加计算能力进行扩展往往能取得更佳效果。他强调了规模和算力的重要性,并认为未来的研究应该更多依赖于扩算力,而非复杂的设计。


    OpenAI 在2021年的论文《神经语言模型的缩放法则 Scaling Laws for Neural Language Models》讨论了AI模型的性能如何随模型大小、数据集大小和训练计算量的规模提升而提升。


    今天,在缩放法则(Scaling Laws)的加持下,简单的Transformer架构让GPT等大语言模型涌现出了“能”,也展示出了AGI通用人工智能的可能性。


    现在就让我们来读一读,回顾这篇经典文章。


    苦涩的教训


    Rich Sutton  2019年3月13日


    我们从70年的人工智能研究中可以得出的最大教训是,利用计算的通用方法最终是最有效的,而且差距很大。其根本原因在于摩尔定律,即集成电路上可容纳的晶体管数量每隔18-24个月会翻倍,从而使芯片性能指数倍增。


    大多数人工智能研究都是在假设智能代理可用的算力资源是恒定,在这种情况下,利用人类知识是提高性能的少数行之有效的方法之一,但在略长于典型研究项目的时间内,大规模的计算量又不可避免地会变得可用。


    研究人员寻求在短期内实现改进,试图充分利用他们对特定领域的人类知识来节省算成本,但从长远来看,唯一重要的是利用计算资源。这两者不必相互对立,但实际往往如此。由于对一种方法的投资存在心理承诺,我们在一个东西上花费大量的时间,就不会在另一个上花费更多时间。而且,基于人类知识的方法往往会使方法复杂化,使其不太适合利用计算的通用方法。这些案例不胜枚举,我称之为苦涩的教训。


    作为人工智能研究者,我们学习这些教训是有指导意义的。下面,我们来回顾其中一些最知名的案例。


    在1997年,计算机国际象棋领域见证了一个历史性的事件——计算机通过大规模深度搜索击败了世界冠军卡斯帕罗夫。当时,大部分研究者都倾向于利用人类对棋局结构的深入理解来设计算法,这一失败让他们颇感挫败。当一个相对简单的基于搜索的方法,结合先进的硬件和软件展示出惊人效力时,依赖人类知识的方法显得力不从心。这些研究人员对于“蛮力”搜索的胜利持怀疑态度,认为虽然这次有效,但它并非一种普遍用的策略,也不符合人类下棋的风格。他们曾希望能通过更贴近人类思维的方法取得胜利,因此对结果感到失望。


    计算机围棋的研究历程展示了一种类似的发展模式,但这一过程比其它领域晚了大约20年。初期,研究者们尝试通过利用人类的棋知识和游戏特征来减少搜索需求,但随着搜索技术在规模上的有效应用,这些努力最终被证明是无效甚至有害的。同样,自我对弈的方式学习价值函数也显示出其重要性,这种方法不仅应用于围棋,在国际象棋等许多其他游戏中也同样适用,尽管在1997年首次战胜世界冠军的程序中,学习的作用不大。自我对弈不仅是学习的一种方式,它像搜索技术一样,使得可以利用大量计算资源。搜索和学习是利用大规模计算的两个关键技术,在计算机围棋和国际象棋的研究中,尽管研究人员最初依赖于人类的理解来减少搜索的需要,但最终还是通过采用搜索和学习技术取得了显著的成就。


    在语音识别领域,20世纪70年代DARPA主办的早期比赛中,参赛者采用了包括人类发音知识在内的各种特定方法,例如对单词和音素的认识。相对的,一些新的统计方法采用了更多的计算,并基于隐马尔可夫模型(HMMs)进行操作。结果显示,统计方法优于那些基于人类知识的方法,这一发现推动了自然语言处理领域的重大变革,并在随后的几十年中逐渐成为主流。深度学习在语音识别中的崛起标志着这一发展方向的进一步演进。


    深度学习方法较少依赖人类知识,而是利用大量计算资源,通过在庞大的训练数据集上进行学习,显著提升了语音识别系统的性能。研究人员原本希望开发出能模仿人脑工作方式的系统,并尝试将这种理念应用于他们的系统设计中,但这种方法最终被证明是适得其反,甚至是对时间的浪费。尤其是在摩尔定律推动下计算能力大幅提升并找到有效利用方式的背景下,这种做法更显得没有必要。




    计算机视觉领域也遵循了相似的发展模式。在早期,研究者们试图通过识别边缘、圆柱形等广义结构,或使用SIFT特征来处理视觉信息。然而,这些方法如今已被淘汰。现代的深度学习神经网络主要采用卷积技术和某些类型的不变性处理,并且在性能上有了显著提升。


    这一趋势给我们的教训是深刻的。作为一个领域,我们似乎还没有完全吸取这一教训,因为我们依然重复着相同的错误。要真正理解这些错误的诱惑,并有效地避免它们,我们需要认识到依据我们所认为的思考方式构建方法最终可能不会奏效。这是一个我们必须接受的苦涩教训。


    从这些历史经验中,我们汲取了一些重要教训:


    1 )人工智能研究人员经常尝试将人类的知识整合到他们的智能系统中。2) 短期内,这种方法似乎总是有益的,并且能给研究人员带来满足感,但长远来看,它可能导致发展停滞,甚至阻碍进一步的创新。3) 真正的突破通常来自于完全相反的策略,即通过扩展搜索和学习能力来充分利用计算资源。尽管成功令人欣慰,但这种成功往往带有苦涩,因为它是在放弃了受青睐的、以人为中心的方法后才实现的。


    从这些经验中我们应该学习到的第一个重要启示是,通用方法的强大力量在于其扩展性,即使在可用计算资源极大增加的情况下也能持续有效。搜索和学习是目前看来能在这种环境下无限扩展的两种方法。


    第二个重要启示是,关于大脑的实际工作原理的极端的复杂性;我们应该放弃试图以简化的方式来理解大脑的工作,如简单地处理空间、物体或对称性等。这些概念都是外部世界中复杂性的一部分,本质上是难以简化的。试图将这些复杂性内置于系统中是不切实际的。


    相反,我们应该专注于内置能够探索并捕捉这种任意复杂性的通用方法。这些方法的核心优势在于它们能找到有效的近似解决方案,但寻找这些解决方案的过程应该是自动的,而不是依赖于我们的直接输入。我们希望人工智能代理能够自主探索和发现,就像我们一样,而不是仅仅复制我们的现有知识。将我们的发现硬编码到AI系统中,不仅限制了系统的学习潜能,还加重了我们理解这些发现过程复杂性的困难。


    观点


    Rich Sutton《苦涩的教训》原文到这里就结束了,我想聊聊我自己的观点和感悟:


    人类总是习惯将自己对于世界的认知注入于亲手打造的系统之中,但是历史一次又一次的证明这种有效性只是短期的,从地心说到日心说,从经典力学到量子力学,从专家系统到大语言模型,当每一次科学革命到来之时,那些越是符合直觉的经典理论越是岌岌可危。


    《金刚经》有云:“一切有为法,如梦幻泡影”,我们当前观察到现象和规律,可能都只是暂时的。那这个世界运转的逻辑到底是什么?


    设想一下,如果你是这个宇宙的程序员,拥有无穷的时间和算力资源,你会如何设计这个世界? 




    智能设计论者说:沙漠中不会凭空产生精美的手表,所以精密的人体一定是被有意设计出来的。但是你作为一个想要摸鱼的程序员,其实对于细致入微的设计全宇宙中所有的生命体可能并没有太大兴趣,你只关心能否用最简单的算法让DNA持续地演化,演化出智能体,再让他们做那些你不想做的事情。


    遵循“缩放法则(Scaling Laws)”依然是你最佳的选择,因为你不用操心这个宇宙的每一个角落的细节,你只要设计最基本的法则,并允许系统在这些法则指导下自我组织和进化,剩下的事情交给无限的时间和算力就好了。


    正如480年前,哥白尼坚信上帝相信简洁优雅的规则,因此有了日心说:“天体运动的真实模型应该是基于数学的完美和简洁,而日模型相比地心模型在数学上更为简洁和优雅”。


    而今天,AI领域的进展告诉我们“简洁优雅的数学模型”依然有效,只要简洁的设计和上大尺度的数据训练,就能拥有强大的鲁棒性和智能性的系统。


    佛法有云:“缘起性空;自见成佛”。这可能才是我们这个世界的本来面目。




    欢迎订阅我的播客和知识星球。




    17 April 2024, 11:30 pm
  • 9 minutes 56 seconds
    聊聊Mixlab Node:AI时代如何重塑内容创作产品与社区生态

    前天,我参加了洪宇的《遇见AIer》的播客节目的录制,聊了聊ComfyUI的Mixlab Node背后的故事和AI产品经理关心的一些话题。如果感兴趣,大家可以去听下这期节目。


    # 缘起

    2023年10月,我和Shadow一拍即合,共同发起了“ComfyUI中文爱好者社区”,并把Mixlab Node纳入了议程。目前,社区已聚集了超过1000名ComfyUI创作者,包括行业内的ComfyUI大咖。Mixlab Node目前已获得600多个星标。


    https://github.com/shadowcz007/comfyui-mixlab-nodes



    我和Shadow都对AI创作工具及社区抱有浓厚兴趣。去年,我们见证了AnimateDiff和ComfyUI的崛起,并意识到国内迫切需要一个ComfyUI学习社区。这不仅为AI创作爱好者提供了一个交流和学习的平台,也吸引了一批热情的开发者和创意人才来共同开发ComfyUI的插件和工作流,这也促成了Mixlab Node的诞生。



    # 社区驱动型产品


    简而言之,Mixlab Node是基于Stable Diffusion和ComfyUI构建的节点工具。它的核心特色在于ComfyUI的高度灵活性,通过模块化设计让各种插件(或称为节点)能够无缝串联。这种设计使得用户可以轻松调用各类AI模型和处理模块,完成从图片生成到视频制作,甚至是接入大语言模型进行互动游戏的多样化工作流程。


    ComfyUI的开放性和模块化让开源社区的开发者能够迅速整合最新技术和模型到用户的工作流中,而我们的MixLab Node就是其中之一。


    Mixlab Node最大的特点就是“社区驱动开发”,在我们社群里面,开发者和创作者每天都会讨论大量的新技术动态和使用需求。我们的功能往往源自社区内部的实际反馈,确保了产品的实用性和创新性。


    例如,Mixlab Node加密功能正是基于社区反馈而生。当时我们社群中的一些大佬的工作流被一些人冒名顶替,引起了社群内的广泛关注。开源并不是做慈善,一个良性的生态环境,既要开放共享又要尊重个人创作权益,这样开源才有持续发展的动力。所以我们想有些工作流只有通过原作者提供密码才能继续使用。通过这种方式,不仅可以让创作者的原创作品免受盗用,还可以让优秀的创作者更好地活下去。


    相似的案例不胜枚举。Mix Node正是在这样一个开放、共享的环境中不断成长和优化的。通过与社区成员的紧密合作,形成了一个积极的、自我增强的闭环系统。这不仅推动了MixLab Node不断完善和进步,也为开源的AI创作贡献了自己的一份力量。


    # JUST DO IT的开发模式


    我和Shadow的首先达成的共识是,在AI时代我们必须要抛弃掉传统的思维方式。


    在传统的软件和互联网产品开发过程中,从需求收集到产品发布通常需要经历多个步骤,包括需求分析、文档撰写、评审会议,以及最终的开发迭代,这一系列过程往往耗时长达数周,然而,由于AI技术快速迭代,这种模式很难跟上技术进步的步伐。


    我们更提倡“Just do it”——有好的想法,那就先做了再说。我们直接从社区收集到好的创意就可以开始动手做开发,不需要给领导写报告,不需要撰写需求文档,更不需要走评审流程,做好后交给社群中的小伙伴们测试反馈。只有这样我们才能打造出更酷的节点。


    另外,通过使用GPT,可以把开发的时间极限压缩。例如,我们在GPT的帮助下,只花了1到2天内完成录屏工作流的开发和上线,这放在传统企业,起码两周才能搞定。


    录屏的需求的灵感来源于我们自己的创作视角的切换,我和Shadow都曾做过设计师,我们都想把自己的草图让AI重新渲染,但是主要的创作工具都在PS等传统软件上 ,因此想了个录屏功能,然后再考虑如何通过技术手段来实现。最后,我们发现录屏节点搭配LCM模型可以快速将草图变成精美的图片,这个功能出了以后,社区里面创作者也反馈非常积极,得到了很好的验证,也给我们带来了极大的成就感。


    “Just Do It”模式并不完美。随着MixLab Node功能的不断丰富,产品逐渐变得庞大,这引发了关于用户认知清晰度的担忧。Shadow建议是先集中实现功能,然后再考虑精简和优化。我们最终的期望是提供更完整的软件产品体验,而不仅仅是单一功能的模块。


    虽然初期采取“Just do IT”的策略有其必要性,但随着时间的推进,我们也会考虑如何降低用户的学习门槛。因此,在接下来的发展方向上,将包括开发教程和案例,帮助用户更好地理解和利用MixLab Node,同时也探索新的商业模式以确保项目的可持续性。


    # AI赋能个人成长


    在开发MixLab Node过程中,ChatGPT和GPT-4在提升开发效率中起到了关键作用。


    我以前做过前端开发,熟悉Javascript,但是对于Python一直都是一知半解。从前要掌握新的技术领域,我通常需要购买在线课程或书籍,先自学清楚然后才能动手实践。但是今天,我们只要向AI提出功能描述,它就能生成代码。通过持续地调试和优化,我们就可以实现所需要的功能。这种方法极大地缩短了学习与开发周期,仅仅三年前,这样的场景还是难以想象的。


    通过与AI工具的协作,即使是非专业程序员也能拓展自己的技术领域,提高对新技术的适应能力和问题的解决能力。


    在未来,真正能够称之为“精英”的,将是那些具备鲁棒性和深刻业务理解的人。


    鲁棒性也是称之为说泛化能力,是指你不会将自己限定在特定的岗位角色中。通过有效利用AI,你可以跨领域地解决问题。


    此外,深刻业务理解能力也依然重要,这样你才能识别并聚焦于有价值的真问题。这样全面的技能和视野,将使你在AI时代中突破重围,不仅仅是完成别人给你的任务,而是成为解决关键问题的关键人物。


    # 成为AI产品经理


    首先,无论是哪个领域的产品经理,基本功是必不可少的。这包括但不限于对需求的深刻分析与洞察、对用户和产品的深入理解。这些技能对所有产品经理来说都是共通的。当然,AI领域的特殊性在于,你需要对底层的技术手段有所了解,了解它们的潜力和限制。


    其次,运用AI能力不能异想天开。许多人有过高的期待,认为AI可以做到任何事,但实际上它的能力是有限的。我们需要理解这一点,并能基于此制定合理的产品策略,是AI产品经理的重要技能之一。


    因此 ,产品经理需要掌握目前流行的AI工具和“提示工程(Prompt Engineering)”。因为在AI的世界里,你需要知道如何与AI进行有效地交流,才能扮演好“用户与AI之间的桥梁”。更重要的是,当AI的回答不尽如人意时,需要知道如何调整你的产品方案,让它能获得更好的结果。这背后的逻辑和优化技巧,是很多传统产品经理所缺乏的。


    然后,培养自己的对社群的感知能力。AI产品的开发和迭代,往往需要用户的直接参与和反馈,需要建立和维护一个活跃的创作者社群。只有更接近用户,更好地理解他们的需求和期望,从而共同创造出更符合用户需求的产品。


    AI产品经理不仅要有坚实的基本功,还要懂得如何与AI合作,如何与用户合作,搭建AI与用户的桥梁。我相信,只要你愿意不断学习、实践并保持开放的心态,你一定能在AI时代的产品管理领域中找到属于自己的位置。


    # 尾声


    在这个迅速变化的时代,开放的创新文化和社区的集体智慧将成为推动技术前进和个人发展的核心力量。这不单单局限于开源AI工具或社区的构建,而是关于在AI的浪潮中我们如何持续创新、适应变革,并推动个人的成长。


    我们不仅需要重新审视传统的开发模式、学习方法和工作理念,还思考如何作为个体和社区共同前进。这对于任何在快速演进的世界中寻找自己定位的人来说都是深刻的思考题。


    我们不仅只是学会适应,还需要积极参与到变革过程中。我们既是技术进步的贡献者,也是个人及社区繁荣发展的推动者。


    欢迎加入“ComfyUI中文爱好者社区”!


    8 April 2024, 12:43 pm
  • 11 minutes 17 seconds
    AI时代,程序员会失业吗,还需要学习编程吗?

    最近越来越多人在问类似的问题,AI都那么厉害了,还需要学编程吗?计算机专业依然吃香吗?特别是昨天很多人看到了Devin AI,更是产生了一种“是不是程序员要失业了?”的疑问。


    # AI 程序员能做什么?


    就在前几天,仅仅成立两个月的公司Cognition发布了一款Devin AI 的产品。它被宣传为史上第一款AI程序员。在演示中,Devin AI拥有自己的命令行、代码编辑器和浏览器等工具,可以自己制定计划、执行任务和解决问题,它可以独立完成整个软件的开发和构建的工作。


    另外,根据官方宣传,Devin甚至拥有“成长”的能力,它可以通过阅读文章,学习原先不懂的技术,还会自主寻找程序中的错误,并且进行修正。


    从宣传来看,Devin要比之前Copilot类似的AI编程助手要更进一步,更像一个能够独立完成开发任务的程序员。这不仅代表着AI独立完成开发工作的可行性,也激发了公众对“AI是否能替代程序员”的讨论。


    也有网友分析,其实Devin AI并没有想象中的那么厉害:首先,Devin的底层技术是基于GPT4,它的使用成本比普通程序员更高;其次,程序员的面试题并不难,ChatGPT也能胜任;还有就是执行的任务过于简单,和人类相比还是有较大差距。所以,人类程序员目前还是比较安全的。


    虽然如此,但是随着大语言模型的性能越来越好,在可预见的未来,AI程序员必然将软件开发过程中起到关键性的作用。


    # 有了AI还需要学编程吗?


    会不会现在学了编程,以后就没用了?


    我想这个问题可以类比为“有翻译软件了还需要学英语吗?”我相信很多人回答是:学习英语依然重要。


    诚然,英语已经成为许多人综合素质的一部分了。翻译软件不能百分百解决我们的需求。例如,要查询最新最全的论文和资料,懂英语可以让我们无损获得原本的信息,而翻译软件只是方便我们快速的浏览和过滤信息的工具。另外,学习英语不仅仅是学习语言,也是学习一种文化和思维方式。这样我们才能更好地与世界接轨。同样的逻辑也适用于AI和编程。


    首先,编程只是软件开发的一部分,编程是打开计算机世界的一把钥匙,计算机科学的复杂性远远超出了编程本身。它包括系统架构设计、网络安全、需求分析、用户体验和项目管理等诸多方面。这些综合性的知识和技能,才是软件创新基础。即使AI能够自动化编程任务,也需要人类来解决更复杂的问题,需要人类保持对行业趋势的敏锐洞察,他们需要理解业务需求,与非技术背景的团队成员进行有效沟通,确保技术解决方案能够满足业务目标。


    另外,编程不仅仅是写代码,它是解决问题的一种方式,也是一种思维训练。学习编程能够帮助人们培养逻辑思维、系统思维、创新思维以及动手解决能力。这些能力在AI时代尤为重要,不仅限于技术领域,同样适用于生活的各个方面。随着技术的不断进步,新的工具和平台层出不穷,个人需要能够适应这些变化,还要能在变化中找到创新的机会。这种适应力和创新力对于个人发展、职业生涯乃至企业的竞争力都是宝贵的资产。


    除此之外,编程并不是计算机学科的专利,它也是一种跨学科学习工具。在尝试解决来自不同领域的复杂问题时,编程能够通过数据分析、可视化、机器视觉和仿真模拟等技术手段,帮助整合和应用多学科知识,从而促进创新解决方案的产生。这种跨学科的视角不仅拓宽了我们的思维,也为AI程序员的任务分配提供了更加清晰的指导。让我们能够从更综合的视角理解和应用技术,进而更有效地推进项目和研究工作的进展。


    其实,AI本身还有很多需要迭代的地方。例如,AI科研论文、设计AI算法、提升AI性能、定制AI模型以及AI伦理安全方面,人类依然扮演着无可替代的角色。换句话说,正是因为AI的发展,为计算机专业人才创造了更多的挑战和机会。对于准备想实现自己的想法人来说,现在是学习编程的最好时机,学习编程可以更好地应用AI的能力,助我们实现很多的创意和想法。


    因此,面对“有了AI还需要学编程吗?”这个问题,我的回答是:绝对需要。


    # 讲讲我的经历


    我大学是学工业设计的,算理工科中的文科专业。原本编程这件事情对我来说是一件很有畏惧感的事情,大学仅有一门C语言差点挂科。但由于我对于互联网一直感兴趣,还有自己做产品的冲动,所以我临近毕业的时候,去学习了编程和软件工程相关知识。而之后又做了程序员、产品经理还有创业者,一路走来,有挫折也有收获。


    过去,我经常刻意隐瞒自己做开发的经历,生怕别人认为我的职业定位不够专注。但是多年以后发现能帮助到我的恰恰是跨学科能力。


    如果今天你是一位想自主创业的产品经理,究竟学过编程和不会编程的人在做产品方面到底有什么区别?


    首先,学过技术的产品经理在理解技术层面的细节上有明显优势。能更好地与研发团队沟通,能更精确地传达需求,能更好地理解团队面临的挑战,并在技术可行性和资源分配方面做出更合理的决策。这种深入的理解有助于建立团队成员间的信任和尊重,从而促进团队合作和项目的顺利进行。在这些年里,我和大部分开发同事之间都维持着不错的关系,因为团队合作没有什么比理解更重要了。


    其次,具备编程背景的产品经理在设计产品时,能更好地考虑到实现的复杂性和成本,会更重视需求价值,可以更好地制定MVP(最小化可行性产品)策略。特别在产品的早期规划阶段,你就能预见到某些功能的实现可能会遇到的技术障碍,不会把产品功能设计得过于复杂或者理想化,从而在设计上做出更加现实和经济的选择。让产品赢得了低成本地快速验证市场的时间。这种前瞻性不仅能够节省开发时间和成本,还能避免在项目后期进行大幅度的修改,提高了产品开发的效率和成功率。


    再者,了解技术原理,也能够让我们更好地把控产品体验。会去主动思考影响产品体验的技术指标,不会想当然地做一些脱离实际场景的理想化的功能。通过能够更好地评估不同设计方案的技术实现难度,能在设计和功能性之间找到最佳平衡点。这样的产品经理能够推动设计和技术团队更紧密地协同工作,共同创造出既美观又高效的产品。


    此外,编程经验还赋予了产品经理对新兴技术的敏感度和适应能力。AI时代,新技术层出不穷,具备技术背景的产品经理拥有较强的技术的敏锐度,能够更快地理解这些新技术如何被应用到产品中,以及它们对市场和用户体验可能带来的改变。例如,我经常会去Github上查看一些有趣的开源项目,学习一些新的技术课程,也会思考如何把它们应用到自己的项目和工作中。这种能力使得产品经理能够领导团队走在技术发展的前沿,创造出创新和有竞争力的产品。


    最后,通过学习编程,我还获得了一系列强大的思维工具,包括面向对象的编程思想、设计模式、以及统一建模语言(UML)等。这些工具提升了我的逻辑思维和系统思考能力,教会了我如何将复杂问题逐步分解成可管理的小任务,帮助我们对问题进行抽象和建模,让我更好地理解事物的运转模式,从而找到机会点。这在产品规划、市场分析还是项目管理中,都极大地帮助了我。


    步入生成式AI时代,大语言模型已经成了我不可或缺的助手。以往有很多灵光一现的创意,因为我的技术视野的限制而无法实现,它们最终只能沉睡在我的思绪中,逐渐被遗忘。但如今,我的一些突发奇想的灵感交给了GPT之后,它能很快地生成代码。虽然代码可能充满了错误,但GPT帮我快速拓展了技术视野,引导我去深入研究,并让我能对代码进行细致优化。例如,我在ComfyUI的Mixlab-Node的开源项目的开发过程中,有很多想法的实现就是通过与GPT协作来完成。


    因此,作为一名独立开发者或产品经理,我们应当把AI程序员视作一位协作伙伴。正是因为有了它的帮助,让我们可以在实现更有趣的功能的同时,节省下更多时间,让我们可以用来考虑赚钱的事情。


    # 总结


    当我们面对Devin这样的AI程序员的时候,我们并不要为程序员岗位感到过于的担忧。编程将会变成像外语一样的普遍性能力,人类通过学习编程,我们可以更好地发挥机器的能力。


    在AI的帮助下,越来越多的普通人可以实现自己的创意和想法,成为自己事业的掌舵人。在AI时代,必然是超级个体崛起的时代。


    在传统企业管理中,员工们扮演的是流水线上的零件。但是在这个AI变革的新时代,我们不应当把自己角色局限在某个零部件上,拥有灵活的思维、开阔的视野和敏锐的洞察力显得更为重要。


    只要我们把握好时代趋势,技多并不会压身。请快行动起来吧!

    欢迎加入ComfyUI中文爱好者社区,ComfyUI是一套灵活的AIGC工作流搭建工具。目前我们集结了一群跨界的设计师、程序员 产品经理和创业者。我们正在探寻AI的生成技术在各行各业的解决方案,每日社群里面都会有高质量的讨论。



    21 March 2024, 10:28 am
  • 36 minutes 40 seconds
    SORA会是职业发展的革新引擎吗?【下】

    窜台参与麦田老师的播客录制,

    欢迎大家订阅她的播客专辑《麦田的职场圆桌会议》


    AI能成为你的小情人吗?

    AI如何感知我们的情绪?

    科技飞速发展下,我们如何抓住机遇,而不被AI



    本期播客带你深入探讨AI时代,我们该如何勇敢面对挑战,拥抱变革,用知识赋能自己的人生旅程!跟我一起思考,变得不可替代!

    【本期嘉宾】

    郝俊慧: 《IT时报》主编 资深媒体人  在科技报道领域深耕近20年,长期关注互联网、信息通信、人工智能等前沿科技。《IT时报》是中国最早的通信类媒体之一,前身为《上海邮电报》,具有近60年的产业传播历史。

    鑫声心生  :化学博士,双一流大学材料学科博士生导师,喜马拉雅播客智库成员,在职业规划,前沿科技方面著有多部学术著作,喜马拉雅《七点早知道》、《消息拌饭》等栏目担任特约嘉宾。      曾主持多项国家与省部级科研项目,在国际高水平期刊发表论文50余篇,授权国家发明专利5项,受邀在国际学术会议作报告10余次,担任碳中和领域知名期刊Carbon Capture Science & Technology(碳捕集科学与技术)创刊编委。生物质产业碳中和技术联盟东北区负责人,国际碳捕集协会(IACC)执委。
    PM熊叔:产品经理/设计师/程序员,研究方向是AI创作工具和创作社区Mixlab无界社区和ComfyUI爱好者社区发起人

    02:01 AI的快速发展:挑战与机遇并存,我们应该怎么办?

    04:04 AI监管与安全性:全球共识的挑战与前景展望

    06:05 人工智能带来的变革:找到共识的挑战与前景展望

    09:03 人工智能工具的崛起对影视制作行业的影响及未来职业变革

    12:05 AI时代的创意表达:掌握AI技能,成为多功能手的可能性

    15:10 人工智能时代的个人成长:如何提升效率与竞争力?

    18:09 培养孩子独立思考能力:保持想象力与逻辑分析能力的平衡

    21:13 培养孩子立体人格:中学阶段学习的重要性与魅力

    24:15 通用能力与专业能力:职场中的人才选拔与培养

    27:18 培养孩子自主学习的能力:AI时代的关键竞争力

    30:20 拓展认知,提升独立判断能力,迎接人工智能时代挑战

    33:22 勇敢拥抱人工智能,迎接时代的变革!


    3 March 2024, 12:22 am
  • 37 minutes 21 seconds
    SORA会是职业发展的革新引擎吗?(上)

    窜台参加麦田老师的《麦田的职场圆桌会议

    欢迎大家订阅她的播客专辑。


    【本期嘉宾】

    郝俊慧: 《IT时报》主编 资深媒体人  在科技报道领域深耕近20年,长期关注互联网、信息通信、人工智能等前沿科技。《IT时报》是中国最早的通信类媒体之一,前身为《上海邮电报》,具有近60年的产业传播历史。

    鑫声心生  :化学博士,双一流大学材料学科博士生导师,喜马拉雅播客智库成员,在职业规划,前沿科技方面著有多部学术著作,喜马拉雅《七点早知道》、《消息拌饭》等栏目担任特约嘉宾。      曾主持多项国家与省部级科研项目,在国际高水平期刊发表论文50余篇,授权国家发明专利5项,受邀在国际学术会议作报告10余次,担任碳中和领域知名期刊Carbon Capture Science & Technology(碳捕集科学与技术)创刊编委。生物质产业碳中和技术联盟东北区负责人,国际碳捕集协会(IACC)执委。
    PM熊叔:产品经理/设计师/程序员,研究方向是AI创作工具和创作社区Mixlab无界社区和ComfyUI爱好者社区发起人

    【精彩观点】

    02:02 AI时代来临,对职业发展和创业的影响有多大?

    04:04 AI生成视频:从拼图到动画的突破之路

    06:06 SORA视频生成技术的突破:从拼图到现实世界的模拟器

    09:12 技术的飞跃:从三维建模到真实世界模拟的突破

    12:16 真相与谎言:人工智能改变我们对现实的认知

    15:19 职业规划与人工智能:拥抱变化,迎接挑战!

    18:23 人工智能时代下的专业型人才培养:挑战与机遇

    24:32 AI时代的就业挑战:如何寻找新的创意与发展机会?

    27:35 AI时代的独立思考与持续学习:文科生、程序员、咨询师的就业前景

    30:34 文科生的春天来了:人工智能时代下的新职业机会

    33:43 AI时代的共情能力:文科生的的优势与挑战



    2 March 2024, 9:18 am
  • 9 minutes 35 seconds
    给大家看的AI绘画教程:如何使用AI来设计炫酷的产品概念图

    这周,我的AIGC作品《赛博机甲AIPC笔记本》被比赛主办方联想官方账号转发和点赞了!真是万分荣幸!其实,使用AI绘图工具做产品设计并没有想象中的难。关于如何使用AI设计产品概念图,我专门写了一篇零门槛的教程,希望能够帮助大家参赛拿奖。


    学完这篇文章你可以掌握:

    1.了解目前有哪些好用的AI绘画平台

    2. 学习如何写提示词来设计自己的产品

    3.参加AIGC比赛,提升中奖概率


    现在,让我们马上步入正题。


    一、有哪些可以好用的AI绘画平台?


    无论是在线服务还是本地应用,AI绘画工具的多样化和易用性为创意表达打开了新的大门。从初学者到专业艺术家,每个人都可以找到适合自己的工具,将想象力转化为令人惊叹的艺术作品。


    在线使用的平台,主要有如下几个:

    1. Midjourney (https://www.midjourney.com/)   - 特点:极为优秀的AI绘画能力,但需付费使用。   - 是否有免费额度:否。

    2. DALL-E (https://labs.openai.com/)   - 特点:同样提供顶级的AI绘画服务,属于付费范畴。   - 是否有免费额度:否。

    3. Bing (https://www.bing.com/images/create)   - 特点:优秀的AI绘画工具,且完全免费。   - 是否有免费额度:有。

    4. Leonardo.AI (https://leonardo.ai/)   - 特点:提供良好的AI绘画体验,免费使用。   - 是否有免费额度:有。

    5. Mage.Space (https://www.mage.space/)   - 特点:良好的AI绘画能力,免费且提供多种模型选择。   - 是否有免费额度:有。

    6. 百度文心一阁 (https://yige.baidu.com/)   - 特点:支持中文   - 是否有免费额度:有。

    7.  阿里通义万象 (https://tongyi.aliyun.com/wanxiang/creation)   - 特点:支持中文,   - 是否有免费额度:有。


    总的来说,如果你想要有良好的创作体验Midjourney和DALL-E是最理想选择,其卓越的创作能力是业内公认的。而对于预算有限或希望免费体验AI绘画的用户,可以尝试BingAI的绘画生成能力,因为BingAI绘画接入的就是GPT的DALL-E。另外如果想体验稍微完整的AI绘图能力Leonardo AI也是不错的选择。如果我们受网络所限,百度文心一阁和阿里通义万象也是目前国内用户的选择。如果你更倾向于在本地设备上使用AI绘画工具的用户,首选 Stable Diffusion,主要有Auto11111的WebUI和ComfyUI。另外,还有一些开箱即用的客户端工具,例如,Draw Things和Diffusion Been等。


    二、如何撰写AI绘图的提示词?

    我们在使用Midjourney、DALL-E、Stable Diffusion等文本生成图像工具的时候,我们需要设计文本提示词(prompts)来指导AI生成图像过程,最终获得我们想要的效果。

    我们可以将AI想象为一名正在学画画的中学生,你现在正在扮演一位美术老师,为他布置作业。

    我们应该怎么出题呢?下面是一些方法:

    1. 需要明确具体:

    描述你想要的图像时,尽可能具体和详细,包含场景描述、物体、颜色、情感氛围、风格等。例如,我们出题的时候不说“一辆车”,而是说“一辆红色的跑车在沙滩上”。另外,需要尽量不要有抽象的隐喻,这位学生有可能无法理解。

    2. 使用关键词:

    使用关键词来描述图像的主要元素,如对象、颜色、环境、气氛,虽然有些比较聪明的学生(如Dell-E和Midjourney V6)已经可以理解完整的句子所表达的语义,但是关键词依然是核心。如果我们通过特定的关键词可以帮助AI更明确的表达,特别是一些艺术风格术语,如“印象派”、“超现实主义”或具体的颜色和纹理描述。

    3. 不要过于复杂:虽然要具体,但是过于复杂的提示词可能会使模型难以理解和执行,我们需要找到描述清晰具体但又不过分复杂的平衡点。

    4. 渐进式迭代:不用一次到位,我们可以通过实验和调整描述来获得更好的结果。

    5. 结构性陈述:好的提示词包含不同方面的描述,如主题、媒介、风格、艺术家、细节、颜色和光照等等,如果我们遵循一定的结构,我们可以写出更明确具体的提示词,帮助这位考生更好地理解你的需求。下面是一个比较常用的提示结构:


    Prompt = (主体内容) + (环境设定) + (气氛/灯光) + (构图) + (风格参考)


    1. 主体内容:一款未来风格的电动汽车。

    基础:一款电动汽车。

    基础+修饰:一款具有流线型设计的电动汽车。

    基础+进一步修饰+画面故事:一款流线型设计的电动汽车,在光滑的公路上高速行驶,车身表面反射着周围的城市光线。

    2. 环境:车辆行驶在一条现代化的高架桥上,背景是一个繁华的未来都市,高耸的摩天大楼和光滑的玻璃幕墙反射着夜晚的灯光。

    3. 气氛:一种科技感和速度感的结合,展现出未来交通的便捷和高效。

    4. 灯光:选择高对比度的照明,强调汽车的轮廓和流线型的设计,同时反映出城市的繁华夜景。

    5. 色彩:使用富有科技感的冷色调,如银灰色、深蓝色和白色,以突出未来感和清洁能源的概念。

    6. 构图:采用动态的角度,如斜视角或低角度视图,以强调汽车的速度和运动感。

    7. 风格参考:参考现代汽车设计和科幻电影中的未来城市景象。


    最后,我们将这些描述的关键词整合成一段文本描述:


    电动汽车,流线型设计,高速公路,未来城市,夜景,摩天大楼,光滑玻璃外墙,高对比度照明,冷色调,科技感,银灰色,深蓝色,白色,干净能源,动态视角,斜角,低角度视图,现代汽车设计,科幻电影风格。


    如果使用国外的平台,我们可以使用翻译软件将提示词变成英文:


    Electric car, streamlined design, futuristic city, night scene, skyscrapers, smooth glass facades, high-contrast lighting, cold color tones, technology theme, silver-grey, deep blue, white, clean energy, dynamic perspective, oblique angle, low-angle view, modern car design, sci-fi movie style


    这里是我在Mage.Space的使用SDXL模型效果如下图:



    如果条件有限,你可以尝试国内的平台,像百度文心和阿里通义都支持中文,下面是我这两家平台生成的效果,如果有兴趣可以点击查看大图。



    三、如何使用AI进行产品设计?


    当我们要做产品设计的时候,我们需要对上面的基本结构拓展:


    Prompt = (产品功能 + 风格外观 + 材料构造 + 特殊要求 + 设计灵感)+ (环境设定) + (气氛/灯光) + (构图) + (表现风格)


    首先,我们的产品主体描述需要更加具体,可以包含面几个维度:


    产品功能:描述产品的主要用途或功能。

    风格外观:指定设计风格或外观特征。

    材料构造:提及所使用的材料或构造方法。

    特殊要求:任何特定的设计要求或限制。

    设计灵感:参考某些著名产品或设计的风格特征。


    另外,我们可以加上一些工业设计常用表现手法:3D渲染风格、CG渲染、手绘、马克笔、彩色铅笔、设计草图等,下面是不同的表现手法。




    内容主体:

     1. 产品功能:AI强大个人助理笔记本电脑

     2. 风格外观:融合《新世纪福音战士》初号机的设计元素,动态棱角设计,霓虹绿和紫色高光

     3. 材料构造:光滑金属外壳,带有在不同光线下变色的异彩效果

     4. 特殊要求:先进的全息触摸屏技术,3D全息交互

     5. 灵感参考:高科技的个人电子设备,科幻电影中的设备,如《银翼杀手》中的未来科技


    表现风格:CG渲染、高科技、未来感

    环境设定:高科技的未来实验室,多面全息显示屏,浮动的交互式面板,赛博朋克风格的未来城市背景

    气氛灯光:神秘的蓝色和紫色背光,营造出高科技和未来感的氛围

    构图:高角度俯瞰,笔记本电脑位于中心,周围环绕着先进的设备和充满活力的城市景观


    我们得到以下提示词:

    未来风格AI强大个人助理笔记本,融合《新世纪福音战士》初号机设计元素,动态棱角设计,霓虹绿紫色高光,光滑金属外壳,异彩变色效果,先进全息触摸屏技术,3D全息交互,高科技未来实验室,多面全息显示屏,浮动交互式面板,赛博朋克风格未来都市背景,神秘蓝紫背光,高科技感,未来感,高角度俯瞰,中心位置笔记本,周围环绕先进设备和动感城市景观


    我们可以使用翻译软件将提示词翻译成英文:

    Futuristic AI-powered personal assistant laptop, integrating design elements from Neon Genesis Evangelion's Unit-01, dynamic angular design, neon green and purple highlights, sleek metal casing with iridescent color-changing effect, advanced holographic touchscreen technology, 3D holographic interaction; set in a high-tech future laboratory with multi-faceted holographic displays, floating interactive panels, against a cyberpunk-style futuristic city background; mysterious blue and purple backlighting, high-tech and futuristic atmosphere; high-angle overview composition with the laptop at the center, surrounded by advanced equipment and a dynamic cityscape


    下图OpenAI的DALL-E的生成结果,这是目前表现最到位作品,我们不得不佩服业界顶流的创造力。


    这个是Stable diffusion的SDXL模型生成的结果,虽然环境氛围表达到位了,但是缺少创造力。


    百度文心和阿里通义万象,效果大家自行评价。



    百度文心:https://yige.baidu.com/


    阿里通义万象:https://tongyi.aliyun.com/wanxiang/creation


    另外,优秀好的作品介绍也很重要。我们可以使用ChatGPT或百度的文心一言来帮助我们写设计介绍,将这个文字复制给大语言模型:


    请扮演一位网络营销高手,帮我写条微博,要求请根据以下产品的描述,从这款作品的作者的角度介绍作品

    ```

    [这里写上你刚刚在创作过程中使用的Prompt...]

    ```




    四、参加比赛,准备拿奖


    目前,联想正好在做一个AI PC的设计比赛,奖品还不错,而且作品提交次数没有限制,非常适合我们这些掌握AI绘图的普通人参赛。


    关于这个活动介绍,请参看我们之前相关的文章:2024年会否进化为 AI PC 产业元年?Mixlab&WebN 喊你来组队比赛


    奖品如下:

    一等奖 1 位ThinkPad X1 carbon AI 超级本 2024

    二等奖 3 位联想小新 Pro16 AI 超能本 2024

    三等奖 10 位 价值 1999 AI 礼包

    荣誉奖/最具传播力  5 位 价值 999 AI 礼包


    为了更好的帮助大家,我们专门搭建了专门为大赛文生图服务,你也可以尝试通过这个服务来体验文生图的魅力,文末有扫码入群,免费使用:


    然后,我们把作品和介绍发到微博或者小红书,记得带上:“#一起联想AIPC#” 并 “@联想中国 ”。


    最后,为了提升中奖几率,我们可以把微博地址发群里,让大家一起点赞、评论、转发!


    最后,欢迎大家加入我们的比赛互赞群。



    如果你有兴趣学习更具有专业性的AI绘画技能,欢迎请加入我和Shadow发起的ComfyUI的知识星球。



    14 January 2024, 1:29 pm
  • 9 minutes 17 seconds
    AI时代下的超级个体:与Rui畅聊AI实时互动游戏


    上周日,我、Shadow和Rui做了一次在线连麦的直播,背景是Rui在上周发布并开源了一款名为《西游大绘战》的AI实时互动游戏。这款游戏在我们ComfyUI中文社区产生了轰动,许多人都没有想到ComfyUI还能这样玩。




    Rui的工作流发布地址https://openart.ai/workflows/profile/rui400


    # 什么是AI实时互动游戏?


    AI实时互动游戏,主要是以大语言模型为核心驱动,用户通过与游戏实时互动生成具有无限可能性的剧情。AI实时互动游戏不仅限于文字,还可以结合Stable Diffusion图像生成能力,创造一个丰富的多模态游戏世界。


    Rui在《西游大绘战》的开发中,利用ComfyUI的节点整合GPT、SD模型和TTS等AI技术,创造了具有独特游戏体验的Workflow(AI工作流)。也再次证明了ComfyUI的灵活性和无限可能性。





    他首先利用 GPT 生成每一话的故事文本和选择,同时,将故事文本转换为自然生动语音,增强了玩家的沉浸感。

    另外,还通过GPT生成Stable Diffusion的Prompt(提示词),用于创造游戏故事场景对应的画面,使得游戏画面能够根据玩家的选择动态变化。


    但将AI技术融合到这种全新游戏设计中也面临了诸多挑战。对于如何处理和控制好AI生成的内容,Rui需要学习大量的跨领域知识,做大量的技术调研,并且还需要像工程师一般不断调试Prompt和参数,才能把控好自动生成的游戏体验。


    # AI时代下的“黑客与画家”




    在保罗格雷姆的《黑客与画家》书中,提到了黑客与画家的诸多相似性:他们都是伟大的创作者,但伟大的作品并不都是事先严密设计好的,他们为了实现一个创新的灵感,能够反复调试和打磨,他们不会因为困难而退缩,他们总能找到常人不曾想到的解决方案,在作品完成的那一刻就注定了它的杰出和伟大。

    面对如此超前和复杂的游戏项目,Rui在《西游大绘战》项目中一个人扮演了一个团队的角色,从策划、设计再到开发制作。但令人惊讶的是,作为一名有十几年游戏原画设计经验的设计师,Rui之前并没有任何编程经验。


    今年随着生成式AI的技术崛起,在SD和ComfyUI影响下,游戏行业正在使用AI工作流快速地生成原画设计来提高设计创作的效率,为游戏行业带来了颠覆性的变革。对于很多传统设计师来说这可能是个威胁和挑战,但Rui意识到这是一个转型和探索新领域的机会。他开始研究如何将AI技术融入游戏设计。


    Rui制作的Workflow堪称艺术作品,为了达到精细的效果,使用了大量的高级节点和控制流程,将技术与艺术完美地结合在了一起,他最新发布的AI工作流作品“Cute You”,由AI生成的名人卡通形象栩栩如生,又一次引起了ComfyUI创作者们的广泛学习和关注。





    Rui是如何掌握这些能力的?他提供了一些学习建议:



    首先,他强调了获取信息源的重要性。他建议使用ComfyUI管理器作为了解节点信息的主要入口。并且定期在GitHub搜索ComfyUI相关节点更新。同时关注知名博主和官方博客分享的使用技巧。

    其次,深入理解SD的图像生成的流程和原理,这是灵活使用ComfyUI的基础 。对于非程序员,特别是设计师而言,学习ComfyUI是一个跨界挑战,需要改变过去的学习方式,需要多加实践探索 。

    另外,要多做实验。开始时不要过于雄心勃勃,因为教程更新也是滞后的,为了防止踩坑我们需要从基础开始,选择小项目,逐步增加复杂性。过程中,我们不要害怕失败,最终我们可以把这些实验经验整合到实际项目中。

    最后,加入专业的群和社区,在社区中提问和分享经验是学习的重要部分,这是学习新技能和解决问题的重要方式。在《西游大绘战》的工作流创作过程中,Shadow就给了很大的技术支持,帮助他解决很多自定义节点的问题和需求,这种合作也是一种前所未有的体验。

    除了以上四点,我认为Rui的能力,更关键在于他的探索未知的创新精神和不断精益求精的匠人精神。正是因为这些品质,让他编排的每个AI工作流都能成为优秀的作品,兼具科技与审美。也让他成为了黑客与画家的结合体。

    在对谈过程中,有社群的小伙伴提到了“超级个体”这个词,我想“黑客与画家”的精神就是AI时代下的超级个体的核心精神。

    # 如何成为AI时代的超级个体?

    在AI时代下的超级个体都是具有匠人精神的产品经理。他们兼具黑客与画家的品质,追求自由的创作精神和产品理想,能够打破社会分工的枷锁,勇于走出自己的舒适圈,能够不断探索和应用前沿的新技术,打造出一件件让人惊叹的作品。

    成为AI时代的超级个体,需要有以下这5个方面的能力:


    首先,需要是终身学习者。他们主动追踪技术发展的最新动态,以及这些技术如何应用于不同行业。他们通过自主学习和项目实践,不断增强自己的技术能力和理解力。

    其次,需要有很强的跨学科思维。
    Rui给我们起了一个很好的表率作用,他能够灵活的切换设计师和工程师的思维方式,他将艺术设计与AI技术相结合,创造出独特的游戏体验。超级个体通常能串联不同领域的知识,利用这些交叉点来创新和解决问题。


    另外,需要有创新和实验精神。在新兴领域中,不断实验是创新成功的关键。Rui的例子告诉我们,通过熟悉掌握AI工具,即使没有编程背景,也可以通过实验和探索获得实践的成功。这种实验精神,需要我们不畏风险勇于尝试。

    还有,就是解决复杂问题的能力。AI技术本身就是解决复杂问题的工具。超级个体需要具备分析复杂系统的能力,并使用AI作为解决方案的一部分。这要求具备良好的逻辑思维能力和系统化思维。

    最后,是建立强大的社会链接能力。虽然AI技术强大,但在实际应用中,跨领域的合作是必不可少的。超级个体通过加入社区参与分享和交流,传递更多关于学习方法、行业洞察以及社会发展趋势的思考。通过强化自己的个人品牌,能够获得更多与能力互补的超级个体的合作,拓展出更多职业发展和创作的机遇。

    总之,成为AI时代的超级个体,需要我们能够在快速变化的技术环境中,不断学习和成长,同时需要具备创新精神、跨学科思维和强大的问题解决能力。超级个体不仅关注技术实践的本身,还关注技术如何影响行业和社会发展。通过分享和交流,从而获得更加广泛的社会影响力,成为一个标志性的个人品牌。


    # 结语


    在前天,Rui为了实现自己新的工作流逻辑,在ChatGPT的帮助下编写了一个自定义节点,并提交到了Github开源。地址:https://github.com/rui40000/RUI-Nodes




    这是《黑客与画家》精神的最直接体现。也鼓舞了许多在ComfyUI中文社区中不擅编程的设计师。

    Rui勇于探索的精神和杰出的创作力,让他打破了传统分工角色的限制。绘画不再是画家的专属,编程也不再是程序员的专属。在AI的帮助下,任何人都可以通过学习和实践,创作自己的杰出作品。

    在AI的加持下,超级个体的崛起将打破现有的职业分工体系。它鼓励个体追求创新,拓展知识边界,实现个人和职业成长。他们产生的价值是广泛的行业价值和社会价值。

    未来的工作场景中,将会越来越重视跨学科知识和创造性思维。这不仅为超级个体提供了更广阔的发展空间,也为企业和社会带来了更丰富的创新资源。

    AI时代,需要我们打破过去那套旧规则,只有拆掉思维里的墙,我们才能获得进化。欢迎加入Mixlab ComfyUI中文社区与大佬们一同成长!


    最后,欢迎大家加入ComfyUI的知识星球。





    17 December 2023, 9:56 am
  • 9 minutes 46 seconds
    AIGC产品经理:传统产品经理转型的时代机遇与挑战

    今年年初,随着GPT、Midjourney大语言模型的火爆,也带火了AIGC(人工智能生成内容)的潮流。随之而来的是越来越多的AIGC产品经理的招聘需求。AIGC产品经理是一个崭新的角色,同时也面临着一系列独特的挑战和机遇。

    到底什么是AIGC产品经理,他和传统的产品经理又有什么不同?就在前几天,我和西坡、小李子对于什么是AIGC产品经理做了一些探讨。(他们都是我的知识星球成员)

    # 1. AIGC产品经理的独特性

    这是某个大厂招聘需求,乍看一下和传统产品经理的招聘需求还是非常相似:


    其实,AIGC根据场景和领域不同,对于产品经理的要求也不同。下图绿色的是应用场景,蓝色的部分是每个应用场景对应的模型技术,AIGC产品经理可以根据下图按图索骥地了解相关的技术知识。

    西坡作为工作在一线的AIGC产品经理,他首先发表了观点。

    虽然AIGC产品经理的工作流程在很大程度上与传统产品经理相似,涵盖需求调研、分析、原型设计等环节,但AIGC产品经理在技术调研和产品功能设计方面的要求更高。这是因为大模型使得产品和研发人员处于同一起跑线。因此,AIGC产品经理需要对技术有更深的理解和洞察能力。

    在这一年里,大模型的技术迭代非常快。它需要产品经理很强的自主学习能力,要能够将新的技术能力与具体产品需求相结合。在日常的工作中,西坡除了撰写需求文档之外,也会使用提示工程调试数据,这样才能够将技术能力与产品需求有效结合。同时他每天也会查看大量的前沿动态,并从中发现机会点。

    另外,在传统的产品管理和AI项目中,我们管理的是确定性,用户需求是明确的,功能目标是明确的,性能指标也是明确的,在产品需求文档撰写时候就已经解决了80%的不确定性问题,剩下20%是项目执行。

    但在AIGC项目中却相反,我们管理的是80%的不确定性。因为用户会把AI当做人来使用,会提任何意想不到问题,但用户都期望AI要能够给出很好的回应。这种不确定性不光是用户带来的,也受数据、模型、提示工程的影响。AIGC产品经理需要能感知到这些不确定性,并让它们控制在用户预期范围内。

    很多2C类型的AIGC产品还要求产品经理要有社区产品经验,因为AI内容创作的驱动力还是来源于人,而在线社区是最好的创作者运营方式,在国外Discord社区已经是AIGC产品的标配。因为在AIGC社区里,创作者们可以相互学习和相互激发。而产品经理只有真正理解了这群AIGC创作者才能更好地知道AIGC产品应该怎么做。


    因此,在AIGC产品管理中,产品经理更需要近距离地观察用户和亲身体验。因为AIGC产品并没有可以直接可抄袭的功能和交互逻辑,很多问题需要亲身体验才能知道。所以这要求产品经理具有强烈的用户同理心,并能够将自己置入用户的情境中。通过近距离观察和体验,才能更好地理解市场动态和用户行为。


    # 2. 快速市场响应与商业能力

    在AIGC领域,产品经理面临的主要挑战之一是快速响应市场变化。这不仅要求他们敏锐地捕捉行业趋势和机遇,还要能够进行快速的市场验证。有效的MVP(最小化可行性产品)策略对于确定产品方向和迭代至关重要。

    此外,产品经理的商业理解能力也至关重要。在产品设计过程中,必须充分理解商业运作逻辑和实现成本。避免过于复杂和无效的需求设计,确保产品在有限的资源成本下能够有的放矢,步步为营地达到产品与市场的匹配。

    在11月7日凌晨,OpenAI举行了一场全球注目的开发者大会,CEO山姆·奥特曼隆重地介绍了GPTs的功能,人人都可以定制自己的GPT助理,还能通过链接分享给朋友。但是目前由于官方GPTs商店还没有上线,许多优秀的GPTs很难被发现。


    为此,Mixlab的小伙伴11月15日还组织了一场名为《GPTs商店,普通人能挣到钱吗?》在线连麦讨论,当我们讨论到是否值得做GPTs精品推荐网站时,西坡认为还是存在一定的机会的,但有另一些朋友表示并不看好这种推荐网站,因为只要官方GPTs商店上线以后,这种网站结局就是昙花一现。

    在第二天,西坡的团队就上线了名为GPTs伙伴”的精品推荐网站(www.gptspt.com),同时西坡启动了社群运营,GPTs创作者和用户开始涌入。社群里的小伙伴都惊呼动作真快。

    目前,他们团队只用了一周不到的时间就收集到了四千多个GPTs。一周的时间,对许多大厂团队来说就是给老板写PPT和做汇报的时间。


    当我们还在担心官方的GPTs商店即将上线的时候。上周末OpenAI的CEO山姆·奥特曼被戏剧性地驱逐出了公司。这家顶尖的AI公司已变成了一团乱麻。当我们认为接下来GPTs官方商店的项目推进应该会被搁置的时候,在昨天山姆奥特曼又回到了公司。

    我给西坡的总结就是“天下武功,唯快不破”。在飞速发展的行业里面,每天都有新变化,反复的犹豫和纠结会让机会转瞬即逝。

    对于创业者来说这是一个动态博弈的过程你能做的就是用最低的成本来验证你的想法,用最快的速度来拿到结果,然后再去迎接下一步挑战,只有快速应变和步步为营,你才更有可能获得成功

    如果你有兴趣以扫码收们上周二讨论:


    3. 产品经理的职业风险与机遇

    随着互联网行业增量市场向存量市场的转变,科技公司的运营模式也从资本驱动转变到投资回报率(ROI)驱动,产品经理面也临着全新的挑战。这不仅对企业盈利模式提出了更严格的要求,也对传统分工体系下偏安一隅的产品经理们提出了更高的要求。

    项目的ROI和公司财务状况成为决定职位稳定性的关键因素,产品经理需要具有在短期内验证产品的商业价值和潜力的能力,否则自身岗位也岌岌可危。

    在这个多变的职业环境中,产品经理应成为斯坦尼斯拉夫斯基的体验派”。通过亲身体验,深入实际应用场景,亲历市场和产品的起伏变化这种近距离的观察和体验能够帮助他们理解复杂问题的本质,更透彻地理解市场、用户需求、项目运营和管理。

    另外,在职场中,追求财务收益和发展机遇应当不相冲突。产品经理需要明确自己的阶段性职业目标,同时不失对终极理想的追求。只有如此,产品经理才能在不断变化的市场中找到稳固的立足点,并在职业道路上实现持续的成长和成功。


    # 结语

    AIGC产品经理是一个崭新的岗位,这个岗位的定义也会随着技术飞速发展而更新,产品经理还有很多东西需要学习。

    面对技术的复杂性和市场的不断变化,新兴的产品经理们,需要具备深厚的技术理解、敏锐的市场感知、强大的商业能力,以及不断地学习和适应能力。

    通过持续的努力和专业发展,AIGC产品经理不仅能够引领产品成功,还能在职业生涯中取得显著成就。

    如果你是传统产品经理,这也是一次难得的职业转型的机会。如果你已经跃跃欲试,请迈开你的第一步,学会使用ChatGPT,构建自己的GPTs,并把他们带到自己的工作和生活中。

    你可以尝试一下我构建的“高级产品管理专家”GPT,它除了能帮助你处理日常的产品管理工作外,也会告诉你AIGC产品经理需要掌握哪些技能。希望它能够更好的帮助到你,访问地址:https://chat.openai.com/g/g-amlOc6xcY-gao-ji-chan-pin-guan-li-zhuan-jia


    在后续内容中,我会告诉大家如何构建属于自己专业领域GPTs,你可以给我留言你的问题。


    最近,我们正在组建ComfyUI中文社区,如果你还不了解什么是ComfyUI,请查看我的上一篇文章《AIGC工作流: 新时代产品经理和创业者的秘密武器》。目前群已经加满,后台回复我“ComfyUI入群”。

    另外,我们正在与Openart.com招募更多优秀的ComfyUI工作流创作者,详情请查看文章ComfyUI工作流:AI创作者的新名片#OpenArt联手Mixlab、ComfyUI中文社区

    关于AIGC产品经理的更多内容和资料可以关注我的星球。


    23 November 2023, 10:42 am
  • 18 minutes 17 seconds
    比尔·盖茨:AI代理人将彻底改变人们使用电脑的方式

    翻到Shownotes的最底部有价值128元的福利可以免费领取。



    这是一篇比尔·盖茨在最近写的文章,主要强调了人工智能技术的未来潜力和影响。他认为AI将深刻改变我们的生活方式,特别是通过高级AI助手(或称之为代理),这些代理能够理解复杂的请求并执行多种任务。他强调了AI在提高效率、解决复杂问题以及改善人类生活质量方面的巨大潜力。同时,他也提到了随之而来的挑战,如数据隐私、安全性和伦理问题。总的来说,盖茨对AI技术的未来持乐观态度,同时也认识到需要解决的关键问题。


    00:10


    即使到了今天,我对软件的热爱仍与当年我和保罗·艾伦一起创立微软时一样浓烈。但即便在这些年间软件有了很大的进步,从很多方面来说,软件仍然相当“愚蠢”。


    要在电脑上完成任何任务,你必须告诉你的设备使用哪个应用程序。你可以使用微软Word和谷歌文档来起草商业提案,但它们无法帮助你发送电子邮件、分享自拍、分析数据、安排聚会或购买电影票。即使是最好的网站也对你的工作、个人生活、兴趣和人际关系理解有限,而且在使用这些信息为你服务方面能力有限。这种事情在今天只有通过另一个人,比如一个亲密的朋友或个人助理,才能实现。


    在未来五年内,这一切将完全改变。你不需要为不同的任务使用不同的应用程序。你只需用日常语言告诉你的设备你想做什么。根据你选择与它分享多少信息,软件将能够做出个性化响应,因为它将对你的生活有着丰富的理解。在不久的将来,任何在线的人都将能够拥有一个由人工智能驱动的个人助理,其能力远远超出今天的技术。


    这种类型的软件——能够响应自然语言并根据对用户的了解完成许多不同任务的软件——被称为“代理”。我已经思考代理近30年,并在我的1995年的书《未来之路》中写到了它们,但直到最近因为人工智能的进步,它们才变得实用。


    代理不仅将改变每个人与电脑互动的方式。它们还将颠覆软件行业,带来自我们从键入命令到点击图标以来计算机领域最大的革命。


    每个人的私人助理


    一些批评家指出,软件公司以前提供过类似的东西,但用户并没有真正接受它们。(人们仍然在拿微软Office中曾经包含后来又放弃的数字助手Clippy开玩笑。)为什么人们会使用代理?


    答案是它们会好得多。你将能够与它们进行微妙的对话。它们将更加个性化,并且不仅限于相对简单的任务,如写信。Clippy与代理的共同之处,就像旋转电话与移动设备的共同之处一样。


    如果你愿意,代理将能够帮助你处理所有活动。通过允许它跟踪你的在线互动和现实世界的位置,它将对你参与的人、地点和活动有强大的了解。它将了解你的个人和工作关系、爱好、偏好和日程。你将选择它何时介入帮助某事或要求你做出决定。于下午 13:40 的时候发布了一些关于


    为了看到代理将带来的巨大变化,让我们将它们与今天的AI工具进行比较。这些工具大多是机器人。它们限于一个应用程序,并且通常只在你写下特定单词或寻求帮助时介入。因为它们不记得你上一次如何使用它们,所以它们不会变得更好或学习你的任何偏好。Clippy是一个机器人,而不是一个代理。


    代理更聪明。它们是主动的——能够在你提出要求之前就提出建议。它们能够跨应用程序完成任务。它们会随着时间的推移而改进,因为它们记住了你的活动,并识别出你行为中的意图和模式。基于这些信息,它们会提供它们认为你需要的东西,尽管最终决定权始终在你手中。


    想象一下你想要计划一次旅行。一个旅行机器人会识别出符合你预算的酒店。而一个代理则会知道你将在哪个季节旅行,并根据它对你是总是尝试新目的地还是喜欢重复访问同一个地方的了解,它将能够提出地点建议。当被问及时,它将根据你的兴趣和冒险倾向推荐活动,并在你喜欢的餐厅预订位置。如果你想要今天这种深度个性化的规划,你需要支付旅行代理费用并花时间告诉他们你想要什么。


    AI代理最令人兴奋的影响是它们将使今天对大多数人来说太昂贵的服务民主化。它们将在四个领域产生特别大的影响:医疗保健、教育、生产力以及娱乐和购物。


    医疗保健


    今天,AI在医疗保健中的主要作用是帮助处理行政任务。例如,Abridge、Nuance DAX和Nabla Copilot可以在预约期间捕获音频,然后为医生撰写笔记。


    真正的转变将在代理能够帮助患者进行基本分诊、获取如何处理健康问题的建议以及决定他们是否需要寻求治疗时发生。这些代理还将帮助医疗工作者做出决策并提高生产力。(已经有像Glass Health这样的应用程序可以分析患者摘要并为医生提出诊断建议。)帮助患者和医疗工作者将特别有益于那些在贫穷国家的人们,因为那里许多人根本就看不到医生。


    这些临床代理的推出将比其他代理慢,因为做对事情是生死攸关的。人们需要看到证据表明健康代理总体上是有益的,即使它们不会完美并且会犯错误。当然,人类也会犯错误,而且没有获得医疗保健也是一个问题。

    心理健康护理是另一个代理将使之几乎对每个人都可用的服务的例子。今天,每周进行一次治疗会话似乎是一种奢侈。但存在大量未满足的需求,许多需要治疗的人无法获得它。例如,兰德公司发现,所有需要心理健康护理的美国军事退伍军人中有一半没有得到治疗。


    在心理健康方面受过良好训练的AI代理将使治疗更加负担得起且更容易获得。Wysa和Youper是这里的早期聊天机器人。但代理将走得更深。如果你选择与心理健康代理分享足够的信息,它将了解你的生活历史和你的人际关系。它将在你需要时随时可用,并且永远不会变得不耐烦。它甚至可以在你的允许下,通过你的智能手表监测你对治疗的生理反应——比如当你谈论与老板的问题时心跳加速——并建议你何时应该看人类治疗师。


    教育


    几十年来,我一直对软件将如何使教师的工作变得更轻松并帮助学生学习感到兴奋。它不会取代教师,但它将补充他们的工作——为学生个性化工作并解放教师免于文书工作和其他任务,以便他们可以花更多时间在工作的最重要部分上。这些变化终于开始以戏剧性的方式发生。


    目前的最先进技术是由可汗学院创建的基于文本的机器人Khanmigo。它可以在数学、科学和人文学科中辅导学生——例如,它可以解释二次公式并创建数学问题供练习。它还可以帮助教师完成如编写课程计划等任务。我长期以来一直是Sal Khan的工作的粉丝和支持者,并最近在我的播客上邀请他谈论教育和AI。


    但基于文本的机器人只是第一波——代理将开启更多学习机会。


    例如,很少有家庭能支付一对一辅导学生以补充课堂学习的家教费用。如果代理能够捕捉到使家教有效的因素,它们将为每个需要的人解锁这种补充教学。如果一个辅导代理知道一个孩子喜欢Minecraft和泰勒·斯威夫特,它将使用Minecraft教他们计算形状的体积和面积,使用泰勒的歌词教他们讲故事和押韵。与今天的基于文本的辅导相比,体验将更丰富——例如,具有图形和声音——并且更加个性化。


    生产力

    这个领域已经有很多竞争。微软正在将其Copilot作为Word、Excel、Outlook和其他服务的一部分。谷歌也在用Assistant、Bard和其生产力工具做类似的事情。这些副驾驶可以做很多事情——比如将书面文件转换成幻灯片,使用自然语言回答有关电子表格的问题,并在代表每个人的观点时总结电子邮件线索。


    代理将做得更多。拥有一个代理就像拥有一个专门帮助你完成各种任务并在你愿意的情况下独立完成它们的人。如果你有一个商业想法,代理将帮助你撰写商业计划,为其创建演示文稿,甚至生成你的产品可能的外观图像。公司将能够使代理直接为其员工提供咨询,并成为每次会议的一部分,以便它们可以回答问题。


    无论你是否在办公室工作,你的代理都将能够以与今天个人助理支持高管相同的方式帮助你。如果你的朋友刚做了手术,你的代理将提议发送鲜花,并能为你订购。如果你告诉它你想要与你的大学室友联系,它将与他们的代理合作找到见面的时间,并在你到达之前提醒你,他们的大孩子刚刚开始在当地大学上大学。


    娱乐和购物


    AI已经可以帮助你挑选一台新电视并推荐电影、书籍、节目和播客。同样,我投资的一家公司最近推出了Pix,它允许你提问(“我会喜欢哪些罗伯特·雷德福的电影,我在哪里可以看?”),然后根据你过去喜欢的内容做出推荐。Spotify有一个AI驱动的DJ,不仅根据你的偏好播放歌曲,还会与你交谈,甚至可以叫你的名字。

    代理不仅会提出建议;它们还会帮助你采取行动。如果你想买相机,你将让你的代理为你阅读所有评论,总结它们,提出建议,并在你做出决定后下订单。如果你告诉你的代理你想看《星球大战》,它会知道你是否订阅了正确的流媒体服务,如果没有,它会提议帮你注册。如果你不知道你想看什么,它会提出定制化建议,然后找出如何播放你选择的电影或节目。

    你还将能够获得根据你的兴趣量身定制的新闻和娱乐。CurioAI,它可以根据你询问的任何主题创建定制播客,是即将到来的东西的一瞥。

    科技行业的震荡波


    总之,代理将能够帮助几乎任何活动和生活的任何领域。它们对软件业务和社会的影响将是深远的。

    在计算行业,我们谈论平台——应用程序和服务构建在其上的技术。Android、iOS和Windows都是平台。代理将是下一个平台。


    要创建一个新的应用程序或服务,你不需要知道如何编写代码或进行图形设计。你只需告诉你的代理你想要什么。它将能够编写代码,设计应用程序的外观和感觉,创建一个logo,并将应用程序发布到在线商店。OpenAI本周推出的GPTs为非开发者可以轻松创建和分享他们自己的助手的未来提供了一个窥视。代理将影响我们使用软件的方式以及软件的编写方式。


    它们将取搜索网站,因为它们在为你找到信息并为你总结它方面会更加出色。它们将取代许多电子商务网站,因为它们会为你找到最佳价格,并且不会仅限于几个供应商。它们将取代文字处理器、电子表格和其他生产力应用程序。今天是独立的业务——搜索广告、带广告的社交网络、购物、生产力软件——将成为一个业务。


    我不认为任何单一公司将主导代理业务——将有许多不同的AI引擎可用。今天,代理嵌入在其他软件中,如文字处理器和电子表格,但最终它们将独立运行。尽管一些代理将免费使用(并通过广告支持),但我认为你将为大多数代理付费,这意味着公司将有动力使代理为你的利益工作,而不是广告商的利益。如果今年开始从事AI工作的公司数量有任何迹象,那么将会有异常多的竞争,这将使代理非常便宜。


    但在我所描述的复杂代理成为现实之前,我们需要面对关于技术及其使用方式的许多问题。我之前已经写过AI引发的问题,所以我将在这里专门关注代理。


    技术挑战


    目前还没有人弄清楚代理的数据结构将是什么样的。为了创建个人代理,我们需要一种新型数据库,能够捕捉你的兴趣和关系的所有细微差别,并在保持你隐私的同时快速回忆信息。我们已经看到了存储机器学习模型生成的数据的新方法,例如向量数据库,这可能更适合存储数据。


    另一个悬而未决的问题是人们将与多少代理互动。你的个人代理是否与你的治疗师代理和你的数学家教代理分开?如果是这样,你什么时候希望它们相互合作,什么时候应该保持各自的领域?


    你将如何与你的代理互动?公司正在探索各种选项,包括应用程序、眼镜、吊坠、别针,甚至全息图。所有这些都是可能性,但我认为人类与代理互动的第一个重大突破将是耳机。如果你的代理需要与你联系,它将对你说话或在你的手机上显示。(“你的航班延误了。你想等待,还是我可以帮你重新预订?”)如果你愿意,它将监控进入你耳朵的声音,并通过阻挡背景噪音、放大难以听到的语音或使听起来带有浓重口音的人更容易理解来增强它。


    还有其他挑战。目前还没有一个标准协议,允许代理相互通信。成本需要降低,以便代理对每个人都负担得起。需要更容易地提示代理,以便为你提供正确的答案。我们需要防止幻觉,特别是在像健康这样的领域,准确性非常重要,并确保代理不会因其偏见而伤害人们。我们不希望代理能够做它们不应该做的事情。(尽管我对流氓代理的担忧比对使用代理进行恶意目的的人类犯罪分子的担忧要少。)


    隐私和其他重大问题


    随着所有这些事情的发展,在线隐私和安全问题将变得比现在更加紧迫。你将希望能够决定代理可以访问哪些信息,以便你有信心你的数据只与你选择的人和公司共享。


    但是你与代理共享的数据归谁所有,你如何确保它被适当使用?没有人希望开始收到与他们告诉治疗师代理有关的广告。执法部门可以使用你的代理作为对你不利的证据吗?你的代理何时会拒绝做可能对你或他人有害的事情?谁来选择内置于代理中的价值观?


    还有一个问题是你的代理应该分享多少信息。假设你想见一个朋友:如果你的代理与他们的代理交谈,你不希望它说,“哦,她周二要见其他朋友,不想让你加入。”如果你的代理帮你写工作电子邮件,它将需要知道不应该使用关于你的个人信息或你以前工作专有数据。


    这些问题已经成为科技行业和立法者的首要关注点。我最近参加了由参议员查克·舒默组织的一次AI论坛,与其他技术领袖一起,许多美国参议员也参加了此次论坛。我们分享了关于这些和其他问题的想法,并讨论了立法者采纳强有力的立法的必要性。


    但是,其他问题不会由公司和政府决定。例如,代理可能会影响我们与朋友和家人的互动方式。今天,你可以通过记住他们生活中的细节——比如他们的生日——来向某人表达你对他们的关心。但当他们知道你的代理可能提醒了你这件事并负责发送鲜花时,这对他们来说是否还有意义?


    在遥远的未来,代理甚至可能迫使人类面对关于目的的深刻问题。想象一下,代理变得如此出色,以至于每个人都可以在几乎不用工作的情况下拥有高质量的生活。在这样的未来,人们会如何利用他们的时间?当代理拥有所有答案时,还有人会想要接受教育吗?当大多数人都有大量空闲时间时,你能拥有一个安全繁荣的社会吗?


    但我们距离那个时刻还很遥远。与此同时,代理即将到来。在接下来的几年里,它们将彻底改变我们的生活方式,无论是在线上还是线下。


    [原文完]


    观点


    人工智能的发展正处于一个关键的十字路口。一方面,AI展现出了巨大的潜力,能够在教育、医疗保健、环境保护等多个领域带来革命性的改变。它有可能极大地提高生活质量,解决一些长期以来人类难以克服的问题。

    然而,另一方面,这种技术的快速发展也带来了一系列复杂的伦理、隐私和安全问题。数据的控制权、AI决策过程的透明度,以及其对就业和社会结构的影响,都是我们必须认真对待的问题。特别是在AI技术可能加剧社会不平等的情况下,我们需要谨慎行事,确保技术进步能够惠及所有人。


    此外,我也认为人工智能的发展不应仅仅被视为技术进步的问题,而应该是一个更广泛的社会、文化和伦理议题。我们需要跨学科的合作,包括技术专家、社会学家、伦理学家和政策制定者,共同探讨和制定相应的法律法规,以确保AI技术的健康发展。


    最后,我对人工智能未来的发展持谨慎乐观的态度。我相信,通过全人类的合作和负责任的创新,我们可以利用AI的潜力来改善人类的生活,同时有效地应对其带来的挑战。

    福利:北京虎嗅F&M创新节价值125元的门票,关注PM熊叔公众号可以免费领取:微信后台私信我获得兑换密码,即可免费领取。



    14 November 2023, 10:00 am
  • 10 minutes 33 seconds
    AIGC工作流:新时代产品经理和创业者的秘密武器

    在我过去的文章里有说过,产品经理是“帮助团队交付正确产品给用户的人”。从客户需求挖掘到最后产品使用体验,产品经理要确保产品价值能够端到端地传递给用户,产品经理需打破团队成员的分工壁垒,这考验着产品经理综合能力和素质,这也是产品经理的领导力的体现。


    如今,随着ChatGPT、Midjourney、StableDiffusion等生成模型带动起来的热潮,AI大模型正逐渐渗透到各种产品和服务中,越来越多的产品经理也在考虑将AIGC(AI生成内容)能力融入到自己的产品中,然而这并非易事,在项目实践的过程中产品经理面临着诸多的挑战和困惑……


    # 一、AIGC的产品管理挑战


    在传统的互联网产品的开发流程中,产品原型图是不可或缺的工具。产品经理或交互设计师通常会使用Axure、Sketch或Figma等工具,投入主要的时间绘制线框图,并通过页面流程图来阐释产品的交互逻辑。通过这种方法,团队成员能直观地理解产品的最终呈现效果,方便地讨论问题并形成共识,从而保证最终交付的产品体验与预期保持一致。这是过去十几年来,互联网和软件行业一直奉行的最佳实践。



    然而在AIGC产品中,用户更关心的是AIGC的数据体验,而不是界面的交互体验,传统的体验设计范式已经不再适用。例如,著名图片生成工具Midjourney以对话机器人的形式呈现,用户只要在Discord中和它对话就能获得高质量的图片,因为Midjourney很清楚地知道:用户更关心的是我们能不能根据提示词生成优质的图片,而不是别的什么东西。



    题外话:“知道自己应该做什么,并把它做到极致”——正因如此才让这只有十几人的小团队能完成1亿美元的年营收。这是我们每一个创业者和产品经理都需要学习的能力。


    因为AIGC产品体验的重心已从界面转向了数据。由于许多产品经理对数据和AI算法了解不足,让他们在技术沟通上遇到了极大的挫败感,而且传统的原型设计工具在应对AI产品时也显得力不从心,无法保证最终的交付效果和预期的一致性。对于一些想应用AIGC能力的产品经理而言,不仅AI模型是个不可解释的黑盒,连AI产品的研发过程也变成了一个不可知的黑盒。


    正所谓“拿着旧地图无法抵达新大陆”,在新时代,我们应该放弃旧的思维方式拥抱新的工具和新方法。


    # 二、AIGC工作流(Workflow)

    Stable Diffusion,作为一款广受欢迎的图片生成的开源项目,为AIGC内容创作者提供了强大的助力。ComfyUI进一步拓宽了Stable Diffusion的创作可能性。ComfyUI通过节点流程的界面设计,让用户可以轻松拖拽、连接不同的模型、模块和参数,形成高度定制和可复用的Workflow(AIGC工作流),而用户无需编写任何代码。它可以帮助我们实现更加丰富和定制化的数据体验。



    另外,ComfyUI还有以下优势:


    易于共享与协作:支持工作流的导出和分享,不仅加速了项目开发,也为团队间的学习和交流创造了条件。


    良好的性能优化其内存管理和按需加载机制确保在资源受限的环境下,仍能加载大模型生成高质量图像。


    可扩展性:用户可以轻松添加自定义节点、插件和模型,社区已贡献了200多个自定义节点,为工作流的设计和优化提供了丰富的选择。


    ComfyUI本质上是AIGC的Pipeline(数据处理管道)的可视化构建工具,它将Stable Diffusion的运行机制显性化的展示在我们面前。在图形生成的过程中,ComfyUI能够实时为我们呈现数据处理的过程。让我们在设计和调试的时候,可以快速定位和解决问题。



    ComfyUI不仅仅是让AIGC创作者可以更自由地创作,它的流程逻辑的可视化、可复用以及数据的实时可验证,不就等同于产品原型构建工具么?


    在产品融图、营销海报和视频素材等应用场景中,AIGC正在发挥极大的价值。目前,一些前沿的团队已经在使用ComfyUI改进他们的工作方式,产品经理将ComfyUI作为产品原型设计工具,深度参与到模型训练和AIGC工作流的构建中,然后再交由开发人员和算法工程师进一步优化,最后转化成可稳定运行的Pipeline部署到正式环境中。


    通过ComfyUI的可视化节点式工作流,产品经理和开发团队的沟通与协作得到了促进,使项目团队能在早期快速搭建和验证项目原型,缩短开发周期,降低试错成本,确保产品需求和体验目标的一致性,从而更好地实现端到端的产品体验目标。


    # 三、UE蓝图系统的启示


    拖拽式的节点编程并不是ComfyUI的独创,例如,Blender、Maya和Unreal Engine(虚幻引擎)也提供了类似的功能。


    虚幻引擎的蓝图系统通过提供丰富的节点库和强大的可视化编程环境,使用户能够在无需编写代码的情况下构建复杂的游戏逻辑。



    蓝图系统的高度可定制性和扩展性,允许用户创建自定义节点,甚至可以与传统的编程代码无缝集成,直接打包成跨平台的游戏,不仅为游戏开发提供了强大而灵活的解决方案,也缩短了从概念到可交付产品的时间周期。这种方式使游戏设计师、艺术家和小型工作室能快速地制作出可运行的游戏产品,极大地丰富了游戏创意的表达。


    得益于虚幻引擎的强大表现力和无需编程的创作方式,使得其他行业的专家也可以使用虚幻引擎来实现想法。这也让其成为一款贯通各行各业的三维拟真创作工具,从游戏行业跨足至建筑设计、工业设计、城市规划和厂房规划等众多领域。


    可视化的节点编程和模块化设计极大地降低了编程门槛,促进了不同背景的团队间的协作和交流,吸引了来自更多不同领域的创作者共同丰富产品应用场景和生态。


    这也为ComfyUI提供了启示:强大的可视化和模块化能力不仅降低了产品开发和发布的门槛,还拓宽了创意和协作的空间,使得想法可以快速转化为实际可交付的产品成为可能,从而更好地满足不同用户和市场的需求。这就是“引擎”的魅力。


    # 四、展望未来


    目前,得益于ComfyUI的自定义节点的可扩展性,已有开发者创建了ChatGPT节点,为图像生成工作流赋予了大语言模型的思考能力,能快速生成提示词,可以方便快速创作大量的内容。如下图所示:



    展望未来,随着ComfyUI自定义节点的丰富化,它将不仅局限于Stable Diffusion的图像生成能力,而会整合更多领域的AI模型,逐渐成为一个多模态的AIGC产品构建工具。未来也可能会出现类似虚幻引擎的多模态AI引擎平台,能直接将AIGC工作流打包成高可用和可交付的产品。


    另外,由于企业级项目对硬件资源有较高要求,ComfyUI主要部署在团队的云端服务器上,这也将催生团队在线协同的需求,为创业者提供新的机会。我相信未来的ComfyUI在线版本可能会借鉴Figma的在线协同功能,让团队成员能共同参与AIGC工作流的搭建,为AIGC产品开发带来前所未有的在线协作体验。




    # 结语


    十年前,许多产品经理通过学习《网站蓝图:Axure RP高保真网页原型制作》这本书,步入了互联网产品领域。然而,在AIGC产品领域,Axure已无法满足现今的需求。



    正如“拿着旧地图无法抵达新大陆”一样,当我们拿着旧“蓝图”时也难以创造新产品。现在,AIGC工作流已成为我们需要学习和掌握的新“蓝图”的能力。


    通过学习和应用ComfyUI,产品经理和创业者能更深入地理解AI原理和工作方式,获得更为顺畅技术沟通能力。同时,通过快速构建和验证AI模型,我们可以确保产品需求与体验的一致性,大幅缩短产品开发周期。


    掌握ComfyUI的AIGC工作流,产品经理和创业者不仅能自信应对AI产品开发的挑战,还能探索和实现创新的产品设计,树立在AIGC领域的领导力。


    AIGC掀起的热潮也仅仅只有半年多的时间,技术正飞速发展和迭代,新事物层出不穷,在这个行业没有多年经验的老师傅。不管你是创业者还是产品经理,如果想转行到AIGC领域,现在是学习的最佳时机,只要学习的速度够快,你就可能成为该领域的专家。通过掌握ComfyUI,你能为未来的职业发展和团队协作打下坚实的基础,更好地适应这个行业的发展和需求。


    欢迎对AIGC工作流感兴趣的小伙伴一起同行!


    目前,我们正在翻译ComfyUI官方文档和撰写入门教程,网址:https://www.mixcomfy.com


    同时,我们正在搭建ComfyUI中文社区,如果你对ComfyUI感兴趣可以扫码加入。


    ComfyUI爱好者群:



    另外,如果你想深入学习ComfyUI动画等相关知识可以加入这个知识星球,是Shadow和我联合发起的,我们收集和整理全网最新最完整的资料。


    早期用户优惠,满50人后开始涨价



    5 November 2023, 1:40 pm
  • More Episodes? Get the App
© MoonFM 2024. All rights reserved.