top of page
Writer's pictureAhaIP

AI Pin

1. OpenAI CEO Sam Altman投资的人类历史上第一款真正的AI硬件——AI Pin,是这两天全世界最火爆的硬件产品。如果你还不清楚这个产品,可以看这个视频了解一下。

2. 它背后的公司Humane,由前苹果功勋设计师Imran Chaudhri和苹果前系统负责人Bethany Bongiorno创办,Chaudhri曾参与初代iPhone的开发,甚至那个被乔布斯在iPhone第一次发布时嘲笑的带着滚轮的原型机也是他参与设计的。他离开苹果时非常不愉快,在决定离职前发全员邮件并写了首诗:“可悲的是河流干涸了,这时你就会寻找新的河流”。然后,苹果就开除了他。

3. Humane背后最大股东就是Sam Altman,而作为一款硬件的AI Pin,它的“软件”就是GPT-4。它的发布跟OpenAI那场屠杀了一众AI初创公司的开发者大会几乎是前后脚,Sam Altman又是它的金主爹,关于它的讨论立刻围绕“是否是新的iPhone”展开。

4. 然而仔细看看AI Pin,会发现它的意义不是非黑即白——要么iPhone杀手,要么完全就是炒作,并不是这样。它其实是AI时代“新硬件”思路的第一批试验品。用我的同事骆轶航的话说,它是“ChatGPT的硬插件”。

5. 乔布斯的门徒深知乔布斯的密码:交互方式上极致激进改造,用户体验上极致保守克制,一如当年iPhone的样子。

6. AI Pin最大的噱头是没有了屏幕,因而一举改变了交互方式。你只能大部分时间通过自然语言,小部分时候通过手势操控来使用它。这完全是基于ChatGPT的能力定制的,因为LLM(大语言模型)最大的革命之一就是推动了LUI(语言用户界面)的普及,而这个AI Pin几乎就是一个要把LUI用到极致的玩法。

7. 这也决定了它是个实验品。最近国内一款数亿用户的国民级应用产品负责人对我说,他们已经是用LUI改造产品很彻底的产品,很多底层代码都重写了,但他认为LUI并不是一个单纯的替代升级,而是一个带来新可能性并行选择。LUI最终会结合GUI(手势用户界面)一起,创造属于AI时代的硬件产品。

8. AI Pin就是这么干的。有的功能用自然语言调用,有的则用简单的手势,这也是让外界惊呼酷炫的点,看完它的Demo,我觉得这其实就是AI Agent的“硬件化”。一个大模型有了一个Pin的实体,把它别在你的胸口,bling-bling地闪瞎眼,或者干脆像另一家AI硬件创业公司Rewind那样,把它变成一个吊坠。这可能会变成一个潮流。

9. 可是AI Pin,无论从长相到功能,听上去是不是有点儿像10年前有一家做“智能胸针”的Misfit?那会儿有很多这种鸡肋式的“可穿戴设备”,还有风靡得快消失得更快的Google Glass。AI Pin的终局会不会跟它们一样?

10. 回答它得回到对“智能”的理解上。10年前的Google Glass也好,Misfit也罢,还有五花八门的智能手环和智能手表,难道本质上不都是“智障硬件”吗?至少有一点你得相信,有了GPT-4当“软件”,AI Pin确实开启了“智能”硬件的新阶段。它的核心能力,在于用语言交互和动作交互,调用AI Agent。或者干脆,你就直接把AI Pin当成挂在胸口bling-bling闪瞎旁人眼的一个AI Agent。

11. AI Agent本质是基于个人或组织定制需求的,以大语言模型为核心能力的AI应用和功能的组合,它具有高度的个性化和场景化导向:敲一下胸口的Pin,跟它低声说两句话,展开手掌,看到一串亮色的字符,告诉你对一个问题的建议处理方式,一个关键的要告诉对方的数据,或者直接替你点好了你另一只手拿的一份餐厅菜单。这可比那些手表手环聪明多了。当然这也说明,与传统意义上的硬件不同,AI Pin本身不会是一个通用的硬件,而是实现定制化AI的“硬插件”。

12. 既然是“硬插件”,背后自然是一整个新的体系。这个新体系不再是以某个硬件为出发点,出发点变成了大语言模型。回顾一下iPhone——当年是先有的iPhone再有的App Store,以至于苹果今天在营收上仍然是一个硬件公司。那么如果是先有了一个强大的“App Store”呢?OpenAI和AI Pin拿的就是这么一个反过来的剧本。

13. 谁都知道人们关注AI Pin,是因为它背后的OpenAI和ChatGPT,AI Pin的创始人自己也知道。就像软件开发者的收入依赖苹果的硬件所以甘愿被苹果收税一样,AI Pin第一天就把硬件收入让位于订阅收入——Humane的定价方式:是固定的硬件价格和每个月的“订阅费”——调用GPT-4的能力向OpenAI缴的“税”。这和ChatGPT的插件们逻辑有任何的不同么?

14. OpenAI相信,大语言模型的本质就是个世界知识的最棒的压缩器。但压缩器不能直接解决每个人每个具体问题,所以需要插件,AI Agent的思路因此出现。今天,新一代硬件在追逐“AI原生”时也在被这种思路塑造:以基础大语言模型为底,以一个能压缩基础模型并用个人数据训练的“大脑”为中心,再辅佐上各种硬插件——最终每个人都有个性化的AI Agent。

15. AI Pin是想激进地一步到位做到这一点的。只不过早期实验越想一步到位,也越容易成炮灰。它直接把插件接底座,带来很多问题。最多的诟病之一是隐私。而如果有一个本地的且计算能力更强的中间“保险箱”,插件可以更集中在自己的任务,后面的基础模型可以更通用,那就可以解决更多问题。

16. 前不久我在硅谷遇到与Humane相似的当红创业公司——Rewind的CEO Dan Siroker,他展示了把Rewind做到电脑上离线使用的功能,这会更安全更个人化(Rewind也比Humane更激进,它的产品要全天候记录用户的一举一动,对隐私问题更敏感),而在他看来基础模型和插件之间的那个“大脑”,依然需要由手机和电脑承担,只不过需要的是全新的用模大语言型能力来定义的新手机新电脑。从这个意义上,我们还是挺期待英伟达和联想把电脑变成“AIPC”,以及高通帮助vivo和小米们把大模型塞到手机里的。

17. 结论基本有了:AI Pin是一个把ChatGPT别在你胸口的,消灭了触摸屏幕的,让语言交互界面与手势交互界面组合操作的“硬插件”。它是一个随身携带的AI Agent,一个硬件底座直接与云连接,相当激进,比当年的Google Glass还激进,这意味着它更像是一个实验品,但人们需要这样的实验品。

18. 只有激进的尝试才能激发想象力。这是人们对AI Pin如此兴奋的原因。人们把它当成了“奥特曼的插件”,也就是ChatGPT在硬件世界的延伸,一个可能的新的硬件时代的开启。这倒让我想起了15年前的一段往事。

19. 2008年6月,旧金山,苹果WWDC ,App Store在那一刻正式发布。乔布斯在台上说:“你们也可以像Apple自己一样来开发和发布应用”。接着,几名最早期的苹果开发者上台了。其中一个穿粉衣服的男孩引起乔布斯注意。乔布斯把这个粉衣男生叫到他阴暗的房间里聊天,这名24岁的斯坦福辍学生紧张而兴奋,后来回忆称“只看得到他(指乔布斯)反着光的两个圆圆的镜片”。当时,他在台上展示自己的App的,表达对苹果的感谢:“这是新的移动时代的开始”。



20. 这名粉衣男生就是Sam Altman。

一个新的开始

是时候重新回味比尔·盖茨在48年前的愿景了——“让每个家庭都有一台电脑”。这句话放到当下,理应升级成“让每个家庭都有一台AI PC”,而这应该是人类创造更多可能性的新起点。

当今世界上最精彩的“权力的游戏”,莫过于OpenAI董事会与被闪电罢免、又戏剧性回归的CEO Sam Altman之间的博弈与拉扯了。用ChatGPT引爆了生成式AI革命的全球顶流创业公司OpenAI,被以人类斗争的方式反噬,足以折射人们在对“超级AI”的未来充满不无玫瑰色的想象的同时,亦有着更直接、深刻乃至本能的担忧。



这些担忧来自通用人工智能(AGI)日益可见的无所不能,来自一些聪明的人类对“超级AI”发展的过度乐观和极度放任,来自AI对人类生活和隐私边界的侵袭,亦来自人类自身的觉醒与努力——通过创造新的“硬件”,将“超级AI”关在物理的笼子里,赋予它更强大的计算资源和计算能力,同时约束它对人类工作、学习、生活和私密数据的过度获取,让它更好地服务人类的创造与进步,而不是凌驾其上。

这意味着OpenAI和微软并不会成为人们通向AI必然王国的唯二选择,也很少有人希望是如此。这意味着“硬件创新”的自觉与爆发,意味着个人计算设备在经历了个人电脑(PC)和智能手机两次代际性跃迁之后,即将迈入一个用生成式人工智能共谋与共舞的时代。

人类需要的,是ChatGPT的硬插件吗?

市场已经给出了更“激进”的答案:OpenAI前任和即将回归的CEO Sam Altman参与投资了一家名为Humane的公司,推出了一款“划时代”的AI硬件——AI Pin。这款被众多媒体冠以“AI时代iPhone”的硬件,没有屏幕和显示器,内容用激光投射到手上,简单的触控和语音是它与人们交互的唯一方式。准确地说,它是一个挂在人们胸口的装着电池、激光投影、移动网络、摄像头和麦克风的“躯壳”。而它真正的“灵魂”,来自OpenAI一个月24美元的GPT服务。



也就是说,它完全是一款挂在人们胸口的ChatGPT的“硬插件”,人们只有默认将自己的一切信息都交给ChatGPT和它背后的OpenAI,上传到云(微软的Azure)上,默认这些信息和数据可以被OpenAI用来训练可以服务于他人的数据,才能顺利使用它。而正是因为如此,注定了它不会成为像iPhone那样风靡世界的划时代硬件,对人类隐私和尊严的保护,它体现了AI的傲慢;而对人类通过AI创造未来世界而非将AI当成“拐棍”的愿景,它又足够漠视。

未来人们真正需要的、划时代的、拥抱“超级AI”的硬件,理应是一款支持人类创造未来的想象力与可能的“生产力工具”,是一款充分保护人类数据隐私、激发同时制约AI能力的新智能设备。它不一定遵循个人计算设备从PC到智能手机,再到更袖珍mini的未来设备的演进路径。与我们正在拥抱的生成式人工智能相比,过去近50年,从PC到智能手机的演进只能被划入同一个时代——生产力的数字化提升是在PC时代实现真正的“原始积累”的,而智能手机的真正价值,是在过去的15年间将人类数字化生产力的成果,分享给了更多人消费而已。

从这个意义上讲,以“GenAI”(生成式人工智能)之名的生产力智能化提升,是一个新的信息技术时代的开始。而人类在智能化生产力提升早期的原始积累,将让人类在某种意义上“找回”一种更强劲的新型硬件设备——它在灵魂上是智能的,而在躯壳上可能并不是那么激进的,甚至有些复古——某种意义上,你可以将其视作一些“古老硬件”的文艺复兴,也就是PC的文艺复兴。

也就是说:真正的“AIGC”(AI生成内容)将首先大规模地发生在“AI PC”(AI个人电脑)上。“AIGC”首先催化的是“AI PC”的诞生,已经成为正在发生的事实。

2023年10月23日,在联想创新大会(TechWorld)上,PC领域多年的霸主联想已经展示了“AI PC”的原型机,揭开了新一轮硬件革命的可能性。而上游的芯片厂商也在竞相逐力。

相继启动了AI PC的进程。

2023年10月,高通的骁龙峰会上,发布了全新的移动SoC平台和PC SoC平台,两者能够在“端侧”运行高达100亿和130亿参数的生成式AI模型。而英特尔也预计在2023年底发布的新酷睿处理器,通过首次加入神经网络加速单元(NPU),进而提升AI运算的能力。两周前,英特尔CEO帕特·基辛格(Pat Gilsinger)提出了一个清晰的目标——2025年达成出货超过1亿台AI PC。

端侧大模型是一个刚需

提到AI大模型,很多人脑海中出现的必然是“算力、存储、网络”。远超一般软件程序的性能需求,让它在初期发展中一直非常贴近云计算。

作为用GPU推动整个AI行业发展的那个人,皮衣教主黄仁勋更是每次新品发布上台时,都要不断重复:“Buy more!Save more!”。随着GPU芯片越造越大,配备的内存芯片越来越大,芯片与芯片网络通信能力不断增强,大模型的规模也在不断提升。



巨量的投入换来的模型规模增长,让AI大模型在训练阶段只能够放在云端进行,但随着时间推移,云端的大模型能力增长却已经开始放缓(GPT4相比GPT3近千倍模型规模增长)。

这标志着,跟之前的几次AI浪潮一样,同样以深度学习为核心的AI大模型,开始逐渐触碰到其能力的“天花板”。一旦行业中最强大的模型能力增长停滞,全行业就将转入实际应用落地的阶段。

但就目前而言,在OpenAI主导下的AI大模型生态,在推动广大用户应用落地上依旧进度缓慢。造成这种现象的关键,在于用户“不愿意”将自身需求数据和经验数据投入公有大模型之中,可能为了商业价值、也可能出于个人和组织隐私的重视和担忧。

2023年4月,韩国曾经爆出一则新闻:三星员工在使用ChatGPT处理工作时,无意间泄露了公司的绝密数据。 具体过程是,三星半导体部门的工程师选择使用ChatGPT修复代码问题,结果有的员工将手机新程序的源代码、部分内部会议记录数据都丢给了ChatGPT,相当于商业机密落到了OpenAI手上。

三星之后的解决办法是自己重新训练一个大模型,部署在私有云内。

在国内,不久前也有一则类似的新闻——金山办公旗下的人工智能办公应用“WPS AI”开启公测,AI功能也面向全体用户陆续开放体验。但很快,有用户就发现了其《隐私政策》中直接明确写到:“我们将对您主动上传的文档材料,在采取脱敏处理后作为AI训练的基础材料使用”。

虽然之后金山办公致歉并承诺不用用户数据来训练,但很多用户都公开表示不敢再用。

解决这个矛盾的方法的唯一方式,就是要为用户提供私有化的大模型能力解决方案。



联想集团董事长兼CEO 杨元庆

2023年11月21日,在“《财经》年会2024:预测与战略”上,联想集团董事长兼CEO杨元庆发表了观点,即“目前大模型的用户规模还比较小,大多数大模型都在算力较强的公有云上训练。未来,随着用户规模扩大,无论是出于数据安全和隐私保护的考虑,还是更高效率、更低成本响应用户需求的考虑,大模型的计算负载将逐渐由云端向边缘侧和端侧下沉,越来越多的人工智能的推理任务将会在边缘和设备端进行,这使得个人大模型更加成为必要和可能。”

直白点说,就是尽可能让每一个人都有足够运行AI大模型推理环节的算力和资源。从而实现在本地的设备,输入本地的数据,马上计算出相应的大模型结果。

能够承担这一角色的设备,只能是PC——未来的新型PC,即AIGC驱动的新物种——AI PC。

无论是口袋里的智能手机,还是背包里的笔记本电脑,还是家中的台式机,都是整个半导体和IT产业数十年来精心磨合的成果。AI的应用或许会改变人类与这些PC的交互方式,甚至部分改变他们的形态,但无法直接消除这些关键的计算节点。

AI PC:PC的文艺复兴时刻

回望肉眼可见的计算机发展历史,PC(个人电脑)横空出世除了为个人使用计算机带来了选择,同时还奠定了计算机行业普惠人类的“潜规则”。

在那之后的互联网和通信技术浪潮中,各种消费电子设备,包括现如今功能越来越复杂的智能手机,都是冲着最广大消费者而去,让每一个人充分享有随时随地获取信息的权利。

这次AI大模型技术浪潮来了,能够扛起普惠人类重担的,依旧是PC——至少在一开始的阶段是如此,而这个阶段的时间,将伴随着AIGC的真正普及,并不是一两年。

没有对比没有伤害。

正如我们前面提到的“新硬件” AI Pin,它折射了OpenAI“造物主”创造ChatGPT孪生硬件的野心:如果想要正常使用,它必须保持联网,并且不断将用户侧的麦克风数据和摄像头数据上传。怎么看都不符合当今用户对于移动设备生产力强、响应快、隐私保护等诉求。唯一的解释,只有Humane想规避iOS和安卓这两个更成熟的生态平台,直接把OpenAI打造成一个“新”平台。

与PC相比,AI Pin在高度依赖OpenAI在线服务的同时,交互方式极其有限,也没有开放的生态,甚至没有办法在保护隐私的状态下独立运行。

这正是“AI PC”诞生的背景,也是这一古老而年轻的“新物种”从一开始就要解决的问题。



在《财经》年会上,杨元庆定义了AI PC所需具备的五个特质:

  1. AI PC能够运行经过压缩和性能优化的个人大模型。

  2. AI PC具备更强的算力,能够支持包括CPU、GPU、NPU在内的异构计算。

  3. AI PC具备更大的存储,能够容纳个人全生命周期的数据并形成个人知识库,为个人大模型的学习、训练、推理和优化提供燃料。

  4. AI PC具备更顺畅的自然语言交互,甚至可以用语音、手势跟它完成互动。

  5. AI PC具备更可靠的安全和隐私保护。

这是目前我们能看到的对AI PC最完整清晰的定义,并不难嗅出“既要,又要”的味道。在异构计算和自然语言交互的追求上,它足够“激进”;在对安全和隐私的保护上,它又“保守”得符合人类的需求;而在压缩、性能优化、更强大得存储以支持个人知识库的建构方面,它的技术中立主义和人文主义色彩又显得十分浓厚。

杨元庆在演讲中为AI PC给出了更精确的定位:“既能够作为公共大模型的入口,又能独立运行个性化的私有大模型,它掌握最全面的个人数据和信息,又能严守你的秘密。只有你能唤醒它、使用它,同时也只有它最懂你,远胜于公共大模型。”

要做到这些,并不容易。不妨看看目前的一些实践:

为了让每个人都拥有自己的个人大模型,联想将AI PC设定为能调用本地+云端的混合大模型和个性化知识库,真正将公共数据的价值和个人数据价值结合起来。这样用户既可以用到公共大模型庞大的知识库,同时又能放心地将个人数据保管在本地计算,充分适应个人需求和场景。

在自然语言交互方面,联想强调交互过程中要主动对本地数据进行再训练,逐渐提升交互过程中的智能与个性化表现。为用户提供可持续成长的AI能力,而不是一开始就板上定钉。

另外一个关键的是开放生态,过去的PC产品,核心计算芯片都有明确的行业标准,按照开发者工具写软件就能确保运行效果。到了AI大模型的普惠时代,应用开发者和模型服务者都对基础终端设备提出了更高的要求,终端厂商也要参与到核心生态的运行中来。

最后是隐私和安全,AI PC相比公开大模型有着专门的隐私和数据保护安全体系,对于个人和企业的安全核心诉求,有着更好的保障。

当然,AI PC并不是一夜建成的,它有着一个曾经原始,但逐渐成型,最终拥抱了生成式人工智能浪潮而日臻成熟的演进路径。

2018年联想就已经提出了“智能PC”概念。随后AI元素更是逐步扩展到联想Yoga、Legion、 ThinkBook、和商用ThinkPad等PC全系列产品线。尽管彼“智能”并非今天的此“智能”,毋庸讳言,AI PC全面崛起的诱因是AI大模型,可是没有通过AI对PC未来边界和可能性的探索,用不到一年的时间推出划时代的AI PC原型,是不可想象的。

AI算力的“造水者”——英伟达、英特尔、AMD和微软们,都有与联想有着深厚的合作关系。在未来打造AI PC的过程中,对Windows、安卓、x86和ARM等多种多样的系统和架构的全面覆盖,对各种场景、各式用户的需求的充分满足是不可或缺的,这种覆盖AI能力全环节的业务布局,奠定了联想对AI PC这一新物种的定义权和议程设置权。而这些布局与铺垫,都正逐渐在财务数据中体现。

在联想公布的2024年第二季度财报中,全集团的营收连续两个季度环比提升,达到1044亿人民币,毛利率同比提升至17.5%,创二季度历史新高。非PC业务占比超过4成,同比提升近3个百分点。

业绩复苏的动力来自当前电子消费市场的恢复。但联想对2024年的期望更高,尤其即将到来的AI终端大爆发。根据IDC方面的数据,2023年中国市场中AI终端的占比为41%,到2027年这一比例将达到85%。在财报会议上,杨元庆也提及,AI PC将在未来进一步促进联想主业的利润改善。

显然,早早布局AI PC,将普惠AI大模型能力作为自身目标之一的联想,有望在接下来全球AI终端的普及中,扮演极其重要的角色。

这并不仅仅是一家公司的野望。是时候重新回味比尔 盖茨在48年前的愿景了——“让每个家庭都有一台电脑”。这句话放到当下,理应升级成“让每个家庭都有一台AI PC”,而这应该是人类创造更多可能性的新起点。

这也是PC这一古老物种以AI PC之名的新生,是一场文艺复兴。


1. 11月6日,旧金山,OpenAI首届开发者大会,一个预期的未来硅谷乃至全球的“地标性”年度科技嘉年华。然而,巨头一举办“开发者大会”,开发者就害怕。因为它们的每一个动作,是给开发者更多机会和活路,还是“杀死”开发者、断了他们生路,历来就是个问题。

2. 个人计算机时代比较著名“开发者大会”的有英特尔的IDF、苹果的Macworld。移动互联网时代苹果WWDC取代了Macworld,Google的I/O撑起了另一个生态系统的场子。人类信息技术文明不可阻挡地进入人工智能驱动的时代,就轮到OpenAI了。

3. 各个时代都有自己的开发者:美团创始人王兴在2018年9月的上市敲钟仪式上点名致敬了乔布斯,说iPhone和它开创的时代让美团得以壮大。确实,没有智能手机,哪儿来的外卖和网约车等本地生活。照这么说,Uber和滴滴更应该感谢乔布斯。今日头条和抖音简直就是彻底被苹果和Google造福的,它们也都是“开发者”。然而,苹果和Google,尤其是苹果,也确实杀死了大批量的开发者,比如那些做天气预报、文档编辑与存储、在线翻译、运动健康甚至智能语音助手。一言以蔽之,千鲸落,万物生。

4. 等到了OpenAI举起“以开发者之名”的大旗之后,它杀死大大小小AI开发者的进程好像提速了。苹果还好歹给天气预报和音乐类的开发者留了两三年生路,直到iPhone 4问世才彻底撕下面具。现在,ChatGPT诞生不到一年就对Jasper、Grammaly们挥起屠刀。再看看GPT-4 Turbo对ChatGPT能力的可怕延展,以及GPTs和API Assistant等开发工具,你就知道OpenAI的to do list里还藏着多少其它AI开发者的身家性命。

5. 一位AI开发者发推说:“OpenAI杀死了YC 2023年整个batch的项目”。巧了,OpenAI的CEO Sam Altman是Y Combinator这个全球科技创业者“天堂”级孵化器的前任总裁。另一名开发者说:Sam Altman杀死了我融资了300万美元的AI初创公司,然后只给了我一张价值500美元的ChatGPT代金券……看上去,会场上的大量开发者都相当不开心。

6. 说到Y Combinator,它最著名的一句使命性的slogan是“Build something people really want”,做人们真正需要的东西,夺么地朴实无华。确实,它孵化了人们需要的Airbnb、Twitch、Stripe和Instacart,也孵化出人们曾经需要的Dropbox——事实上,Dropbox这个一度风靡的文档存储工具最能代表YC孵化出的大部分项目的典型命运:人们确实曾经需要它们,但巨头做得更好之后就不需要了。所以,你说Sam Altman能不明白OpenAI能把那些人们真正需要的AI功能做得更好么?他不加速举起屠刀,等着过年呢?

7. 另一个层面,Sam Altman和他贯彻了“Build something people really want”精神的OpenAI,也确实具备加速杀死大大小小AI开发者的能力。ChatGPT本质上是一个“大语言模型”而不仅仅是“大模型”,“语言”两个字是不可或缺和不能省略的。这里的“语言”指的是自然语言。

8. 这次推出的GPT-4 Turbo、GPTs和API Assistant有一个共同的显性特征,即通过“自然语言”输入就能完成一个项目和应用绝大多数功能的搭建,或者只使用非常少的代码就能扩展一些功能。我刚刚就看到有人一行代码没写就在ChatGPT上搭建了一个算命的应用。可以想象,人们通过ChatGPT搭建一个天气预报、写作助理、日程管理、文档管理、图像创作、影视分析等等的功能,有多简单。普通的人和团队搭建它们有多容易,大大小小的AI“开发者”日子就有多难。

9. 英伟达创始人黄仁勋说ChatGPT的诞生是AI的“iPhone时刻”,诚不欺我也。但是我总觉得老黄在多年前说过的另一句话让我醍醐灌顶——他说人工智能的本质是“automation of software writing”(写软件的自动化)。说白了,就是AI通过“说人话”自然语言的指令,自己写了这个世界上绝大多数并不难写的代码。

10. 而这个世界上大多数的AI开发者日常的工作——包括那些过去两年融到了资的大量AI应用,就是用OpenAI、Google和百度等强大的AI基础能力,写一些并不算特别难写的代码,推出一些“辅助”人们日常工作生活的工具。现在,OpenAI说我们自己干了,不用你们了。你也不能说这事非常损,是吧。

11. 事实上,这一现象背后的变化是一个时代性的演进趋势:每个时代对“开发者”的定义是不一样的,故而对开发者需求的能力和技能要求也是不一样的。在PC时代,C#和C++可能是开发一款程序和应用最重要的编程语言,每一名当时的开发者都需要掌握好这些最重要的编程能力。到了苹果和Google执掌圣杯的移动互联网时代,Swift、Ruby和Java等语言变得前所未有的重要,现在全球互联网大厂的精英程序员大多是这些编程语言的熟练掌握者,这些语言构成了过去10年空前繁荣的移动应用大爆发,把整个世界彻底移动化了。那么,到了通用人工智能驱动的新的时代呢?哪种语言是AI时代“开发者”最需要掌握的语言?答案是“自然语言”。

12. 可是,“自然语言”难道不就是“人话”么?对啊,就是人话。可人话也不是所有人都会说也能说好的。当一个人,通过跟AI用有逻辑的、得体的、建设性的和有操作性的“人话”对话,它通过代码的自动书写帮你实现你想要的结果,你再以此为基础进行调优,不断持续地改进它实现的功能,这就是AI时代应用开发的主要动作和基本流程,就是GPTs能让AI“开发者”做到的事,也是GPT Store未来的“榜一大哥”应该做的事儿。

13. 这似乎得出了一个结论——进入“GenAI”时代,“开发者”的定义发生了自信息技术产业诞生以来最本质的变化:从广义上讲,它不再是熟练掌握某种计算机编程语言、进而开发出某些应用服务用户的群体的代称,而是指代一个通过与“自然语言”与AI进行建设性对话,进而“build something people really want”的群体。编程能力变得不再那么重要了,代码书写的份量不再那么重了,也就可以想象,传统意义上的“开发者”被OpenAI无情地“杀死”了,更多的人有望加入AI时代的“开发者”队列。

14. 这个趋势对很多程序员和软件工程师几乎算不得好事,对那些匠气足而洞察力不够的文字、影像和艺术创作者恐怕也算不得好事(AI照样可以像取代程序员一样取代他们),但对那些“生意人”而言,这应该是好事。一个好的“生意人”是知道什么东西是“people really want”的,他们可以更简单地通过创建原生的AI应用实现它们,从而也直接地成为真正的“开发者”。

15. 我们团队的Jessica在硅谷,她听说在OpenAI开发者大会现场,有一个用AI做室内设计的女性创业者跟大多数在场的如丧考妣的开发者不同,全程很兴奋和雀跃。我相信,代码大概率不是她的核心能力,但做好的设计家装一定是她非常擅长的事。她是个生意人,现在也成了AI的开发者。

16. 另一个可能性是,通过GPTs或类似的功能创造自己的GPT,会让一些“中介应用”变得不那么重要了。在PC时代尤其是移动互联网时代,“开发者”发挥的是在平台上的中间人角色,大多数人和商业公司不可能自己搭建一个办公OA、学习软件、内部交流系统等等,需要有开发者作为“中间商”提供服务。现在,与AI的直接自然语言对话让这件事变得容易多了,一些更聪明的个体和组织就可以直接上手干了。这就是传说中的AI Agent。那些有着非常强个人和组织定制需求的功能,都肯定通过Agent实现。当然,更复杂的人与人、组织与组织、人与组织的协同仍然需要掌握一定AI能力的开发者作为“中间商”,所以它们仍有新的价值。

17. 讲一下这件事与中国的关系。一句话:关系相当密切。中国人是最有创造力的,尤其是在与商业和让生活事业变得更好的方面。让有创造力的“生意人”成为AI时代的主力开发者,中国人和中国公司是不可能缺席的。我总觉得不要轻视中国科技公司在这个领域的进步和前瞻性,我举两个例子。

18. 第一个,前不久百度的“百度世界大会”,我参与了前期讨论,大家对“Prompt the World”的主题讨论颇多,也有争论。我是赞成派,因为我觉得“prompt”就是未来的“编程”和“开发”,百度的“文心一言”能不能支持基于它直接开发低代码甚至无需代码的原生AI应用呢?我觉得能。我们很多时候太爱讨论AI的“涌现”和“自我意识”了,为什么不先上手用用它干具体的事儿呢?

19. 第二个:我的事业导师、开发者社区CSDN创始人蒋涛老师最近在一个地方,培训了一批中学学科老师,用生成式AI开发出他们自己需要的教学课件和教学工具。这件事更恰如其分地体现了什么人能成为AI时代的“开发者”,善莫大焉。

20. 我们应该也是新的“开发者”,没被杀死的那种。现在,我要去GPT上参与开发我们自己的GPTs了。I will build myself。

5 views0 comments

Recent Posts

See All

文捕

DeepSeek

Comments


bottom of page