面壁智能:打破“云端神话”,MiniCPM

在2026年初的科技圈,出现了一种有趣的现象:二手市场上的Mac Mini忽然成了理财产品,价格一路飙升。究其原因,是一个名为OpenClaw(及其前身Moltbot)的开源项目在GitHub上火爆,全球的开发者和技术极客们迅速聚焦于这一新兴技术。大家一致认为:我们不再仅满足于与ChatGPT通过网页框互动,我们需要一个更智能的“数字分身”,一个可以接管鼠标和键盘,整理本地文件、管理事务的“私人管家”。

然而,随着热潮的兴起,问题也逐渐暴露。当你兴奋地在本地部署OpenClaw,看到它接管电脑时,你很快会意识到,这个“智能管家”其实只是一个把你的隐私数据发送到云端进行处理的“搬运工”。每次屏幕截图的分析、语音指令的理解,都需要跨越千里光缆传输到云端,再返回给你。延迟、隐私泄露、以及断网后的失效问题,顿时让“本地管家”的智能变得脆弱不堪。

就在这股风潮蔓延之际,我走进了五道口的科建大厦。与外界对Agent概念的疯狂追捧不同,这里正在进行的发布显得有些“逆流而行”。面对着DeepSeek、Qwen、GLM等大厂即将发布大参数模型的热度,面壁智能却依然坚持推出一个仅有90亿参数(9B)的MiniCPM-o 4.5小模型,并搭配了一块看似普通的硬件开发板——松果派(Pinea Pi)。他们试图解决一个被当前热潮忽略的核心问题:如果AI真的要接管我们的生活,它是否能把“脑子”放在自己的“身体”里?

与那些追求巨型参数、追求云端算力的模型不同,面壁智能的MiniCPM-o 4.5展现的是一个全新的AI演化分支——从“云端神谕”变为“指尖直觉”。在这里,AI的智能将不再依赖于远程云端计算,而是在端侧自给自足,快速反应。

语音交互的革命:告别“对讲机”

长久以来,人与AI的语音交互都被困在“回合制”模式中。这种体验就像是在使用老式的对讲机——你说完话后,必须等待AI判断你“闭嘴”,才能发出回复。而在这一过程中,AI的耳朵是“聋的”,它无法在你说话时同时倾听或者做出反应。

在面壁智能的演示中,清华大学人工智能学院助理教授、面壁智能多模态首席科学家姚远展示了“全双工”(Full-duplex)技术的威力。这一技术突破让AI从“机器”跨越到了“人”的阶段。

在演示现场,姚远向我们展示了MiniCPM-o 4.5如何实时处理双向交互的场景:一个人在白板上画画,AI不仅能够实时评论画作,还能在不打断交流的情况下,识别画面中的变化并及时作出反应。比如,当画到一半时,AI迅速判断出画的是一个卡通人物,而非海洋,立即调整回应:“哦!看见那两个圆圆的眼睛了,原来是个卡通小人啊,这表情看着挺乐呵。”这一过程让人惊讶:AI能够在同时听和说的情况下做出迅速的决策,这一进步几乎摧毁了“回合制”交互的束缚。

这一突破不仅仅是技术上的提升,更是体验上的革命。MiniCPM-o 4.5的“感知不中断”能力让AI变成了一个始终在线的观察者。它能够以1Hz的频率进行实时决策:当前环境变化是否值得打断?这种实时、多并发的交流方式,才是现实生活中人类与周围世界互动的方式。正是这种颠覆性的“感知不中断”能力,才让AI从“工具”变成了一个更接近人类的伴侣。

“9B的反击”:用“密度法则”对抗“暴力美学”

在如今大厂竞相发布千亿甚至万亿参数模型的背景下,面壁智能却坚持使用9B的小模型,这一决策引发了广泛关注。为何面壁不走“大参数”的路线?在与面壁智能首席科学家刘知远教授的交流中,他详细阐述了面壁智能的核心理论:“密度法则”(Densing Law)。

刘教授解释道,传统的AI发展轨迹遵循“尺度法则”(Scaling Law),即模型越大,能力越强。但他认为,随着芯片技术的不断进步,AI的发展应转向“知识密度”的提升,而非单纯追求模型的体积。就像芯片的“摩尔定律”,并非将芯片做得更大,而是通过更先进的技术在有限空间内增加晶体管的密度。同理,AI的未来在于提高模型的“知识密度”,而不是单纯追求参数的膨胀。

MiniCPM-o 4.5就是这一理论的成果,它通过高度优化的架构,将视觉理解、文档解析、语音理解等多模态能力集成到一个仅9B参数的小模型中。这使得MiniCPM-o 4.5不仅能在手机、车机等资源有限的端侧设备上运行,还能提供与大模型相媲美的表现。

松果派:打造AI“躯体”的阳谋

如果说MiniCPM-o 4.5是面壁智能的“大脑”,那么松果派(Pinea Pi)则是它试图定义的“躯体”。这一硬件开发板并非普通的树莓派开发板,而是一个高度集成的AI智能体原生套件。松果派内置了强大的Orin AGX 64G模组,直接集成了高清摄像头和麦克风阵列,使得开发者可以在不需要额外硬件的情况下,快速实现AI感知和理解能力。

面壁智能的COO雷升涛分享了一个真实的例子:他们曾为一家车企开发遗留物提醒功能,最初的延迟达到4秒,导致车机在你已经走出车外时才提醒你忘带手机。经过深入底层的优化,他们将延迟压缩至1秒以内,大大提高了功能的实用性。这个经历让面壁团队意识到,只有在硬件上做到极致优化,才能让AI“大脑”发挥出最大的潜力。

松果派的发布,不仅是面壁智能在硬件领域的尝试,更是一个“阳谋”:通过这款硬件,面壁智能为整个行业提供了一个关于“端侧智能”的标准,明确了如何设计与AI模型原生兼容的硬件架构。

具身智能的“最后一公里”:1Hz vs 10Hz

如今,机器人行业面临着一个尴尬的局面:虽然运动控制技术已经十分成熟,机器人能够完成各种精确的运动任务,但在决策和理解方面却严重不足。正如李大海在采访中所提到的,现有的机器人具有“10Hz的小脑”,但缺乏“1Hz的大脑”。

1Hz的智能代表的是深度思考、规划和环境理解。MiniCPM-o 4.5的诞生,正是要填补这个空白,它不仅可以为机器人提供实时的环境感知和决策支持,还能确保在没有网络连接的情况下也能保持高效运作。这种“端侧大脑+本地小脑”的架构,是具身智能迈出实验室、走向家庭的重要一步。

面壁智能的未来:端侧智能的突破

李大海在现场的回答显示,面壁智能并不与大厂正面竞争,而是选择在高度碎片化的端侧市场中深耕细作。无论是汽车、手机、PC、机器人,还是智能眼镜,每个终端的需求都不同,而面壁智能正致力于打造适应不同硬件和场景的“智能解决方案”。

MiniCPM-o 4.5的推出,不仅仅是一款智能模型,它代表了面壁智能在端侧生态中的根基建设。通过开源模型和参考硬件,面壁正在构建一个巨大的端侧智能生态,让AI从云端走向每一个设备、每一个终端,带来更快速、更安全的智能体验。