面壁智能：打破“云端神话”，MiniCPM

在2026年初的科技圈，出现了一种有趣的现象：二手市场上的Mac Mini忽然成了理财产品，价格一路飙升。究其原因，是一个名为OpenClaw（及其前身Moltbot）的开源项目在GitHub上火爆，全球的开发者和技术极客们迅速聚焦于这一新兴技术。大家一致认为：我们不再仅满足于与ChatGPT通过网页框互动，我们需要一个更智能的“数字分身”，一个可以接管鼠标和键盘，整理本地文件、管理事务的“私人管家”。

然而，随着热潮的兴起，问题也逐渐暴露。当你兴奋地在本地部署OpenClaw，看到它接管电脑时，你很快会意识到，这个“智能管家”其实只是一个把你的隐私数据发送到云端进行处理的“搬运工”。每次屏幕截图的分析、语音指令的理解，都需要跨越千里光缆传输到云端，再返回给你。延迟、隐私泄露、以及断网后的失效问题，顿时让“本地管家”的智能变得脆弱不堪。

就在这股风潮蔓延之际，我走进了五道口的科建大厦。与外界对Agent概念的疯狂追捧不同，这里正在进行的发布显得有些“逆流而行”。面对着DeepSeek、Qwen、GLM等大厂即将发布大参数模型的热度，面壁智能却依然坚持推出一个仅有90亿参数（9B）的MiniCPM-o 4.5小模型，并搭配了一块看似普通的硬件开发板——松果派（Pinea Pi）。他们试图解决一个被当前热潮忽略的核心问题：如果AI真的要接管我们的生活，它是否能把“脑子”放在自己的“身体”里？

与那些追求巨型参数、追求云端算力的模型不同，面壁智能的MiniCPM-o 4.5展现的是一个全新的AI演化分支——从“云端神谕”变为“指尖直觉”。在这里，AI的智能将不再依赖于远程云端计算，而是在端侧自给自足，快速反应。

语音交互的革命：告别“对讲机”

长久以来，人与AI的语音交互都被困在“回合制”模式中。这种体验就像是在使用老式的对讲机——你说完话后，必须等待AI判断你“闭嘴”，才能发出回复。而在这一过程中，AI的耳朵是“聋的”，它无法在你说话时同时倾听或者做出反应。

在面壁智能的演示中，清华大学人工智能学院助理教授、面壁智能多模态首席科学家姚远展示了“全双工”（Full-duplex）技术的威力。这一技术突破让AI从“机器”跨越到了“人”的阶段。

在演示现场，姚远向我们展示了MiniCPM-o 4.5如何实时处理双向交互的场景：一个人在白板上画画，AI不仅能够实时评论画作，还能在不打断交流的情况下，识别画面中的变化并及时作出反应。比如，当画到一半时，AI迅速判断出画的是一个卡通人物，而非海洋，立即调整回应：“哦！看见那两个圆圆的眼睛了，原来是个卡通小人啊，这表情看着挺乐呵。”这一过程让人惊讶：AI能够在同时听和说的情况下做出迅速的决策，这一进步几乎摧毁了“回合制”交互的束缚。

这一突破不仅仅是技术上的提升，更是体验上的革命。MiniCPM-o 4.5的“感知不中断”能力让AI变成了一个始终在线的观察者。它能够以1Hz的频率进行实时决策：当前环境变化是否值得打断？这种实时、多并发的交流方式，才是现实生活中人类与周围世界互动的方式。正是这种颠覆性的“感知不中断”能力，才让AI从“工具”变成了一个更接近人类的伴侣。

“9B的反击”：用“密度法则”对抗“暴力美学”

在如今大厂竞相发布千亿甚至万亿参数模型的背景下，面壁智能却坚持使用9B的小模型，这一决策引发了广泛关注。为何面壁不走“大参数”的路线？在与面壁智能首席科学家刘知远教授的交流中，他详细阐述了面壁智能的核心理论：“密度法则”（Densing Law）。

刘教授解释道，传统的AI发展轨迹遵循“尺度法则”（Scaling Law），即模型越大，能力越强。但他认为，随着芯片技术的不断进步，AI的发展应转向“知识密度”的提升，而非单纯追求模型的体积。就像芯片的“摩尔定律”，并非将芯片做得更大，而是通过更先进的技术在有限空间内增加晶体管的密度。同理，AI的未来在于提高模型的“知识密度”，而不是单纯追求参数的膨胀。

MiniCPM-o 4.5就是这一理论的成果，它通过高度优化的架构，将视觉理解、文档解析、语音理解等多模态能力集成到一个仅9B参数的小模型中。这使得MiniCPM-o 4.5不仅能在手机、车机等资源有限的端侧设备上运行，还能提供与大模型相媲美的表现。

松果派：打造AI“躯体”的阳谋

如果说MiniCPM-o 4.5是面壁智能的“大脑”，那么松果派（Pinea Pi）则是它试图定义的“躯体”。这一硬件开发板并非普通的树莓派开发板，而是一个高度集成的AI智能体原生套件。松果派内置了强大的Orin AGX 64G模组，直接集成了高清摄像头和麦克风阵列，使得开发者可以在不需要额外硬件的情况下，快速实现AI感知和理解能力。

面壁智能的COO雷升涛分享了一个真实的例子：他们曾为一家车企开发遗留物提醒功能，最初的延迟达到4秒，导致车机在你已经走出车外时才提醒你忘带手机。经过深入底层的优化，他们将延迟压缩至1秒以内，大大提高了功能的实用性。这个经历让面壁团队意识到，只有在硬件上做到极致优化，才能让AI“大脑”发挥出最大的潜力。

松果派的发布，不仅是面壁智能在硬件领域的尝试，更是一个“阳谋”：通过这款硬件，面壁智能为整个行业提供了一个关于“端侧智能”的标准，明确了如何设计与AI模型原生兼容的硬件架构。

具身智能的“最后一公里”：1Hz vs 10Hz

如今，机器人行业面临着一个尴尬的局面：虽然运动控制技术已经十分成熟，机器人能够完成各种精确的运动任务，但在决策和理解方面却严重不足。正如李大海在采访中所提到的，现有的机器人具有“10Hz的小脑”，但缺乏“1Hz的大脑”。

1Hz的智能代表的是深度思考、规划和环境理解。MiniCPM-o 4.5的诞生，正是要填补这个空白，它不仅可以为机器人提供实时的环境感知和决策支持，还能确保在没有网络连接的情况下也能保持高效运作。这种“端侧大脑+本地小脑”的架构，是具身智能迈出实验室、走向家庭的重要一步。

面壁智能的未来：端侧智能的突破

李大海在现场的回答显示，面壁智能并不与大厂正面竞争，而是选择在高度碎片化的端侧市场中深耕细作。无论是汽车、手机、PC、机器人，还是智能眼镜，每个终端的需求都不同，而面壁智能正致力于打造适应不同硬件和场景的“智能解决方案”。

MiniCPM-o 4.5的推出，不仅仅是一款智能模型，它代表了面壁智能在端侧生态中的根基建设。通过开源模型和参考硬件，面壁正在构建一个巨大的端侧智能生态，让AI从云端走向每一个设备、每一个终端，带来更快速、更安全的智能体验。