技术社区热议OpenClaw项目,其构建免费、安全、始终在线的本地AI代理的方案在Hacker News上获106个赞。帖子标题"OpenClaw可骗不了我。我还记得MS-DOS"将现代AI工具与MS-DOS时代的简洁性对比,表达对技术复杂性的警惕。该方案强调本地部署的隐私保护与持续可用性。
技术社区热议OpenClaw项目,其构建免费、安全、始终在线的本地AI代理的方案在Hacker News上获106个赞。帖子标题"OpenClaw可骗不了我。我还记得MS-DOS"将现代AI工具与MS-DOS时代的简洁性对比,表达对技术复杂性的警惕。该方案强调本地部署的隐私保护与持续可用性。
华为发布Pura 90系列及Pura X Max等新机,余承东现场表示受内存价格上涨影响,新手机定价压力较大,成本上涨明显,后期可能涨价。此前OPPO、vivo、小米等安卓厂商已于3月至4月陆续调整部分产品价格。业内人士称,AI算力需求爆发叠加供应链控产等因素推动内存价格持续走高,苹果正高价扫货移动DRAM进一步挤压竞争对手备货空间。
小米澎湃OS 3发布多项功能升级。超级小爱新增三指上滑触发"小爱记忆"及气泡上岛功能;CarWith支持经典桌面自定义布局、小米超级岛显示及Carlink极简小窗模式;文件管理新增桌面文件夹快捷方式及远程访问功能;小米智能卡支持接收iPhone分享的卡钥匙。此外,短信新增验证码轰炸拦截,时钟新增计时结束振动提醒。
华为在Pura系列发布会上推出Pura 90系列手机。其中Pro和Pro Max版本搭载全新麒麟9030S处理器,该芯片NPU图像理解能力提升200%,AI ISP色彩引擎提升43%,长焦视频清晰度提升110%,防抖精度提升30%。标准版则搭载麒麟9010S处理器,该芯片此前已用于nova 15 Ultra,相较上代产品整机性能提升18%。
华为 MateBook 14 鸿蒙版于4月20日发布,为首款全面搭载鸿蒙操作系统的轻薄本。该机配备14.2英寸2.8K OLED云晰柔光屏,支持120Hz刷新率与100% sRGB/P3广色域,可减少99%环境干扰光。机身采用波点圆键盘设计与追色工艺,提供原野绿、樱粉金、深空灰三色。接口涵盖双USB-A、USB-C及HDMI。内置智慧助手"小艺"支持慧记、深度解题等AI功能,针对办公与学习场景全面提效。
华为AI眼镜正式发布,提供钛银灰、流光银、摩登黑三款配色及圆形、方形两种镜框,售价2499元起,将于4月25日开售。产品采用轻量化设计,镜架仅重35.5克,镜腿薄至6.25毫米,基于超30万亚洲头形数据构建平衡架构。内置自研AI芯片,支持语音唤醒、AI交互、第一人称视角拍摄及支付宝支付等功能,综合续航达12小时,支持连续8小时通话或9小时音乐播放。
开发者发布了一个基于 Gemma 4 和 E2B 的 Prompt-to-Excalidraw 浏览器演示,支持通过自然语言提示直接生成 Excalidraw 手绘图表。该方案将 3.1GB 的 Gemma 4 模型完全部署在浏览器端本地运行,借助 E2B 沙箱环境实现前端 AI 推理,无需后端服务器支持。项目在 Hacker News 获得 101 个赞。
研究团队为 Ray-Ban Meta 智能眼镜开发了 OpenClaw 智能体,旨在探索持续感知型 AI 如何改变用户使用智能体系统的方式。这项研究表明,集成该智能体的全天候智能眼镜能够加速日常任务处理,展示了始终开启的 AI 助手在可穿戴设备上的应用潜力。
研究团队提出Sentinel-Bench框架,基于Qwen-3.5-9B执行840次实验,对比System 1与System 2在Optimism DAO对抗性数据集上的表现。结果显示System 1基线达成100%对抗鲁棒性与司法一致性,状态最终性仅需13秒;而System 2引发26.7%认知崩溃率,导致共识稳定性降至72.6%并带来17倍延迟。研究还发现1.5%的"推理诱导谄媚"现象。实验证明,在拜占庭容错约束下,边缘原生SLM采用System 1参数化直觉优于System 2迭代审议。
PyCon US 2026将于5月13日至19日在加州长滩举办,为2017年来首次回归西海岸。本届大会新增AI与安全专题轨道,AI专题于周五举行,含8场演讲,涵盖AI辅助开发、模型量化部署、浏览器端推理等,由Anthropic的Zac Hatfield-Dodds等联合主持。预计超2000名开发者参会,另设开放空间、闪电演讲和项目冲刺等社区活动。
阶跃 Step 3.5 Flash 大规模上车极氪8X,深度集成该模型的整车智能体超级 Eva 随车量产上市。超级 Eva 融合阶跃三款大模型:Step 3.5 Flash 作为核心大脑,提供模糊指令理解与多步骤任务规划;语音大模型带来低延迟、更自然的交互;视觉理解模型可感知车外环境并决策,如判断路况、找车位。即日起用户可在极氪8X驾驶场景中体验。未来超级 Eva 将覆盖更多车型。
研究团队推出GlobalSplat框架,采用"先对齐后解码"策略,通过学习紧凑的全局潜在场景表示来解析跨视图对应关系,再解码显式3D几何,有效解决了传统方法因局部分配策略导致的全局一致性差和表示冗余问题。该框架在RealEstate10K和ACID数据集上仅需16K Gaussians(4MB存储)即可实现高质量新视角合成,单次前向传播推理速度达78毫秒以内,显著优于密集基线方法。
MacMind是一个在1989年款Macintosh电脑上运行的变压器神经网络项目,使用苹果经典的HyperCard超媒体工具开发。该项目将现代Transformer架构完整移植到36年前的复古硬件上,突破了早期Mac的内存与性能限制。开发者已将代码开源至GitHub,项目在Hacker News发布当日获得102个赞,展现了复古计算与现代AI结合的工程挑战。
技术博客sleepingrobots.com发布文章《停止使用Ollama》,对本地大模型运行工具Ollama提出严厉批评并呼吁用户放弃使用。该文在Hacker News技术社区获得132个积分关注,反映出开发者社区对本地AI工具安全性与实践标准的重视。文章标题直指Ollama存在架构缺陷或安全隐患,建议用户寻找更可靠的替代方案来部署开源大语言模型。
Darkbloom 发布了一款工具,支持在闲置 Mac 电脑上执行私有 AI 推理,利用本地空闲算力完成机器学习计算,避免数据上传云端。该项目主打隐私保护,所有推理均在设备本地运行。该消息在 Hacker News 上获得 113 个点赞,详情见 darkbloom.dev。
EdgeDetect面向6G-IoT带宽受限环境,提出一种通信高效且隐私感知的联邦入侵检测方案。其核心创新"梯度智能化"通过基于中位数的统计二值化将梯度压缩为{+1,-1}表示,使上行负载降低32倍,并集成Paillier同态加密抵御梯度推断攻击。在CIC-IDS2017数据集(280万流,7类攻击)上,系统实现98.0%准确率和97.9%宏F1分数,通信开销从450MB/轮降至14MB(减少96.9%)。树莓派4实测显示单次推理仅需4.2MB内存、0.8ms延迟及12mJ能耗,准确率损失不足0.5%;即便面临5%投毒攻击,仍保持87%准确率与0.95少数类F1值。
Forge-UGC是面向异构加速器(如Intel NPU)的transformer四阶段编译器,通过torch.export捕获ATen图,经六种优化pass削减节点14.2%-21.9%,并采用线性扫描缓冲区分配与设备亲和性调度,使峰值缓冲区减少30%-48%、NPU-CPU切换降低42%-65%。在125M至8B参数模型测试中,较OpenVINO等编译速度提升6.9-9.2倍,推理延迟降低18.2%-35.7%,能耗减少30.2%-40.9%,且保持数值精度(logit差异<2.1e-5)。
彭博社记者Mark Gurman披露,苹果正在研发一款完全舍弃显示屏的智能眼镜,转而将其定位为纯AI可穿戴设备。与传统AR眼镜不同,该设备不配备视觉显示功能,而是专注于人工智能交互能力。此举显示苹果正积极布局AI硬件赛道,寻求在可穿戴设备领域的创新突破。目前具体发布时间尚未公布。
苹果在生成式AI竞赛中虽被贴上"输家"标签,却可能凭借隐私优先策略与设备端计算能力构建意外护城河。不同于依赖云端的竞争对手,苹果通过Apple Intelligence将AI处理留在本地,利用其超过20亿活跃设备的生态系统优势,以低硬件成本实现AI功能普及。这种"边缘计算"模式不仅规避了数据隐私风险,更可能重塑AI部署的经济模型,使苹果在AI应用落地层面实现差异化胜出。
SuperLocalMemory V3.3("活脑")作为本地优先的Zero-LLM智能体记忆系统发布,实现完整认知记忆分类。核心创新包括:Fisher-Rao量化感知距离(FRQAD)以100%精度识别高保真嵌入;艾宾浩斯自适应遗忘曲线实现6.7倍区分力;7通道认知检索(语义、关键词、实体图、时间、扩散激活、巩固、Hopfield联想)在LoCoMo基准零LLM模式下达70.4%,多跳任务提升23.8个百分点。支持长时内隐记忆参数化与自动认知管道,纯CPU运行,月下载超5000次。
StateSMix是一种无需预训练、完全自包含的无损压缩器,它在线训练Mamba风格状态空间模型(SSM),并结合稀疏N-gram哈希表与算术编码。SSM提供基于BPE词元的动态概率估计,N-gram表则通过仅更新非零计数词元的机制实现精确上下文记忆。系统采用熵自适应缩放来平衡二者贡献。在enwik8基准测试中,其压缩效果优于xz -9e,其中SSM是主要压缩引擎,仅其自身就比频率计数基线减少46.6%体积,而N-gram带来额外4.1%增益。该系统由纯C语言实现,支持AVX2 SIMD并行,在普通x86-64硬件上处理速度约为每秒2000词元。
Google DeepMind 发布了 Gemma 4 系列开源模型,旨在直接在设备端实现多步骤规划和自主智能体工作流。该版本包含用于实验“智能体技能”的 Google AI Edge Gallery,以及为开发者提供显著速度提升和结构化输出的 LiteRT-LM 库。Gemma 4 采用 Apache 2.0 许可,支持超过 140 种语言,并兼容移动设备、台式机及树莓派等多种物联网硬件平台。
Google 正式发布了 Gemma 4,这是一款前沿的多模态人工智能模型,其核心特点是能够在设备端本地运行。该模型通过开源方式发布,旨在推动人工智能技术的进步与民主化。Gemma 4 的“在设备端”能力意味着数据处理可在本地完成,无需持续连接云端,这有望提升响应速度、增强隐私保护并实现离线使用。此举是 Google 通过开源和开放科学来普及人工智能的持续努力的一部分。
IBM Granite团队发布了Granite 4.0 3B Vision模型,这是一个专为企业文档处理设计的紧凑型多模态大语言模型。该模型参数为30亿,具备视觉理解能力,能够同时处理文本和图像信息,特别针对报告、表格、图表等企业文档进行优化。其紧凑尺寸旨在降低部署和运行成本,使企业能够在资源受限的环境中高效实现文档智能分析、信息提取和知识管理。模型已在Hugging Face平台发布。
NXP在Hugging Face发布技术博客,详细介绍了将视觉语言动作模型应用于嵌入式机器人系统的完整流程。核心工作包括构建真实世界的机器人交互数据集,对VLA模型进行针对性微调,以及实施一系列设备端优化以实现高效部署。该方案旨在解决大型模型在资源受限的嵌入式硬件上运行的挑战,推动机器人AI在边缘端的实际应用。
inclusionAI发布了ZwZ-4B-GGUF模型。该模型基于开源与开放科学理念,旨在推动人工智能技术的进步与普及。其核心变化是提供了GGUF格式,这是一种高效且通用的模型文件格式,便于在不同硬件和推理框架上部署与运行。此举旨在降低大型语言模型的使用门槛,促进更广泛的研究与应用开发。
inclusionAI推出开源模型ZwZ-2B-GGUF,致力于通过开源与开放科学推动人工智能技术的进步与民主化。该举措旨在降低AI开发与应用的门槛,促进更广泛的社区参与和创新。模型以开放协作和科学共享为核心路径,强调技术普及与包容性发展。
inclusionAI 团队发布了 AReaL-tau2-telecom-user-sft-30B 模型。这是一个拥有 300 亿参数、专门针对电信领域用户服务场景进行监督微调的大语言模型。该模型的发布旨在通过开源和开放科学的方式,推动人工智能技术的进步与普及,使其更易于获取和应用。
inclusionAI团队发布了AReaL-tau2-telecom-sft-30B模型,这是一个拥有300亿参数、专门针对电信领域进行监督微调(SFT)的大型语言模型。该模型基于开源与开放科学理念构建,旨在推动人工智能技术的进步与普及。其核心变化在于针对电信行业的特定任务和数据进行了深度优化,以提升在该垂直领域的专业性能和应用效果。
inclusionAI 发布了针对零售业优化的 AReaL-tau2-retail-sft-30B 模型,参数量达 300 亿,采用监督微调技术。该模型致力于通过开源与开放科学推动人工智能的进步与普及,旨在降低技术使用门槛,促进AI在零售领域的专业化应用与创新。
inclusionAI 发布了 ZwZ-2B 模型,这是一个拥有 20 亿参数的开源语言模型。该模型旨在通过开源和开放科学的方式推动人工智能的进步与民主化。其上下文处理长度扩展至 128K,并在多项基准测试中性能显著提升,特别是在代码生成和数学推理任务上表现出色。ZwZ-2B 的发布为研究者和开发者提供了一个更易获取的高性能 AI 工具。
Google 发布 Gemini 3.1 Flash-Lite,为 Gemini 3 系列中速度最快、成本效益最高的模型,面向大规模智能应用场景优化。
Apple 发布了搭载 M5 芯片的全新 MacBook Air,为这款全球最受欢迎的笔记本电脑带来卓越性能和扩展的 AI 能力。新款 MacBook Air 在性能上实现显著提升,并增强了人工智能相关功能,进一步巩固其在轻薄本市场的领先地位。