📸 MiniCPM-V 4.6 - one of the strongest vision models under 2B params - now runs at ~51 tok/s on iPhone 17 Pro via Apple...
微信小微Agent常驻左上角,支持语音/文本输入,基座模型为微信自研WeLM(WeLM-V4-80B MoE,激活3B)及DeepSeek。可发消息、红包、语音通话,但每一步需用户确认,且禁止批量发送、读取聊天记录、转发笔记等。已打通朋友圈(限最近2天)、公众号、视频号,支持通过小程序进行本地生活、出行、充值等操作。当前权限“只读不动”,不能删除好友或取消关注。作者认为这是微信最大更新,但在智能程度和便捷性上仍有不足。
I wanted to learn about humanoid robots 🤖, then decided the most reasonable thing to do was build myself a humanoid cat...
用户将截图丢给 StepFun 的 step-3.7-flash 模型(运行在 Codex 中),2 分多钟生成可用的网页版文章头图生成器,支持修改文案和导出 PNG,总成本仅 $0.06。模型能自行理解参考图并实现完整功能逻辑,但视觉还原度仅六七分,手绘涂鸦风需手动调整。StepFun 同步推出 Startup Program,早期团队可获 API 额度、生态支持及资源对接。
为解决多 Agent 下 Skills 存放混乱问题,宝玉提出:Skills 只装在项目内以节省 LLM 上下文窗口;所有原件统一存放于 ~/GitHub,每个项目通过软链接指向原件,再为 Claude Code 创建 .claude/skills → .agents/skills 入口。更新只需拉取一次源码,所有项目自动同步;修复 bug 可直接反哺开源项目。用户可用自然语言让 Agent 自动创建软链接,无需记忆命令。
我快疯了。日常同时用 4个 coding agent,skills 各写各的: /.agents/skills、/.codex/skills、~/.claude/skills 已经一团浆糊,CC 里找不到 Codex 的 skill,反过来...
VoxCPM now runs FULLY on-device on iPhone - via Apple's Core AI. @OpenBMB's diffusion TTS (MiniCPM4 LM + LocDiT flow-mat...
Codex新功能Record & Replay可将浏览器操作录制成可复用的Skill。实测解决两个痛点:定向信息搜索时自动打开X搜热点、统计高赞帖子、提取关键词重新查询,输出带互动指标的表格和短关键词库,满足60%-70%图文素材需求;视频剪辑上传能完成静音检测、加速、导出GIF等固定流程,但上传可能被网站安全策略拦截,建议先让Codex出Plan判断可行性。Codex能理解意图,例如自动在输入Grok前增加中文关键词组合。目前依赖Computer Use和图片理解,操作慢且偶有误判,但已能将人的操作转化为Agent下次可执行的上下文,替代传统RPA和Replay。
用户出差在飞机上,通过Bloome Agent直接生成两份客户续费合同,无需打开电脑、无需多言。Agent还主动记忆并询问之前的报价信息,整体体验轻松愉快。用户感叹AI时代让“顶级牛马”也能享受老板般的待遇。
微信近日内测AI智能体“小微”,常驻左上角,支持语音或文本输入,调用WeLM-V4-80B(MoE激活3B)与DeepSeek模型。可向个人/群聊发消息、发起视频通话、发红包或转账,需用户逐项确认;可查询朋友圈(限最近2天)、公众号、视频号,支持创建提醒、笔记、小工具,并能操作奶茶咖啡、打车、电影票等小程序至最后一步后交给用户。小微具备记忆功能,可记录地址等。聊天记录上下文仅在特定入口可用且限最近2天。整体策略“只读不动”,禁止批量发送、定时、删除联系人等操作。微信以谨慎节奏接入AI,是国民级应用全面拥抱AI的重要信号。
同一事件,精选展示《微信Agent小微灰度内测:主入口发消息红包,子入口可读聊天记录》Made it to SF! The love for GLM-5.2 has been incredible. We are bringing team out for the AI Engineer World's Fair, wher...
Andrew Ng分享了AI时代如何组织工程团队以加速:1到10人的团队由高度授权的通才组成,保持高语境。当代码生成速度大幅提升后,组织反而成为瓶颈——功能从想法到原型只需一天,迫使产品、设计、营销、法务等所有环节同步加速。他的解决方案是让少数高语境通才团队独立决策,避免跨部门翻译带来的延迟。源自LangChain YouTube频道。
艺电(EA)企业发展总裁劳拉·米耶勒称,生成式 AI 能简化游戏制作流程、减轻开发者重复劳动,提升原型制作与创意产出速度。当前开发周期已从 PS2 时代的 18 个月拉长至五年以上,AI 被视为填补效率缺口的关键。EA 首席执行官安德鲁·威尔逊将 AI 定位为创意、创新与玩家联结的助推器,团队正用 AI 优化开发、扩容和个性化定制,包括动态大世界、批量生成真实运动员与球队形象等。EA 对 AI 的押注与其价值 550 亿美元(约 3740.22 亿元人民币)的杠杆收购交易绑定,该交易能否落地部分取决于 AI 压缩成本、拉高利润的成效。
FromSoftware 在《艾尔登法环》等魂系游戏中采用低技术门槛的 AI 决策实现。AI 逻辑编写在 Havok Script(面向游戏的 Lua 实现)中,核心工具是“Goal”(目标)——一个带参数的不可变函数表。多个 Goal 按栈结构组织成下推自动机(PDA),而非有限状态机。每帧更新栈顶 Goal,该 Goal 可推送子 Goal 至栈顶,下帧执行;更新返回 Continue、Success 或 Failure 控制栈的弹出与清空。Goal 通过随机数、目标距离、动画冷却等动态调整权重。此外支持 Interrupt 回调,允许对角色身上配置的外部事件做出即时响应。
OpenAI 发布 Codex Remote 工程实践官方博客。核心心智模型:手机是“控制面”而非终端——开发机跑代码,手机负责启动、指挥、审批、审查。十大高杠杆能力包括 Queue vs Steer、Side Chat、Plan vs Goal、对话内 Code Review、细粒度权限管理等。另有 /status /compact /fork 命令与五个典型工作流(Release Captain、中断修复、移动端审查等)。对 AI coding agent 的启示:异步协作、注意力与状态机管理、目标约束、生产级权限粒度。
If you missed last week, Mastering Codex Remote for Engineering is now available as a blog post on our developer platfor...
博主用自进化重型求解器Apodex测试“AI Agent公司如何选择产品方向”。Deep Discovery模式下,Apodex拆解为开发者工具、企业工作流、研究助手三条线,补充VC视角、市场规模等来源,持续验证后给出排序:1. 垂直企业工作流Agent(有明确买方和成本替代逻辑);2. 垂直研究助手(需针对法律、金融等高价值场景);3. 开发者工具(竞争被Codex、Cursor、Claude Code等占据)。Apodex强调先验证后下结论,适合变量多、需取舍的复杂议题。体验入口apodex.ai,Hugging Face可下载模型。
苹果在 macOS 27 Beta 2 中封堵了一条终端命令,该命令此前可绕过候补名单直接启用新版 Siri AI。Beta 1 中用户输入 sudo defaults write ... 即可跳过等待,但 Beta 2 已禁止。网友发现另一种方式:升级最新 Beta 后,用“图乐园”生成图片,多次点击“更多”菜单中的“图像有问题”发送反馈,可能解锁 Siri AI,该方法也适用于 iOS 27。
Anthropic 为 Claude Tag 推出智能体身份模型,Claude 在团队频道拥有独立账号,权限按频道配置可覆写,撤销身份即可终止访问。AI 编码代价方面,Meta 一次 AI 生成代码(无人工验证)导致 Instagram 密码重置漏洞,CISO 离职;Amazon 核心平台中断;GitHub 因负载增长三倍不稳定。腾讯云开发者介绍 Harness 工程:同一 LLM 换装更精巧外架构后,TerminalBench 2.0 通过率从 52.8% 升至 66.5%,排名从 30 名外进入前 5。
Anthropic 为 Claude Tag 推出智能体身份访问模型,赋予 AI 独立账号体系。Meta 因 AI 生成代码未经人工复核导致 Instagram 漏洞
http://x.com/i/article/2069568375752445952
一项针对10个开源模型、4个安全基准的研究发现,大语言模型在遭遇对抗性前缀攻击(模型被植入有害开篇并继续生成)后,无法可靠识别自己的输出已被外部引导。模型所谓的“自我意识”更像安全机制的延迟反射:拒绝受攻击回答时通常引用政策或缺乏意图,而非检测到输出被篡改的机械事实。平均有27.3%的受攻击响应被模型误认为自身意图,表明自我报告证据薄弱。模型的有限识别主要来自正常拒绝行为,而非对攻击的深层认知。
扎克伯格在访谈中表示,Meta 智能眼镜的难点不在堆砌 AI 功能,而在于做出人们愿意日常佩戴的产品,需在外观、舒适度和功能体验间取得平衡。本周二 Meta 推出全新系列智能眼镜,起售价 299 美元(约 2029 元),低于入门款雷朋智能眼镜,由依视路陆逊梯卡联合开发但不搭载其品牌标识。扎克伯格认为未来可穿戴设备必须与时尚融合,要让人戴出去有面子且佩戴舒适,并对比 Snap 新款 AI 眼镜因高价笨重遭吐槽。
维基百科联合创始人吉米·威尔士表示,尚不信任AI直接参与词条编辑,因为模型“幻觉”问题依然非常严重。不过AI可用来提醒编辑社区关注小众新闻。他指出,各AI平台依赖维基百科内容导致AI机器人访问量上升,人类用户访问量下降8%,并呼吁AI公司承担服务器费用,已开始封锁不守规矩的平台。
Anthropic 推出 Claude Tag,让 Claude 以团队成员身份加入 Slack 频道,可被 @提及并委派任务。团队可为其配置频道访问权限和工具,从而实现异步协作。Andrej Karpathy 评价这是 LLM UI/UX 的第三次重大重新设计:从访问网站、下载 App,演进为自包含、持久、异步的组织级实体,无缝融入人类工作流,能处理多种工作负载。
Introducing Claude Tag, a new way for teams to work with Claude. In Slack, Claude joins as a team member with access to ...
up in the middle of the night and seeing this computer on it's just the windows computer i bought for my cofounder so he...
NVIDIA Rubin AI 服务器用 45°C 水-乙二醇冷却液直接冷却芯片和网络部件,取代传统空气冷却。在适宜气候下,干式冷却器可替代冷却塔,设施冷却水用量从约 260 万加仑/MW/年降至接近零。液冷为闭环循环,不持续蒸发水。一个 50MW AI 设施每年可节省超 400 万美元冷却能源和水费。全液冷 Rubin 服务器还将系统从 6 个机架单元缩减至 2 个,在相同空间内容纳更多计算。引用 NVIDIA 数据称,数据中心用水仅占美国日常用水量的 0.2%,液冷却正大幅降低水耗并创造热量再利用机会。
Water usage has been a hot topic in the AI data center world, but the numbers may surprise you. According to the Manhatt...
字节跳动视频生成模型 Seedance 2.0 收费:4K 15 秒需 1200 积分,折合超会约 88 元/条;一分钟广告片成本约 350 元,抽卡翻倍约 700 元。主推文指出,大模型训练和使用遵循 ROI 定律——算力、精力有限时 RL 优先选择价值最高的场景(如 coding 和短剧),模型定价高导致只有 ROI 算得过的人才用;当前 AI 仍处“替代阶段”,尚未进入“发现新价值”阶段。
Seedance 2.0 4K 15 秒要 1200 积分。 按超会来算, 一条 15 秒 4K 视频差不多 88 元, 一条 1 分钟左右的广告片, 成本大概 350 元上下。就算抽卡翻个倍700元 如果能跑出可用的 4K 商业画面, 你...
the number of providers for glm 5.2 is insane. i count 20 of them.
Kim 评论 Meta Mythos 传闻,认为其固然令人兴奋,但对 Meta 的战略意义远不及对 OpenAI 或 Anthropic 那样关键。原因是 Meta 已有稳定营收并走不同路线,其 LLM 只需足够好以维持消费者日常使用(简单问答及稍复杂任务),当前模型已胜任且持续改进。除非 Meta 计划切入自主科研等领域,否则 Mythos 级模型的真正目的何在仍存疑问。
Run Cline on Local AI models with Atomic Chat! @cline is a coding agent trusted by 8M+ developers. Write, refactor, ship...
Kiwibit Bird Feeder 2 4K AI Camera 是一款智能鸟食器,售价 $179.99 至 $249.99。设备配备太阳能板、130 度广角镜头、双向音频,支持 2.4 GHz Wi-Fi 与云存储。配套手机应用通过 Kiwibit 自有算法识别超过 10,000 种鸟类,如冠蓝鸦、乌鸦和哀鸽。测试期间成功记录 6 个物种的造访。应用会推送访客通知,并提供每种鸟类的维基百科详情。缺点是 AI 偶尔会将长时间进食的鸟误计为多次“造访”,并将偷吃种子的松鼠标记为“有害动物”。
http://transitions.dev 这个网站的动画过渡效果很不错👍 还可以安装技能,这样 Agent 可以自己为你的网页添加炫酷的动画 npx skills add jakubantalik/transitions.dev
Added new transitions to http://transitions.dev There are now 21 transitions you can copy as CSS or React code or use as...