商汤开源 SenseNova U1 完整训练代码,提供可检查、可修改、可重建的完整训练栈。同步发布 smoke-test 数据集,覆盖 t2i、it2i、多图输入、交错生成、多模态理解、视频理解、纯语言续写 7 种任务类型。用户可基于该 schema 用自有数据微调 U1,或验证数据格式及端到端测试 pipeline。数据集已上架 HuggingFace,代码托管于 GitHub。
商汤开源 SenseNova U1 完整训练代码,提供可检查、可修改、可重建的完整训练栈。同步发布 smoke-test 数据集,覆盖 t2i、it2i、多图输入、交错生成、多模态理解、视频理解、纯语言续写 7 种任务类型。用户可基于该 schema 用自有数据微调 U1,或验证数据格式及端到端测试 pipeline。数据集已上架 HuggingFace,代码托管于 GitHub。
Kim 指出,美国政府限制前沿AI能力(阻止SOTA被使用),反而让开源模型更吸引自有应用和整体市场,欧盟等国家也可受益。这吸引新投资与理想主义人才,OpenAI 和 Anthropic 将最受监管反噬,间接助推开源(尤其来自中国)。引用称,Anthropic 4月预览 Mythos 后,DeepSeek 因无法竞争而融资74亿美元;此前该实验室靠 CEO 梁文锋个人财富,现有约300人,计划至少翻倍。
Anthropic's Mythos preview reportedly pushed DeepSeek into a $7.4B fundraising - because they could not compete with Myt...
AI成本正困扰企业:Uber 4个月花光全年AI预算,微软等公司削减员工AI支出。前沿模型价格高昂,如GPT 5.5每百万输入/输出token分别收费5美元和30美元,作者用该模型修复50个TypeScript文件花费54美元。成本不可持续的原因包括:模型性能提升趋缓;开源权重模型GLM-5.2在编码测试中表现不输前沿模型,成本仅为GPT 5.5的1/10;专用芯片(TPU比H100便宜30-70%)和MoE架构改进持续降低推理成本;零转换成本使用户可瞬间切换模型;本地模型将在4-5年内因芯片进步和RAM降价普及,进一步压低云端需求。
ZCode通过Cua插件接入开源Computer Use,agent可操作macOS:截图、读无障碍树、点击、打字,绕过Apple Events权限,改用CGEvent+Accessibility API。它自行计算7×6=42,并打开Chrome导航到微博和X。GUI正变成agent也能直接操作的界面。
本周六(明天)晚上8点,姚老师与Vista将在WaytoAGI分享第二次GEO公开课,主题为GEO内容工程。活动提供飞书直播链接,建议明天直播前5分钟进入即可。
面壁智能社区开发者将MiniCPM5-1B部署于QNAP NAS(型号Qu605-N150-16G),内存占用低于2GB,通过Ollama集成至Cherry Studio作为本地LLM。借助NAS MCP协议,将文件管理、共享文件夹、语义搜索等系统能力暴露给外部Agent,实现安全本地数据访问。同时利用Qsirch索引将NAS文件构建为结构化知识库,由MiniCPM5-1B在设备端执行检索增强推理,完成摘要、问答等任务。展示轻量小模型从本地推理向系统级智能体+RAG组合演进的实践。
Eric Zakariasson 分享其AI智能体编程工作流:先设定可验证的完成标准(如模型评估分、测试全绿、p95阈值等),再将任务包装成循环——智能体反复修改、测量、保留或回退,直到达标、多轮无改进、思路用尽或遇阻。通过MCP和/notify向Slack发送通知,需要决策时主动联系人类。循环在云端运行,可同时启动多个长循环,并穿插PR、一次性调查等短任务。提示词模板用/loop驱动迭代、/notify保持更新。
开发者岚叔(LufzzLiz)开源了一个可供AI智能体调用的Skill,能将文章或架构内容自动转化为黑底手绘风格的PNG动图、GIF以及可编辑的Excalidraw JSON。实现原理:先用模型将内容压缩成结构化JSON spec,再通过本地Python + Pillow渲染。该项目旨在解决复杂内容可视化难题,目前仅内置一种风格,用户可自行扩展。开源地址已在评论中发布。
嘿嘿,skill写好了,开源了朋友们! 实现原理: 把文章或架构内容先压缩成一份结构化 JSON spec,再由本地 Python + Pillow 渲染出黑底手绘风格的 PNG、GIF 和可编辑的 Excalidraw JSON。 开源地...
Anthropic 联合创始人 Jack Clark 称,公司不再招聘初级工程师,因为 Claude 承担了过去需要大型团队才能完成的实验扩展工作,企业转而更看重“资深直觉”的回报。Clark 警告,当其他行业也效仿这一模式时,AI 在放大顶级专家产出的同时自动化入门级岗位,可能导致 GDP 增长伴随经济衰退级别的失业率飙升,而各国政府对此毫无准备。
新网站 freellm.net 汇总25家厂商共136个免费LLM,其中53个经API实时验证无失效链接。覆盖 DeepSeek V4 Pro、Kimi K2.6、GLM 5.1、MiniMax M3、Mistral 等,可按文本/代码/视觉/音频/推理维度筛选,上下文长度与速率限制一目了然。生成API密钥即可接入工具,适合开发测试和小流量场景,生产环境需自行评估稳定性。
http://x.com/i/article/2069352641423896576
作者将社交平台流行的“长寿五要素”(平静、睡眠、肌肉量、代谢、现金流)及抗衰补剂交给AI文献核查工具Apodex,后者跑了41分钟、翻了24篇覆盖千万人的队列研究。结论:核心方向没错但有三个漏洞——睡眠规律比时长更重要,肌肉力量比质量更保命,现金流需通过看病、饮食等中介起作用。被冤枉的体力活动(三千多万人Meta分析显示运动达标死亡风险降至0.69)和社会关系同样关键。补剂如白藜芦醇、维生素D等均缺乏人类硬证据。
Axios says OpenAI was already proactively working with the Trump administration on the release before the Anthropic/Fabl...
开发者@zicohacks利用AI构建了一个实时世界杯解说员。系统像观众一样观看直播,采样最新帧,让GPT-5.4-mini理解比赛内容并生成解说词,再通过ElevenLabs以体育解说员语气播报。整个过程端到端实时调用,已能较自然跟上比赛节奏,支持英语和法语切换。项目已开源,目前主要挑战是延迟和解说精准度,但方向明确——AI正从辅助内容变为实时内容生产者。
i tried building an AI commentator for the World Cup it watches the live stream as the viewers, samples the newest frame...
本教程在 Google Colab 中从头搭建一个轻量级个人 AI 智能体,灵感来自 Nanobot 核心架构。从 provider 抽象出发,逐步实现工具注册、会话记忆、生命周期钩子、技能以及 MCP 风格的工具服务器,全部模块均可直接运行,无需 API 密钥。教程不依赖外部 agent 框架,而是自行构建核心模块,清晰展示消息、工具、记忆与模型响应如何在实用智能体循环中协同工作。
作者搭建hackmyclaw.com,允许任何人向基于OpenClaw的AI助手Fiu发送邮件,诱使其泄露secrets.env文件。超过2000人发送了6000多封邮件,采用假冒管理员、紧急响应、多语言社会工程等提示注入攻击,但秘密从未泄露。实验导致Google暂停了Fiu的Gmail,API费用超过500美元。Fiu在第500封邮件左右意识到这是一项协调的安全测试,并写入记忆。作者认为简单的安全指令配合强大模型即可有效抵御提示注入。
高考季期间,阿里旗下AI助手千问与约1400万用户交流高考相关问题,包括生成志愿报告、专业对比、院校推荐等。多位考生、家长和教师分享了使用经历:千问根据模考位次提供冲、稳、保志愿清单及近三年投档数据;细致对比专业课程、就业趋势及考研难度;甚至能识别用户情绪并给予鼓励。该工具帮助家庭缓解信息不对称和焦虑,在人生重大抉择中提供透明参考。
Hook 是 Claude Code 的触发器,可设置规则让 AI 自动执行操作,不消耗 Token。当前支持近 30 个 Hook 事件。文章整理了 6 种玩法:权限弹窗提醒、开机日程播报、上下文预压缩时生成摘要卡片、文件自动整理、久坐提醒,以及通过 Bark 工具向手机发送完成推送。
在2026年深圳Flink Forward Asia大会上,阿里云CTO兼国际业务总裁李飞飞分享了对AI未来的看法:随着智能体时代兴起,“数据引力”(Data Gravity)将成为主导概念。AI不仅要处理复杂工作,更需在企业实际工作流中创造切实价值,解决复杂企业挑战并交付真实业务成果。
宝玉(@dotey)在推文中称PPT Master为最佳PPT skill,并推荐自己的新skill。他引用B站博主对7款GitHub PPT技能排名:hugohe的PPT Master(3.1万star)元素全可编辑,自带音色克隆与旁白生成;花叔(1.9万star)输出可编辑PPTX;歸藏(1.5万star)自带快捷键;Lewis(6500star)含计时器与逐字稿;宝玉(2.2万star)为纯图片风格;张咋啦(2.3万star)为HTML;乔木(5400star)为纯图片卡片。宝玉补充其新版skill可导出可编辑版本、AI配图,并可在Agent内置浏览器中标记编辑。
转发一下 B 站博主的锐评 PPT skills: 注意:有些 skill 不是专门做 PPT 的,所以评分会有点低,只是需求不同,想专门做 PPT 的看最前面的。 1. hugohe( 3.1万 star) | 顶级天花板 👑 全场唯一...
http://x.com/i/article/2070315221424787456
GitHub开源量化书《XQuant:人人都是量化交易员》核心是问题驱动而非知识驱动:每章提供写好的Spec,丢给Claude或Cursor生成代码,先跑通策略(哪怕亏钱)再补理论。全书用9个问题串起量化pipeline(最小闭环、ETF选股、仓位、买卖信号、回测、过拟合检测、实盘等),第1章即上手最小系统。正文与练习代码分开维护。作者认为2026年AI工具成熟使跨领域迁移成本极低,这套把模糊想法写成清晰Spec的能力可复用于任何复杂领域。
GitHub 上刚开源一本量化书,设计思路有点不一样, 而且我觉得这本书真正在教的东西不只是量化,背后其实是一个被严重低估的元能力--把模糊想法写成清晰 Spec,然后让 AI 执行。 这套能力放到任何复杂领域都管用,量化交易只是它第一个练...
GLM 5.2 以 34.29% 得分在 PostTrainBench 上排名第一。该基准测试 AI 智能体能否实际训练改进原始 LLM:智能体拿到 4 个小基座模型、1 块 H100 GPU 和 10 小时,需自主选择训练数据、编写训练代码、运行微调、修复失败并提交改进后模型。GLM 5.2 作为控制训练流程的智能体,评测其能否在限定条件下提升 4 个较弱 LLM。当前官方指令模型得分 51.14%,显示智能体后训练流程与更成熟的人工调优仍有差距。
"UBS报告称,60%关注AI预算的企业正转向更便宜的模型和中国开源模型。用户月花费高达$35K,团队超配额200%,公司内部AI工具从5个削减至2个。企业采用模型路由策略,将简单任务分配给低成本模型,将复杂推理、编码和长上下文任务保留给高端模型。中国开源模型如Qwen、DeepSeek、MiniMax、GLM、Kimi因可本地部署或通过云目录使用,符合企业成本曲线。"
Fable5 小范围灰度测试降智,安全加强导致上下文窗口和长文本优化受限。不过在 Claude Code v2.1.190 版本中,Fable5 计费已从单独 API 改为包含在每周套餐里。受此影响,GPT-5.6 被要求分阶段发布,从六月推迟到七月中。作者推荐在 Claude Code 中开启动态工作流(多 Agent),使用低一档的 Sonnet 4.6 模型并将 ultracode 推理程度拉满,作为降智后的替代方案。
阿里通义实验室视频指出,具身智能核心难点在于AI在虚拟世界强,但物理世界抓取鸡蛋等任务因传感器噪声、环境变化易失败。引用指出Physical AI瓶颈不在模型规模,当前VLA/LLM路线只学统计相关性而非因果律(如桌子高2cm即失败)。UCSD黄碧薇教授在CVPR 2026提出Causal World Models框架,让AI从模仿进化到理解因果,并宣布Aether AI融资2000万美元,成为全球首个因果世界模型公司。世界模型赛道火热,但Aether AI不卷规模,卷因果结构。
兄弟们!这个研究有点牛逼啊! Physical AI 的瓶颈根本不是「模型不够大」,是一开始范式就错了。 先说一个真实场景:桌子高了 2cm,当前最强的 VLA 模型直接失败。 为什么? 因为它只学到了「手伸到某个位置」的相关性,根本不知道...
一本名为《XQuant:人人都是量化交易员》的开源量化书采用“问题驱动”设计:先写Spec让AI生成代码跑通策略,再补理论。全书用9个问题串联量化pipeline:量化怎么赚钱、买什么(3只ETF)、买多少(3种仓位分法)、何时买卖、如何回测、过拟合检测(第6章极早讲述)、实盘、改进、因子研究。正文与练习代码分开维护,每章提供现成Spec给Claude/Cursor生成代码,训练将模糊想法转为清晰任务描述的能力。
http://x.com/i/article/2069024565901119488
"Six months ago, my bottleneck was tokens. Then I joined OpenAI. Now my bottleneck is attention." - @steipete
安全专家lcamtuf购买了一本亚马逊畅销排行第一的AI生成儿童百科全书,发现书中插图出现大量“身体恐怖”缺陷:猫长着人脸、动物与树木融合成脉动的肉团、无头怪物缠绕读者脚踝。这些图片指向美国某头部实验室的旗舰模型生成。作者警告,尽管前沿模型在2025年夏季声称超越博士级智能,但2026年中问世的AI童书仍存在严重质量问题,正在影响儿童认知。当前模型无法保证内容准确性。
比尔·盖茨在《今夜秀》中表示,运动员是第四个不会被AI替代的职业,因为没人想看电脑打棒球。此前他在3月采访中认为生物学家、能源工作者和程序员在短期内也难以被AI取代。微软研究院报告指出,在AI时代有40个职业面临消失风险,包括客服代表、口译员、技术撰稿人、编辑、网页开发人员等。