We have the first @DellTech + @nvidia Vera Rubin NVL72 @CoreWeave. Here we go! 🚀
We have the first @DellTech + @nvidia Vera Rubin NVL72 @CoreWeave. Here we go! 🚀
该实现方案创建了一个可执行的智能体治理工作流。智能体不直接执行工具,其每个操作首先经过一个治理层,该层会检查智能体的身份、信任分数、风险等级、请求的工具、动作类型和敏感性等级等,以确保安全。实现以Colab-ready形式提供,参考了微软的Agent Governance Toolkit。
GitHub 2026年学生大礼包全面升级,总价值提升至$3500+。核心福利包括:GitHub Pro永久免费、GitHub Copilot Pro无限使用、Cursor Pro 1年免费、JetBrains全家桶免费,以及DigitalOcean $200和Azure $100等云服务额度。申请门槛极低,13岁以上持有.edu邮箱即可,无项目要求。此外,开源项目维护者还可申请OpenAI提供的6个月免费ChatGPT Pro(价值$1200)。
免费领6个月ChatGPT Pro, 价值$ 1200🤩 这可能是今年对开发者最实在的福利了, 没有硬性Star数要求, 有项目链接基本都能过, 只要你是任何一个公开开源项目的维护者,哪怕只有你一个人在维护, 都可以去申请试试: http...
用户基于开源沉浸式翻译插件 read-frog,使用 Codex 开发了一套单词学习系统。该系统能将用户在阅读英文网页时收藏的单词自动生成闪卡进行复习,并基于艾宾浩斯遗忘曲线安排学习周期。系统会根据单词难度(例如 CET6+)在旁边添加中文翻译,并标记单词的掌握情况。通过此模式,当一篇文章不再显示生词翻译时,即表明学习者已基本掌握该文章词汇。
推文介绍了一种结合飞书与AI的交互式阅读方法。核心流程为:1. 使用 Codex 或 CC 将 EPUB 电子书按章节导入飞书文档;2. 人工阅读时在文档中对有感触的内容进行划线、加粗或评论;3. 再次调用 Codex 读取这些标记与评论,由AI进行解释和回复。作者认为此方法有趣,并计划将其封装为可复用的 Skill。
一名用户以200英镑的价格购入了一块数据中心级GPU,并将其成功安装到自己的游戏电脑中。文章记述了这一非标准硬件改装过程、遇到的技术挑战以及最终实现本地运行大语言模型的体验。
该推文介绍了以OpenAI Codex为核心的个人生活自动化智能体工具栈。它集成了Google全家桶、WhatsApp、电报及浏览器自动化等工具,并以Google Drive作为“真相源”数据层。核心是跨应用编排与判断,关键决策需经人工批准。技能(如inbox-zero)是可迭代的操作手册,用于固化偏好。典型的“介绍邮件”编排展示了Agent在处理多工具、高上下文切换任务时的效率。工具优先级为API/CLI > 本地文件 > 浏览器自动化。
http://x.com/i/article/2060579190920110081
i am running stepfun's new step 3.7 flash on a dgx spark right now. 198b vision model, on a box that sits on a desk. her...
同一事件,精选展示《在 NVIDIA GPU 上运行面向企业级就绪的多模态 AI--Step 3.7 Flash》Codex(由OpenAI发布)提供四个可选模型。其中,gpt-5.5作为质量优先的旗舰模型,适用于复杂编码、推理及知识工作,其定价较高,为输入$5.00、输出$30.00每百万tokens。主推文旨在帮助用户根据任务类型与成本考量进行选择。
http://x.com/i/article/2060676761914888194
本教程展示如何实现 SkillNet 用例,将其作为一个实用框架,用于发现、安装、检查、评估和组织可重用的 AI 技能,以构建技能增强型 AI 智能体。
LandingAI 黑客松项目「ArthaNethra」展示了从 PDF 到金融知识图谱的流程:上传后通过 ADE 提取为结构化 Markdown,超过 15MB 的文档异步处理。提取后按文档类型路由归一化:发票/贷款/合同采用确定性解析(无 LLM);10-K/MD&A 使用 Claude Haiku 结合正则。实体和关系分别存入 Weaviate 和 Neo4j(500 词分块,100 词重叠,all-mpnet-base-v2 向量化),图谱包含 10 类实体和 26 种规范关系,并通过别名映射进行同义词归一化。最后结合规则与 LLM 进行风险检测。
http://x.com/i/article/2060438013273108480
本文介绍两种让 Codex/Claude Code 自动获取网页网络请求数据进行调试的方法,无需手动复制粘贴。方法一:使用 Chrome 的“Export HAR”功能导出 .har 文件,并将文件路径发给 Codex 分析。方法二:安装 Codex 的 Chrome 浏览器扩展,在对话中使用 @chrome 指令,让 Codex 直接操作浏览器进行调试与抓包。
作者展示了如何在浏览器中通过 Pyodide 和 Service Worker 运行 Python ASGI 应用。此前的 Datasette Lite 使用 Web Workers,但无法执行 <script> 标签中的 JavaScript。新方案由 Claude Opus 4.8 协助完成开发,解决了这一问题。作者已展示了基础的 ASGI FastCGI 演示和运行 Datasette 1.0a31 的演示,并计划后续将此方法应用于升级 Datasette Lite。
Anthropic 推出官方提示词工程课程 Prompting 101。课程聚焦从零搭建一个可落地的 prompt 任务,核心内容涵盖五个关键步骤:设定语气背景、使用 XML 结构、提供 Few-shot 示例、设计输出格式化、以及运用预填充与拓展思考。整套课程约 25 分钟,已配有中文字幕和章节化整理,每个章节附有核心要素总结,便于观众跳读重点。
本文介绍了Codex平台的四个模型及其选择策略。其中,gpt-5.4-mini(输入$0.75、输出$4.50/百万tokens)是性价比首选,适合日常编码与内容整理;gpt-5.5(输入$5.00、输出$30.00/百万tokens)为旗舰,用于复杂推理与编码;gpt-5.4-nano专攻简单批量任务。核心建议是:大多数任务优先使用gpt-5.4-mini,仅在遇到复杂需求时升级至gpt-5.5,并用gpt-5.4-nano处理末端轻量工作,以此构建成本最优的流水线。
小米 MiMo-V2.5 系列 API 完成永久降价,最高降幅达 99%。其技术基础是公开的推理系统全链路优化方案:针对 Hybrid SWA + MoE + 多模态的复合架构,系统性重构了 KVCache 管理、分级缓存、前缀缓存与调度策略。核心优化包括将 KVCache 存储压缩至约 1/7,线上前缀缓存命中率平均达 93%,TTFT P90 降低 30%,Prefill 性能提升约 40%,Decode 阶段前 128 token 加速比达 2.3×。多模态视频处理端到端延时从 156 秒降至 23 秒。该方案宣称是业内首篇全面覆盖此类复合架构的大规模工程落地方案,模型能力无缩减。
我的新书《AI 高质量论文写作法》上市。刚拿到崭新样书,很兴奋。相对于3年前《学术写作五步法》,补充了我近几年尝试将 AI 深度融入知识生产工作流的心得和经验,希望对你的研究推进和论文撰写能有实际帮助。感谢老麦和储殷老师的推荐,谢谢大家的支...
💡Recent insight: gaslighting @claudeai seems to improve code quality >90% of the time. "You overengineered this, there ...
小米发布 MiMo-V2.5 系列模型(含 MiMo-V2.5、MiMo-V2.5-Pro),采用 Hybrid Sliding Window Attention(Hybrid SWA)架构,KVCache 存储与计算量均降至 Full Attention 的约 1/7。以 MiMo-V2.5-Pro 为例,70 层中仅 10 层为 Full Attention,60 层为 SWA(窗口大小 128)。团队围绕 KVCache 系统重构(双池管理、按层异步拉取、SWA-aware 前缀缓存树)及分布式缓存 GCache 等环节优化,使存储效率提升约 7×,显著降低长上下文推理成本。
Anthropic 正在测试 Claude 的一项新功能,它能基于 11 项行为指标分析用户与 AI 的历史对话,为用户生成“AI 流利度”评分(满分 11 分)。该功能源于其《AI 流利度指数报告》,该研究分析了 9830 段匿名对话,提出了包含“描述”、“委托”和“辨别”维度的 4D 框架。有用户分享自己获得了 7.5 分,报告还会指出弱点并提供优化建议。该功能目前处于灰度测试阶段。
Chrome的CDP调试在使用Codex或Claude Code时,每次调用都弹出确认对话框,尤其在远程服务器或Mac Mini上运行技能时影响自动化执行。由于强制确认且无配置文件调整,用户让Codex编写脚本自动点击确认,虽可能不安全,但个人电脑上可接受。这启发将电脑重复操作脚本化,避免使用Computer Use等方案,因其速度慢且成本高。
本文批评当前AI家教产品(如Claude、GPT)直接给出完整答案的模式,认为这相当于“抄袭答案”,跳过了学习必需的“适度挣扎”过程,导致知识无法进入长期记忆。作者指出,研究显示适度挣扎能强化大脑记忆连接。而提供完整思维链(如Qwen、GPT展示CoT)或追求交互满意度并非关键。相比之下,Koji与Brilliant等产品通过追问卡点、分步解锁等方式鼓励学生主动思考。文章强调,优秀的AI家教核心应是帮助学生真正掌握知识,即便过程“有点烦”。
AI is making kids dumber. It should be making them geniuses. Introducing Koji, the first AI tutor that gets kids to actu...
今晚八点,会通过WaytoAGI做第一场GEO直播分享,会把GEO的底层逻辑、方法、系统原理及理念做一轮讲解,相关的一些资料和系统如下,分享给大家: 1、GEOFlow,今晚主讲的系统和背后的GEO原理 https://github.com...
我今天对群聊总结的 Skill 更新了个小功能,在群里 @bot,总结群聊记录的时候,就可以结合聊天记录的上下文,在总结的时候回复问题 具体参考:https://github.com/JimLiu/baoyu-skills/commit/a85c81e8db8a19a633e30dda0823e8a9c686263d
baoyu-skills 新加了一个 Skill: 微信群聊总结 Skill:https://github.com/JimLiu/baoyu-skills/tree/main/skills/baoyu-wechat-summary 依赖于 ...
Tiny-vLLM 是一个用 C 和 CUDA 编写的高性能大语言模型推理引擎,项目代码已开源至 GitHub。
指出将工作流写入Memory方案的根本问题在于Agent需每次重新理解意图,导致token消耗大且不稳定。最佳实践是采用“Agent技能+脚本”架构:LLM仅负责将自然语言转译为SQL,所有确定性步骤由脚本执行。此方案可大幅降低token消耗。
AgentTrove是目前最大的开源智能体交互轨迹集合,包含1.7M行数据,采用ShareGPT风格布局。该Python教程展示了如何在不下载完整数据的情况下流式处理该数据集,具体步骤包括规范化智能体轮次、提取命令、分析轨迹,并将成功的轨迹导出为干净的SFT微调数据集。
安装了这个之后,Claude Code 的体验会立马不一样 Anthropic 悄悄发布了一个官方插件 claude-code-setup,把 Claude Code 从「还不错」升级成了专业的 AI 开发环境 它会自动扫描你的项目,一键推...
Gemini 3.5 flash + Gemini managed agents api just audited a real megatron-lm ci failure inside Eigent. root cause in min...
🚀 The team at @Google just released the Agents API, a service for building and running custom agents inside a sandboxed...
针对后续UI改动可能导致Claude Design与实际代码不一致的问题,分享的实践方法是:始终将Claude Design作为唯一设计源,并在更新时生成changelog供Claude Code同步。遵循先修改设计再改代码的原则,若临时修改了代码,事后也应同步回Claude Design。
@dotey 这里有一个小问题,后续ui 改动怎们办?先改 claude design,有时候小改动直接改code,但是这样时间长了 design 和 code就 不一致了
Google 使用其开发工具 Google AI Studio,通过氛围编程(vibe coding)方式,创建了一个关于 Google I/O 2026 主要公告的在线测验。
The scariest bug from a coding agent isn't the one that crashes. It's the one that runs cleanly, passes tests, and quiet...
@MomoseReina 选择Max 挽弓当挽强、用人当用长,你的时间比什么都宝贵
一位开发者分享了借助AI开发Mac应用的四点经验:建议优先使用AppKit而非SwiftUI,因后者界面较弱,而AI已弥补了AppKit开发复杂度高的短板;推荐在编码前先用Claude Design打磨UI与UX;指出Opus模型生成的UI优于GPT-5.5;并提到Codex提供了一个名为“Build macOS Apps”的官方插件可供使用。
今天想到一点,我是否可以去做 mac app? 理由如下 - 会 objective-c/swift 我是国内比较早进入 iOS 开发的那批人 - 正好有个 idea - 正好有 claude code ,以前总觉得 appkit 很难用,...