Omni Flash is a smart model. The way the hand is wet, the water ripples, the refraction, the shadows, the sound effects ...
Omni Flash is a smart model. The way the hand is wet, the water ripples, the refraction, the shadows, the sound effects ...
http://x.com/i/article/2071684582336782336
建议将所有微服务放在一个workspace(monorepo或虚拟monorepo),让Agent同时看到schema、API和实现代码。文档采用分层结构:根目录AGENTS.md索引各服务职责,每个服务内写清bounded context。优先用OpenAPI spec等机器可读规格自动生成文档。协议测试(contract test)是精准活文档,能验证服务间交互。验证环节各服务提供mock server或基于OpenAPI的模拟服务,Agent在本地跑contract test形成“写代码→跑测试→自我修正”闭环。可进一步引入consumer-driven contract testing(如Pact)。
将放行信号放在PR评论等可被调用者写入的通道存在风险。AI review贴评论,monitor回读“High: None”即自动合并,但任何有评论权限的人或Agent都能伪造结果。安全门禁的信任结果应走进程内闭环(如returncode、内存状态),评论仅供查看,不可作为门禁依据。
媒体软件公司Every公开「复利工程」方法论,以单人工程团队维护5款产品。核心是四步循环:Plan→Work→Review→Compound,其中Compound将每次解决问题的解法写入CLAUDE.md和docs/solutions/,使AI下次自动避坑。工程师80%时间花在Plan和Review,仅20%用于写代码。配套开源插件支持Claude Code等,含26个专项agent、23条工作流命令、13项技能,可零配置使用。/workflows:review一次并发14个agent审查代码,/workflows:plan在ultrathink模式下可并发40多个研究agent。
开源电子书用约4300行代码(TypeScript和Python)复现Claude Code核心架构,涵盖Agent Loop、13个工具、4层上下文压缩、语义记忆召回、技能系统、多Agent、MCP集成。全书13章分步教程,讲解如何简化实现。提供中英文版。
主推文解释DSpark(类似MTP的预测技术)为何不降智:草稿模型生成的高接受率token(标点、助词、代码语法等)信息熵低,计算成本不变,被接受后提升性能而不影响质量;真正决定prompt质量的token接受率低。后置置信度调度器进一步保证效果。回应了引用中关于“小模型逆合不如大模型自解码为何不降智”的疑问。
@karminski3 牙医老师,我有一个问题:既然 DSpark 是类似于 MTP 的预测技术(依旧是类似于草稿模型的思路),那么小模型逆合的输出应该是不如大模型自身 decode 的,为什么说不会降智呢?(或者说....实际上是这样对性...
DeepSeek推出的DSpark是一种推测性解码技术,通过在Final RMSNorm后接入3层MTP微型Transformer堆叠,让大模型在输出前并行猜5个token,经置信度头剪裁后,送回大模型用prefill验证,正确则一次性吐出多个token。相比外挂小模型更高效,不降智,速度提升60%-85%。目前SGLang已有相关PR(#29538),DeepSeek已在HuggingFace发布多款DSpark魔改版小模型。
Anthropic应用AI工程师Margot Van Laar在Code with Claude分享提示词工程实战手册。核心观点:维护已有提示词比从零写更常见,最佳起点是评估(Eval)而非直接改提示词。两个场景:客服机器人需用XML标签结构化,移除旧模型冗余指令,为精确计算提供工具;零售排班Agent应拆分成生成-评估-修复循环,使用更强推理模型(Opus)+自适应思考。强调评估是判断改动有效性的唯一严谨方式。
An anthropic应用AI工程师Margot Van Laar在Code with Claude分享提示词工程实战,核心观点:大部分时间在调试和维护已有生产提示词而非从零编写。两个场景:客服机器人维护中,用XML标签结构化清理,移除旧模型遗留的“禁止列表”指令(新模型会过度拟合),精确计算应调用工具,转人工决策需明确代价与收益;零售排班Agent从零构建时,拆成生成-评估-修复三个简单提示词更稳定,选用更强推理模型(Opus)。她反复强调:评估(Eval)是唯一严谨方式,没有评估就是碰运气。
睡前来一发,这个视频还是挺完美的。 Anthropic的应用AI工程师Margot Van Laar在Code with Claude分享了提示词工程的实战手册。 核心观点是:我们很少从零写提示词,大部分时间都在调试和维护已有的生产提示词。...
Anthropic应用AI工程师Margot Van Laar在Code with Claude分享提示词工程实战手册。核心观点:生产提示词大多时间在调试维护,最好起点是评估而非直接修改。维护客服机器人提示词时,需用XML标签结构化,移除冗余补丁,明确输出格式;避免旧模型“禁止列表”指令在新模型上过度拟合;精确计算应赋予工具;升级决策需说明代价与收益。从零构建零售排班Agent,应拆分为生成-评估-修复循环,三个简单提示词各司其职;更强推理模型+自适应思考更高效。评估是唯一验证改动的严谨方式。
Berry Xia 宣布成功完成了一套“视频讲解的Skills”开发与测试。用户只需提供网站、内容、视频地址等信息,该技能就能自动生成基础的讲解视频。作者询问社区兴趣度,表示如果需求多可能会进一步分享。目前未披露具体使用的模型或平台名称。
I got tired of reading badly formatted agent written reports, so I put together a writing skill derived from the GOVUK s...
A self-evolving agent + a 428B model + 3 Macs = ? Your own AI lab. We ran @MiniMax_AI M3 locally with @tryParallax, righ...
卡兹克分享Vibe Coding两个必备技巧:①“从第一性原理出发”——强制AI回归问题本质,曾助其发现AIHOT海外信源抓取底层路由隐患并重构;②“对抗式审查”——让AI从恶意用户角度测试,曾找出OOM死循环、未来时间污染等隐蔽BUG。作者建议每2-3周全局对抗式审查。当前AIHOT每周请求量超千万,Skill调用量为网页端10倍以上。两个技巧适用于任何需要验证与创新的场景。
近期大量 Claude 账号被封,用户反馈通过 App Store 礼品卡充值的可申请退款。引用推文显示已成功收到 125 美金退款,且同一 Apple ID 可重新订阅 Claude Pro(20 美金),但 Claude Max 版本封号风险最高。建议改用 Codex 替代。
关于Claude 被封号,App store 礼品卡退款我说一下! 再update一下后续: 我不知道过了几天收到了 退款, 我是朋友提醒前天去看了一下已经收到了125美金的退款。(图1) PS:我又用这个ID买了新的Claude Pro ...
这是今晚直播的相关资料、资源及系统,分享给大家 相关资料: 1、《GEO内容工程操作手册与评估标准》https://doc.laoyao.cn/9fl0bc 2、《GEO内容工程系统研究报告》https://doc.laoyao.cn/t7...
99%的人不知道的Claude Code分屏功能。 如果你是Claude Code桌面端用户,一定要看看。
为用户提供不依赖微调或开发的Hermes代理优化方案:通过Memory.md文件构建“会话学习-记录沉淀-迭代优化”闭环。核心流程:1)桌面新建Memory.md,固定偏好、更正、模式、学到的经验四层框架;2)绑定提示词,每次会话前读取并完整应用,任务结束后记录有效做法与失败根因,新结论覆盖旧内容;3)每周精炼压缩零散经验为通用规则;4)定期日期命名归档备份。无需模型微调或部署,几分钟启动,使代理越用越贴合个人工作习惯,从单次随机输出收敛为专属智能体。
http://x.com/i/article/2042547855865585664
Codex 支持两种计划工作方式。Scheduled Tasks 每次运行创建新线程,适合无需上下文延续的任务,如每日 9 点自动总结邮件、日历;Scheduled Messages 在同一现有线程反复运行,适合需要历史上下文的场景,如每 30 分钟检查 PR 状态并处理评论,直至合并。推文还给出创建可复用循环技能的提示词,让 Codex 自动判断使用哪种方式并引导用户填写关键参数。
Google Research 于2024年开源时序预测基础模型TimesFM(ICML 2024),采用预训练+零样本预测范式。2025年9月发布的2.5版本参数从500M降至200M,上下文窗口扩展至16K,新增30M分位数预测头,可同时输出点预测及10%-90%置信区间。200M参数单GPU可运行,16K上下文支持五年日数据。模型已内置在BigQuery ML、Google Sheets、Vertex AI中,开源版本通过pip install即可使用。2026年4月通过HuggingFace Transformers和PEFT支持LoRA微调,便于领域适配。
Our plants are chatty. Yours can be too. Give your plants a voice with our build guide: https://github.com/openai/plantt...
Anthropic 应用 AI 负责人 Lamis 在 2026 年 AI DevCon 上介绍 Claude Code 记忆管理。起点是 CLAUDE.md 纯文本文件,但会上下文膨胀。第二层让 Agent 自主读写记忆;第三层 Skills 实现渐进式披露;第四层将记忆系统建模为普通文件系统,用 bash/grep 操作。生产环境设版本控制、哈希并发控制、权限分层和干净 API 四道防线。核心“做梦”机制是带外异步处理:专用 Agent 分析会话记录、识别模式并建议更改,已投入生产,能降低延迟和成本。
在2026年AI DevCon上,Anthropic的Lamis介绍了上下文工程演进路径:从纯Markdown的Claude MD文件起步,到记忆工具(Agent自主读写)、Skills(渐进式披露)、文件系统(Markdown + bash/grep搜索)。生产环境中遇到并发写入、权限、注入等问题,通过版本控制、哈希校验、组织级只读/个人可写权限、可移植API解决。最后提出"做梦"——带外异步处理,由专门Agent分析跨会话模式并调整记忆。该机制已投产,可提升任务效率、降低延迟,额外token消耗被效率提升抵消。
ClaudeflareでGLM5.2無料で使えるヤツ、秒で設定できた。クレカもなんもいらんから楽。 Claudeflareログイン Workers AIクリック REST APIクリック Create a Workers AI APITok...
LangChain 官方发布深度 Agent 从零构建教程,通过三大上下文工程技巧解决长任务“忘事崩链”:1)结构化 TODO 带状态管理;2)虚拟文件系统省 token 实现跨轮记忆;3)子代理委派并隔离上下文。教程含 5 个渐进式 Notebook,从 ReAct 循环起步,逐步叠加规划、文件系统、子代理,最终搭建可联网深度研究 Agent。配套 deepagents 生产库可复用。强调高级 Agent 差距在上下文工程架构设计,而非模型本身。
http://x.com/i/article/2070416868943306753
@dotey 表示当前 Codex/Claude Code 的上下文压缩已做得很成熟,加上 Prompt Caching,单 session 内持续对话成本不高。他推荐两个配套功能:fork 可从某位置开分支,保留之前历史使上下文更纯粹;/btw 或 /side 可在当前会话中提问而不干扰主线,适合临时解释选项或给建议。引用 @reach_vb 称自 GPT 5.3 Codex 后不再担心上下文,Codex 能压缩并记住关键信息,还支持分支出新线程,这也是 /goal 命令有效的原因。
True story: I stopped thinking about context since GPT 5.3 Codex Single project focused threads with the recent capabili...
本周六晚8点,姚老师在WaytoAGI进行第二次GEO公开课,主题为“GEO内容工程”。直播资料包括三份核心文档(操作手册、研究报告、实操教程)、两本推荐图书(《系统之美》《人人都该懂的工程学》)及三篇GEO相关论文。相关资源有GEO改写提示词、改写Skill及单篇内容GEO特征标注演示。开源项目包括GEO Skills、GEOFlow、Meta skill的GitHub仓库及课程PPT。
本周六(明天)晚上8点, 姚老师 @yaojingang 和我会在WaytoAGI给大家分享第二次GEO公开课。 主题是:GEO内容工程 链接:https://vc.feishu.cn/j/108720872 明天直播前5分钟进入就行。
最近这几个月分享了太多关于Codex的玩法了,横跨了赚钱、自媒体、视频、记忆系统、APP开发上架、教程等多个领域,大家进行系统学习的时候,可以把这篇推文发给Codex,让它给你推荐阅读路径。 一、边玩边赚钱与实战变现 1. Codex进阶实...
推文指出,现在用AI做视频已变得极为简单,无需支付700多元的剪映SVIP。只需安装6个2026年最顶级的插件和Skills,提供安装链接,可直接交给AI Agent(如Claude Code、Cursor、Hermes、OpenClaw等)自动安装。具体链接和使用建议可在评论区自取。
http://x.com/i/article/2069352641423896576
Karpathy LLM-WIKI反转逻辑:人只筛选高质量资料并做最终判断,AI负责整理、链接、更新等脏活。三层架构(原始层、知识层、规则层)将资料编译成有机知识网络,让存量内容生长复利。核心是升级人与AI的分工。
http://x.com/i/article/2069352641423896576
diff models are good at diff things, but how many of us actually compare them? you sign up for each provider separately,...