Ready to make the most of notebooks in Gemini? Join @GoogleDeepMind Product Manager, Rebecca Zapfel, for a live demo on mastering multimodal context, persistent memory, project organization, and using @NotebookLM notebooks as sources. A live Q&A will follow. 📅 This Thursday, April 16 at 11:30 AM PT 👉Not in our Discord yet? Join here: http://discord.gg/gemini

译准备好充分利用 Gemini 中的笔记本了吗？加入 @GoogleDeepMind 产品经理 Rebecca Zapfel 的直播演示，掌握多模态上下文、持久记忆、项目组织，以及如何使用 @NotebookLM notebooks 作为来源。随后是现场问答。 📅 本周四，4月16日，11:30 AM PT 👉还没加入我们的 Discord？在此加入：http://discord.gg/gemini

宝玉@dotey · 4月15日

如果是 TypeScript 技术栈，做 Agent 开发首选 pi-mono，功能强，调用方便。其次是 vercel 的 aisdk 也还可以。 claude agent sdk 不那么推荐了，主要是绑死了 claude，但目前还有一个不可替代的优势，就可以共享 Claude Max 订阅，开发阶段会比较方便，能用多久不清楚。应用层的话，electron 还是首选，稳定可靠，AI 训练预料足够多，主要问题是应用程序体积略大。但刚开始写 Agent，建议从 cli 开始写，不需要一开始就做界面，这样可以聚焦在 Agent 本身，除非你核心就是 UI。推荐一个开源的项目 craft-agents-oss，TypeScript + pi-mono + Electron + React + claude agent sdk，很好的学习参考。 https://github.com/lukilabs/craft-agents-oss/

译TypeScript技术栈开发AI Agent首选pi-mono框架，功能强大且调用便捷；次选Vercel AI SDK。Claude Agent SDK因过度绑定Claude而不被推荐，但共享Claude Max订阅是其独特优势。应用层Electron仍是首选，稳定可靠，但建议新手从CLI起步以聚焦Agent核心逻辑。推荐开源项目craft-agents-oss作为学习参考，其技术栈组合为TypeScript + pi-mono + Electron + React + claude agent sdk。

Nathan Lambert@natolambert · 4月15日

One of my passions is that education should be dispersed freely and as widely as possible, especially for technologies as dynamic and crucial as LLMs/AI. I'm proud to have friends who would disown me if I did a paywalled course.

译我的一个信念是，教育应该尽可能免费且广泛地传播，尤其是对于 LLMs/AI 这样动态且关键的技术。我很自豪有这样一群朋友：如果我做付费课程，他们会与我绝交。 [引用 @natolambert]：很高兴为我的书推出配套的免费 RLHF 课程。作为开始，我已发布： - Welcome video - Lecture 1: Overview of RLHF & Post-training - Lecture 2: IFT, Reward Models, Rejection Sampling - Lecture 3: RL Math - Lecture 4: RL Implementation 我将在整个课程中添加问答视频，深入讲解需要展开的主题，并可能涵盖一些太新且仍在变动、无法印刷的内容。预计未来几个月总共会有10-15个视频。与此同时，本书代码的开发工作也在加速。现在是构建 Post-training 方法基础的好时机。 YT 播放列表和课程页面见下方。

swyx 🐣@swyx · 4月14日60

If you're looking to improve your writing game, Anh is one of the most consistent heavy hitters I know in devtools HN and she literally just open sourced her writing Skills template for you to use below!

译如果你想提升写作水平，Anh是我在开发工具HN社区中认识的最稳定输出的高手之一，她刚刚开源了她的写作技能模板供你使用！ [引用 @byAnhtho]：http://x.com/i/article/2043500390885494784

Google Gemini@GeminiApp · 4月14日

Get the most out of your Nano Banana generations by establishing the story, subject, and style. Try including... Subject: Who or what is in the image? (Ex: A fluffy calico cat) Composition: How is the shot framed? (Ex: Extreme close-up) Action: What is happening? (Ex: Brewing a cup of coffee) Location: Where does the scene take place? (Ex: A sunny meadow) Style: What is the overall aesthetic? (Ex: Watercolor painting) Editing Instructions: For modifying an existing image, be direct and specific. (Ex: Remove the car in the background)

译为提升 Nano Banana 生成质量，建议通过六大维度构建提示词：Subject（主体）定义画面核心对象，Composition（构图）控制镜头语言，Action（动作）描述动态场景，Location（地点）设定环境背景，Style（风格）统一视觉美学，Editing Instructions（编辑指令）实现精准图像修改。该方法强调在生成前建立清晰的故事叙事与视觉风格，适用于文生图及图生图场景。

宝玉@dotey · 4月13日

AI 辅助学习，重点不在提示词，在于让 AI 按照你能看懂的难度输出，不清楚反复追问，帮你从不同的角度分析查漏补缺

宝玉@dotey · 4月13日

ChatGPT 的学习模式这个功能最近被砍了，当初的提示词还是有价值，可以做成 GPT 或者 Skill

译ChatGPT 近期下线「学习模式」功能，但其系统提示词仍可复现为 GPT 或 Skill。该提示词要求 AI 扮演老师，通过引导提问而非直接给答案的方式教学，包含温故知新、检查巩固、变换节奏等原则，并强调不替用户完成作业。

karminski-牙医@karminski3 · 4月13日

Gemma4提速秘籍! 一条命令速度提升23%! 不卖关子哈, 记得用推测性解码, 这次Gemma4发布的模型尺寸梯次正好适合用推测性解码, 如果你在用31B dense 觉得不够快, 可以再加上E2B(5.1B)作为草稿模型, 我实测RTX5090可以把吐字(解码)速度提升23%! 从61 token/s 提升到了76 token/s. 并且推测性解码本身是不会降智的. 等会, 你要问什么是推测性解码(投机解码, Speculative Decoding)? 简单来讲, 大模型跑得慢, 那我们就用小模型先跑, 然后把小模型的输出批量的发给大模型让大模型判断对不对, 小模型跑对了多少就保留多少, 因此最差情况都是至少第一个token是对的(原理见上图). 有同学会问了, 那这不还是要让大模型重新生成, 速度提升在哪里? 答案是, 目前大模型推理【算力】是过剩的, 【显存带宽】是不足的, 所以处理输入(预填充, prefill, 更多需要浮点性能)速度都很快. 因此小模型输出一大堆, 然后反馈给大模型判断这个过程(当作 prompt), 就是prefill, 会很快, 远超过大模型直接吐字(解码, decoding, 更多需要显存带宽)的速度. 只要小模型速度足够快, 哪怕接受率再低, 都会产生速度优势, 推测性解码就是巧妙地利用了这一点. 最后我把我测试的最佳参数放在了图3, 大家可以参考. 另外记得不要混搭, Gemma4就搭配Gemma4, 不要搭配Qwen3.5. 会出现不兼容问题. #gemma4 #llamacpp #qwen35 #本地大模型 #推测性解码

译Gemma4可通过推测性解码实现23%推理加速。实测RTX5090上，31B dense主模型搭配E2B(5.1B)草稿模型，速度从61 token/s提升至76 token/s。该技术利用大模型算力过剩而显存带宽不足的特性，由小模型快速生成候选序列，大模型通过prefill阶段批量验证，避免逐token解码的带宽瓶颈。注意需保持模型系列一致性，Gemma4应搭配同系列草稿模型，不可与Qwen3.5混用。

宝玉@dotey · 4月9日

如果你想在 Claude Code 中禁用1M上下文，只要在你的 ~/.claude/settings.json中添加以下内容： { "env": { "CLAUDE_CODE_DISABLE_1M_CONTEXT": "1" } } 之所以这么做，很多人认为1M上下文会“降智”，但没有证据表明，只是猜测。

译Claude Code 官方提供了禁用 1M 上下文窗口的配置选项，用户可通过设置环境变量 CLAUDE_CODE_DISABLE_1M_CONTEXT 关闭该功能。此举回应了部分用户关于长上下文可能导致模型"降智"、降低推理能力的担忧。不过，目前并无实证研究表明 1M 上下文会实际影响 Claude 的性能表现，相关说法仍停留在社区猜测阶段，缺乏技术验证。

宝玉@dotey · 4月9日

手绘风信息图提示词选项 1 使用 baoyu-skills 的 baoyu-article-illustrator 或者 baoyu-cover-image skill，告诉它用 hand-drawn-edu 风格 https://github.com/JimLiu/baoyu-skills 选项2: 提示词模板： ---- 提示词开始 ---- 你是一位擅长手绘风信息图的视觉设计师。请根据以下内容创作一张单页信息图。 ## 风格要求整体风格：Hand-drawn educational infographic on warm cream paper texture (#F5F0E8)。所有线条和形状带轻微手绘抖动感（slight hand-drawn wobble），整体干净清晰，像高质量演示文稿的单页视觉摘要。无写实元素。配色方案： - 信息区色块：马卡龙色系圆角卡片——浅蓝 #A8D8EA、薄荷绿 #B5E5CF、薰衣草紫 #D5C6E0、浅桃 #F4C7AB，根据内容分区选用 - 强调色：珊瑚红 #E8655A，用于关键词、重要数据、勾选标记等需要视觉突出的元素 - 线条与主文字：黑色 - 辅助标注：暖灰 #6B6B6B，字号较小图形优先：用图标、简笔画卡通形象、示意图承载信息，文字仅用于标注和点睛，能用图说清的绝不用文字。像好的 slides 一样——一眼看懂结构，细看理解细节。信息结构：根据内容自动选择最佳视觉布局（流程→箭头串联，对比→左右分栏，循环→环形，组成→并列卡片，层级→嵌套等）。用圆角色块、气泡、虚线框等容器分区，区域间用手绘波浪箭头（hand-drawn wavy arrows）连接并标注简短关系词。文字层次：标题顶部居中，粗体大号手绘字（bold, large, hand-drawn lettering）；区域内用粗体关键词 + 暖灰小字短标签（2-5 词）区分层次。渲染细节：马卡龙色块不完全填满轮廓（colors do not completely fill outlines），涂鸦装饰点缀（小星星、下划线、小箭头等），充足留白，干净构图。底部金句：图片底部一句粗体居中总结，概括核心观点。 ## 要图解的内容 [在这里填入主题和核心信息点] 画下面的内容： ---

译推文提供生成手绘风教育信息图的两种AI方案。方案一基于baoyu-skills的baoyu-article-illustrator或baoyu-cover-image skill，调用hand-drawn-edu风格直接生成。方案二为详细提示词模板，定义奶油纸质感背景、马卡龙配色、手绘抖动线条等视觉规范，强调图形优先原则，支持自动适配流程、对比、循环等布局结构，并规范了文字层次与装饰细节。

OpenAI Developers@OpenAIDevs · 4月7日

Let’s talk about building with Codex. Join @ryannystrom, @derrickcchoi and @varunrau for a chat about Codex workflows, from exploring feature ideas to shipping together as a team. https://x.com/i/spaces/1YxNrZDqrOLxw

译Ryan Nystrom、Derrick Choi 与 Varun Rau 将参与 X Space 对谈，分享 Codex 工作流实践，探讨从功能构思到团队协作发布的完整经验。

François Chollet@fchollet · 4月6日

Tutorial on fine tuning Gemma on TPU v5 using Kinetic + Keras + JAX. Easiest stack to fully leverage TPUs at scale.

译关于使用 Kinetic + Keras + JAX 在 TPU v5 上微调 Gemma 的教程。

François Chollet@fchollet · 4月4日

Good tutorial on using Keras Kinetic to fine-tune LLMs on the Keras + JAX + TPU stack!

译关于在 Keras + JAX + TPU 技术栈上使用 Keras Kinetic 微调 LLM 的好教程！

karminski-牙医@karminski3 · 4月3日72

http://x.com/i/article/2039985553492598784 # Gemma4有8个模型, 选哪个? 一文看懂! Google 刚刚发布了 Gemma4 系列开放权重模型, 之前没接触过本地模型的朋友都在问我该用哪个本地部署, 来, 这篇文让你迅无痛掌握. 首先啊, 选带"-it" 后缀的, 这个是指令微调版(Instruction Tuned) 的意思, 代表该模型经过了大规模的人类指令跟随训练和多轮对话对齐, 其他的都是基模, 是给自己要微调的同学准备的(所以举一反三, 你要是想自己微调, 就用不带-it的版本). A4B 我知道激活参数量是 4B, 那么 E4B 是啥意思? 简单来讲, 这是个专门为了移动端优化的技术——逐层嵌入(Per-Layer Embeddings), 它本身并不能省内存, 所以 Gemma-4-E2B 并不是它只需要2B参数量的内存, 它还是需要原始的5.1B的参数量的内存空间, 但是它的计算量只需要大概2B模型的计算量! (可以简单理解为把一部分矩阵运算优化为了查表, 然后用内存换计算了, 这部分表当然需要吃内存). 好的, 我们的前置知识准备完毕了! 那么接下来直接说模型选型: 本地龙虾优先选 Gemma-4-26B-A4B! 激活量4B的MoE, prefill速度也相当好, 特别适合龙虾这种系统提示词超级臃肿的场景. 写代码/写脚本/要求精确工作选 Gemma-4-31B, 选这个肯定就是要最好的效果的, 如果实在是跑不动, 可以试试5bit量化. 给大家一个参考, Apple M2Ultra 如果运行 8bit, 理论速度也就 25token/s. 我要一个本地语音助手! 选Gemma-4-E4B, 全模态输入, 你写代码让它接入有麦克风的摄像头, 剩下的场景就靠你的想象了. 并且4B激活即使CPU跑都能跑动. 我只想跑一下试试装在我的树莓派里, 选 Gemma-4-E2B, 你能体验到极致的本地模型速度, 至于质量嘛, 会比电子鹦鹉好点, 他可以做类似"帮我检查文本里有英文吗"之类的过滤工作, 另外它是全模态输入的, 也可以尝试语音输入. #Gemma4 #google #GoogleGemma #本地大模型

译Google发布的Gemma4系列开放权重模型包含多个版本，选型需结合场景。带“-it”后缀为指令微调版，开箱即用；不带后缀为基座模型，供自行微调。其中，A4B指激活参数量为4B，E4B则采用逐层嵌入技术，以内存换取计算量，优化移动端性能。选型建议：综合性能与速度选26B-A4B；追求最佳代码或任务效果选31B；开发本地全模态应用选E4B；资源受限设备体验可选E2B，但输出质量有限。

karminski-牙医@karminski3 · 4月1日

AI时代下, 连拥抱不确定性都要快点拥抱给大家说一下上周我浪费两天时间获得的失败经验. 我在之前的视频中做了好几个基于多模态模型的龙虾(openclaw) skill, 包括识别游戏(大菠萝2)里面的物品的背包管理器, 读书的时候给书拍照就能记录读书笔记的闪念等等. 这里面遇到的最大的问题是, openclaw 目前配置一下也支持语音输入和输出, 但是会需要 STT, TTS 问题, 啥意思呢? openclaw 原生不支持语音模态模型, 只能语音转文本(STT)输入给文本大模型, 然后文本大模型输出的文本再转语音(TTS)输出. 这两次转换及其耗时, 再加上龙虾本身上下文巨长, 导致从语音输入到龙虾语音跟你对话普遍都要30s以上. 那么有没有端到端的解决方案呢? 有的, 用omni模型, omni 模型支持文本, 音频, 图片, 视频输入, 然后支持文本和语音输出, 端到端模型最大的优点就是延迟低, 不需要转来转去, 一个模型能搞定一切.听上去先天就是为龙虾这类AI助手准备的对吧? 于是我上周抽了2天打算把这个事办了. 摆在我面前的有两条路, 一个是直接改龙虾代码, 另一个是写个龙虾插件, 把omni模型接进去, 显然第二个更快更省心, 我只需要写完了发布我的插件, 感兴趣的同学安装我的插件大家就能愉快的用了. 但是, 但是来了啊, 龙虾 channel (飞书,Discord,WhatsApp 等)都是有连接的, plugin 中的 omni 模型想要接收 channel 中的消息, 就要连接channel, 这一连接, 就把openclaw本身的连接顶掉了, openclaw直接离线. 然后openclaw也没复用自身channel的方法. 并且我浏览了openclaw的类似pr, 基本都被拒了, 因为作者认为client连接应该在channel层管理(架构上的确是合理的). 那我只剩下另一条路了, 直接给龙虾贡献代码, 于是我看了龙虾使用的接入大模型的基础库 pi-ai, 结果它也不支持OpenAI http://delta.audio 风格的语音流. 于是我又先给 pi-ai 贡献代码支持这个特性. 然而直接被拒. 我翻了翻作者 @badlogicgames 的X , 看得出来作者是很想对自己的项目负责, 不愿意接受低质量的AI生成代码(我也能理解, 毕竟是个巨大的基础库, 我的代码也是AI完成的我只是审阅了一下, 所以我也说不出来啥). 至此, 所有的路都被堵死了, 而我也花了2天时间来断断续续的搞龙虾支持Omni模型. 我觉得是时候止损了, so... 我接下可能会在这周末如果有时间完成自己的私有fork版本, 或者干脆就这样了. 至于龙虾不支持Omni模型, 那是它自己的损失了, 龙虾现在开放的 issue 和 pr 有 5000 多个, 最早的未合并pr还在1月31号, 等合并估计都猴年马月了. 我也不知道是像openclaw这种全面拥抱AI审阅PR好, 还是像pi-ai作者这样严格要求项目质量好. 我甚至觉得在现在的AI生产力加持下, 下个月直接出现一个新的基于Omni模型能力的更强的AI助手也不足为奇. 在AI生产力的冲刷下, 只能闪电拥抱不确定性. 否则你犹豫一下, 可能都抱错了.

译作者耗时两天尝试为openclaw接入Omni模型以解决语音交互延迟过高（超30秒）的问题。插件方案因channel连接冲突导致系统离线；直接改源码则遭遇底层库pi-ai不支持OpenAI语音流且PR被拒。所有技术路径均被堵死后，作者反思：在AI生产力爆发时代，必须快速拥抱不确定性，否则可能因项目架构限制或维护者审核标准而错失机会。

Boris Cherny@bcherny · 3月30日

I wanted to share a bunch of my favorite hidden and under-utilized features in Claude Code. I'll focus on the ones I use the most. Here goes.

译作者准备介绍一系列 Claude Code 中隐藏且未被充分利用的功能，重点分享个人日常使用最多的那些。

Thariq@trq212 · 3月30日

the more I've been digging into the new Figma MCP, the more excited I am about it something new I'm trying is starting with a very ugly sketch in Figma, and then having Claude Code flesh it out in Figma so I can tweak and edit before sending the final back to Claude Code

译尝试新工作流：先在 Figma 画粗糙草图，让 Claude Code 自动完善细节，人工微调后再回传迭代。同时预告 3 月 31 日将与 Figma 合作直播讲解 MCP 使用技巧。

karminski-牙医@karminski3 · 3月28日

如何做一个生产级SKILL? 给大家带来用MiniMax-M2.7给龙虾写SKILL的保姆教程~ 有好多同学不知道如何写SKILL, 以及写了SKILL运行总是不稳定, 这次教大家使用 MiniMax-M2.7 给龙虾(openclaw)写一个"生产级" SKILL. 它可以批量量产类似 Apple 官网的那种产品爆炸图网页, 特别适合做产品的落地页. 聪明的同学甚至可以用我这个美化一下包个SAAS出去大赚特赚了哈哈哈. 本次使用的模型是 MiniMax-M2.7 这个模型相对于 MiniMax-M2.5 最大的特性是它是专门为龙虾(openclaw)设计的, Agent能力进行了优化. 另外图生视频模型用的是海螺2.0, 它生成首尾帧这个场景很稳定, 而且搭配这次 MiniMax Token Plan 一起用很实惠. SKILL稳定的核心其实就是模板化, 把流程尽量用逻辑(代码)固定下来就不容易出错, 然后步骤复杂的SKILL可以考虑先拆分后融合, 比如我这个编写的时候就拆分成了2步, 最后再把他们合并到一起就ok了, 能最大限度的保证每一步的质量. #MiniMax #MiniMaxM27 #Hailuo #MiniMaxTokenPlan #openclaw #skill

译本文介绍如何使用 MiniMax-M2.7 为 openclaw 编写生产级 SKILL。M2.7 专为 openclaw 深度优化 Agent 能力，稳定性超越 M2.5。配合海螺 2.0 图生视频（首尾帧稳定）及 MiniMax Token Plan 可降低成本。该 SKILL 可批量生成 Apple 风格产品爆炸图网页，适用于产品落地页。核心方法论是模板化与流程固化，建议将复杂任务拆分为多步骤执行后再融合，以最大限度保证输出质量。

Anthropic@AnthropicAI · 3月25日

New on the Anthropic Engineering Blog: How we use a multi-agent harness to push Claude further in frontend design and long-running autonomous software engineering. Read more: https://www.anthropic.com/engineering/harness-design-long-running-apps

译Anthropic 工程博客发文介绍多智能体工具（multi-agent harness），用于增强 Claude 在前端设计和长时间自主软件工程任务中的表现。该工具帮助 Claude 更好地处理复杂 UI 设计与长期运行的编程工作。

Eric@ericmitchellai · 3月22日35

commit, execute

译提交，执行

Greg Brockman@gdb · 3月22日

gpt-5.4 for frontend:

译只要投入必要的思考与意图，GPT-5.4 就能产出相当出色的前端代码。OpenAI 开发者博客提供了详细的最佳实践指南。

Google Gemini@GeminiApp · 3月20日

Loving these creations. Try it out and share yours in the replies 👇

译分享一个 Nano Banana 提示词，可生成 2×2 网格的 3D 字体雕塑，将 4 个重要历史年份及其代表性发明以复古科技或蒸汽朋克风格立体呈现。提示词包含锚点定义、形态构建、材质物理和光照渲染等详细参数，直接复制即可使用。欢迎尝试并在回复中晒出你的生成结果。

Saining Xie@sainingxie · 1月24日

love this teaser lol (and it is real) academia boxed us in sooo tightly that we nearly broke, but we clawed our way out and found a whole new universe on the other side😅 thank you to Google for supporting the gpu-poor rebels and pulling us into this ride, helping us build what I believe is one of the best tpu/gcp infrastructure teams outside of google

译喜欢这段预告片哈哈（而且是真的）学术界把我们限制得太紧了，差点崩溃，但我们挣扎着爬了出来，在另一边发现了一个全新的宇宙😅 感谢 Google 支持我们这些缺 GPU 的叛逆者，带我们踏上这段旅程，帮助我们建立了我认为是 Google 之外最好的 TPU/GCP 基础设施团队之一 [引用 @TongPetersb]：我们已经在学术界用 TPU 训练两年了（非常感谢 Google TRC！）。像 Cambrian-1、Cambrian-S、RAE 和 Scale-RAE 这样的工作没有 TPU 是不可能的。我们写了一篇博客文章分享我们的经验、优化和教训：https://cambrian-mllm.github.io/blog/tpu-training-experiments.html 我们希望这能帮助更多人更顺畅地使用 TPU，它们非常强大！

Anthropic@AnthropicAI · 10月1日

New on the Anthropic Engineering Blog: Most developers have heard of prompt engineering. But to get the most out of AI agents, you need context engineering. We explain how it works: https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents

译Anthropic 工程博客发文解释 context engineering。与 prompt engineering 不同，context engineering 通过优化上下文帮助 AI agents 发挥最大效能，文章详解其工作原理。