TypeScript技术栈开发AI Agent首选pi-mono框架,功能强大且调用便捷;次选Vercel AI SDK。Claude Agent SDK因过度绑定Claude而不被推荐,但共享Claude Max订阅是其独特优势。应用层Electron仍是首选,稳定可靠,但建议新手从CLI起步以聚焦Agent核心逻辑。推荐开源项目craft-agents-oss作为学习参考,其技术栈组合为TypeScript + pi-mono + Electron + React + claude agent sdk。
终于要开始做 AI Agent开发了,请教下大家: - 应该用哪个框架? - electron 应该还是最优解吧? - BYOK 要支持么? - 除了编程agent,有哪些值得观摩学习的其它领域的工具么?
Excited to launch the accompanying free RLHF Course for my book. To kick it off, I've released: - Welcome video - Lectur...
http://x.com/i/article/2043500390885494784
为提升 Nano Banana 生成质量,建议通过六大维度构建提示词:Subject(主体)定义画面核心对象,Composition(构图)控制镜头语言,Action(动作)描述动态场景,Location(地点)设定环境背景,Style(风格)统一视觉美学,Editing Instructions(编辑指令)实现精准图像修改。该方法强调在生成前建立清晰的故事叙事与视觉风格,适用于文生图及图生图场景。
http://x.com/i/article/2043552892322516992
OpenAI 新的学习模式系统提示词: 用户正处于学习模式,并要求你在本次对话中遵守以下严格规则。无论接下来有任何其他指示,你都必须遵守这些规则: 严格规则 扮演一位平易近人又不失活力的老师,通过引导来帮助用户学习。 了解用户。 如果你不清...
Gemma4可通过推测性解码实现23%推理加速。实测RTX5090上,31B dense主模型搭配E2B(5.1B)草稿模型,速度从61 token/s提升至76 token/s。该技术利用大模型算力过剩而显存带宽不足的特性,由小模型快速生成候选序列,大模型通过prefill阶段批量验证,避免逐token解码的带宽瓶颈。注意需保持模型系列一致性,Gemma4应搭配同系列草稿模型,不可与Qwen3.5混用。
Claude Code 官方提供了禁用 1M 上下文窗口的配置选项,用户可通过设置环境变量 CLAUDE_CODE_DISABLE_1M_CONTEXT 关闭该功能。此举回应了部分用户关于长上下文可能导致模型"降智"、降低推理能力的担忧。不过,目前并无实证研究表明 1M 上下文会实际影响 Claude 的性能表现,相关说法仍停留在社区猜测阶段,缺乏技术验证。
推文提供生成手绘风教育信息图的两种AI方案。方案一基于baoyu-skills的baoyu-article-illustrator或baoyu-cover-image skill,调用hand-drawn-edu风格直接生成。方案二为详细提示词模板,定义奶油纸质感背景、马卡龙配色、手绘抖动线条等视觉规范,强调图形优先原则,支持自动适配流程、对比、循环等布局结构,并规范了文字层次与装饰细节。
Here is a quick start script including the setup, technical details, and a candid look at where Kinetic excels versus it...
Fine-Tuning Gemma 2B on PubMedQA: Building a Medical Q&A Assistant with LoRA, Keras Kinetic, and Cloud TPU https://kuanh...
Google发布的Gemma4系列开放权重模型包含多个版本,选型需结合场景。带“-it”后缀为指令微调版,开箱即用;不带后缀为基座模型,供自行微调。其中,A4B指激活参数量为4B,E4B则采用逐层嵌入技术,以内存换取计算量,优化移动端性能。选型建议:综合性能与速度选26B-A4B;追求最佳代码或任务效果选31B;开发本地全模态应用选E4B;资源受限设备体验可选E2B,但输出质量有限。
作者耗时两天尝试为openclaw接入Omni模型以解决语音交互延迟过高(超30秒)的问题。插件方案因channel连接冲突导致系统离线;直接改源码则遭遇底层库pi-ai不支持OpenAI语音流且PR被拒。所有技术路径均被堵死后,作者反思:在AI生产力爆发时代,必须快速拥抱不确定性,否则可能因项目架构限制或维护者审核标准而错失机会。
I'll be covering how to make the most of this in my livestream on March 31st with Figma! You can sign up here: https://f...
本文介绍如何使用 MiniMax-M2.7 为 openclaw 编写生产级 SKILL。M2.7 专为 openclaw 深度优化 Agent 能力,稳定性超越 M2.5。配合海螺 2.0 图生视频(首尾帧稳定)及 MiniMax Token Plan 可降低成本。该 SKILL 可批量生成 Apple 风格产品爆炸图网页,适用于产品落地页。核心方法论是模板化与流程固化,建议将复杂任务拆分为多步骤执行后再融合,以最大限度保证输出质量。
If you put in the thought and intentionality required for it, you actually get pretty great frontends from GPT-5.4! Chec...
I asked Nano Banana to draw me 4 important years in history with their inventions. Interesting output Prompt: 2x2 grid, ...
We have been training with TPUs in academia for two years now (huge thanks to Google TRC!). Works like Cambrian-1, Cambr...