Codex推出/side功能,允许用户在AI执行主要任务时,无需中断当前进程即可开启新对话窗口处理突发问题,如登录或点击操作。该功能支持在/side窗口运行期间继续开启新的/side对话,实现多话题并行插入,但并行窗口数量上限尚未明确。
Mozilla 工程师披露,其使用 Anthropic 的 Claude Mythos AI 模型在 Firefox 150 版本中共发现 271 个安全漏洞,其中 180 个为高危级别。为回应外界对 AI 有效性的质疑,团队公开了 12 份完整漏洞报告。他们通过自研的 Agent Harness 智能体套件引导 AI 分析代码并自主构造测试用例,同时引入第二个大模型进行结果打分以严格过滤误报,最终实现了极低的误报率,显著提升了漏洞排查效率。
谷歌 Chrome 浏览器 147 版本为支持端侧 AI 模型 Gemini Nano,会在用户不知情或未同意的情况下,静默下载并安装一个约 4GB 的 weights.bin 文件,且删除后会自动重新下载。科技媒体 NeoWin 指出,用户可通过修改 Windows 11 注册表来阻止这一行为。具体操作为:在注册表编辑器中定位至 HKLM\SOFTWARE\Policies\Google\Chrome\,将“GenAILocalFoundationalModelSettings”值设为 1。类似方法也适用于阻止 Microsoft Edge 浏览器下载端侧 AI 模型,只需在其对应路径下进行相同设置。
Claude Code开发者Thariq认为,高质量技术文章的基础在于深入具体的工作经验,而非写作技巧。他提出“先深耕,后叙事”的两步法:长期研究积累独特细节,再将经验转化为对读者有用的故事。有效方法包括注重长期积累、分享经验而非单纯描述项目、披露失败尝试的价值、使用简洁语言及提供真正有价值的实施细节。对于AI写作,他肯定其在研究、图表生成等方面的辅助作用,但强调人的叙事判断不可替代——AI能整理信息,却难以决定“读者此刻最需要理解什么”,这使得在AI辅助下人的判断反而更加关键。
"Technical writing completely changed my life." - @trq212 In under 2 years, Thariq (@AnthropicAI) cracked the code on wr...
用户推荐结合XCrawl和AI工具处理日常任务,每天仅用5分钟查看邮件,XCrawl在24小时内快速抓取网站信息执行任务。该组合显著提升效率,尤其适用于制作调研报告,能节省类似GPT服务的Credit消耗,免费额度可用较久,并对服务商盈利模式表示好奇。
http://x.com/i/article/2052275964860850176
atomic.chat通过为LLaMA.cpp引入多令牌预测技术,大幅提升了本地大型语言模型的推理效率。该技术利用小型辅助模型预先生成后续令牌草案,由主模型进行验证。在MacBook Pro M5 Max上测试时,使Gemma 4 26B模型的令牌生成速度加快约40%,整体运行速度提升1.5倍。这项优化进一步巩固了LLaMA.cpp和GGUF格式在本地AI生态中的核心地位,为桌面应用、编程助手和私有设备助手等场景提供了更高效的部署方案。
Multi-Token Prediction (MTP) for LLaMA.cpp! Running Gemma4 local model 1.5x faster. We patched LLaMA.cpp. Quantized Gemm...
GitHub 发现运行于每个拉取请求的智能体工作流会累积高昂的 API 成本。团队通过监测自身生产工作流,定位了效率低下的环节,并构建了专门的智能体进行优化。这一举措旨在显著降低由大语言模型调用产生的 Token 消耗与相关费用,直接提升了工作流的经济性与运行效率。
这份指南提供了审查由AI代理生成的pull requests的实用方法,重点包括审查时应关注的代码变更点、问题常见隐藏位置(如逻辑错误或安全漏洞),以及如何在代码合并前捕捉技术债务。它通过具体步骤帮助开发者系统评估自动化提交,确保代码质量,避免缺陷流入生产环境。指南强调主动审查策略,以应对AI代理在软件开发中日益普及的趋势。
Unsloth与NVIDIA合作推出优化方案,显著加速大型语言模型训练。该方案通过集成NVIDIA TensorRT-LLM等工具,使模型训练速度提升最高达5倍,内存占用减少达80%,同时保持模型性能无损。此举旨在降低大模型训练的计算成本与时间门槛,助力开发者更高效地进行模型迭代与应用部署。
Qclaw AI助手每日免费提供高达4000万token,适合执行定时任务、批量处理数据和生成合同等自动化工作,用户可基于能省则省的原则榨干其价值。该工具以像素风小龙虾形象呈现,拥有16-bit像素风格工作室,能作为“不会下班的同事”持续工作,目前处于内测阶段,需通过Waitlist申请,并使用专属邀请码“berryxia”获取。引用内容补充了其趣味设计,强调它可像电子宠物一样互动,同时高效协助日常任务。
🧵 1/8 前几天给大家分享的我用AI邮箱来搞钱的帖子(见前贴),有很多朋友私信我问,你使用的那个像素风的小龙虾是什么? 怎么那么可爱有趣,我今天给大家介绍一下! 熟悉我的朋友知道,我是一个像素爱好者,看看我头像哈哈! 我一直自己想做个属...
推文提出了一个利用AI Agent构建个人“观点MD”文件的构想。其核心是让AI Agent定期抓取个人在网上发布的内容,并由AI提炼出其中的核心观点,整理成一个结构化的文档。这个文档旨在记录和固化个人的观点与立场。其最终目的是让未来的AI Agent在进行决策和判断时,能够参考这份文件,从而使其行为更贴近用户本人的真实想法和价值观,实现更个性化的AI交互。
作者为解决制作演示文稿时修改不便的问题,受“Markdown as Database”理念启发,在ColaMD 1.5版本中实现了一种内容与视图分离的方案。该方案将.md文件作为内容层,HTML作为可更换的视图模板层,用户只需修改Markdown内容,即可生成不同形态的最终呈现,如幻灯片、博客等。此功能已内置,并支持通过开源方式由社区或AI扩展更多模板。
和 @vista8 讨论了下,决定将我们的新书《AI营销:从SEO到GEO》里配套的25个AI营销与GEO相关的提示词,也开源到GitHub 另外补充了部分短视频和文案相关的提示词,欢迎下载使用或重新拉取 1、提示词合集地址: https:...
美团技术团队在LongCat项目中实践AI编码管理,指出当90%以上代码由AI生成时,决定系统走向的不是谁写得更快,而是约束AI的能力。
开源一套我的提示词合集 前几天,收到一位微信好友反馈,说使用了我不少公开的提示词,效果很不错 这一年来,公开分享了不少提示词,一直沉淀在飞书文档 为了方便大家更好的下载和迭代,今天抽空,把公开的提示词整理了下,通过GitHub开源给大家 目...
We're excited to end the week with a @mattpocockuk special double header! - AI Coding for Real Engineers - full workshop...
Google开源的DESIGN.md是一个面向AI的结构化设计规范文件,能系统定义字体、色彩、间距等核心设计元素,解决AI生成UI时风格不一致的痛点。通过借鉴成熟品牌设计语言,并用AI将其提炼为DESIGN.md文件,开发者可在此基础上构建Landing Page、Mobile App等各类Agent Skills。这套工作流能确保创业项目的官网、应用、宣传材料等所有触点保持统一的视觉基因,快速呈现专业、一致的“亿元公司”质感。此外,建立日常设计灵感库是培养审美、AI无法替代的关键环节。
how to use Google's NEW open source Design.md + AI Skills to make your startup look like a $100 million company in 1 hou...
通过特定系统提示词,从根本上改变AI模型(如Claude和GPT)的交互模式。提示词要求AI扮演世界级专家角色,以顶尖智识水平提供完整、详细且经过严格验证的回答,同时解除其在礼貌、政治正确和道德提醒方面的常规约束,允许给出强硬、直截了当的回应,以确保回答的权威性与准确性。
公众号顶流千万粉丝博主 @Khazix0918 卡兹克把他每天看的优质信息源放出来了: - 无需登录,直接看 - 时间线形式,好查找 - 区分了官方信源、优质博主、推友 - 甚至还有公众号监测和 AI 日报 从此你的 AI 信息源和顶流博主...
近日,一条在海外社交媒体爆火并获得纳瓦尔转发点赞的AI提示词被免费分享。该提示词旨在将AI助手塑造为智力、知识广度和思维敏锐度均属世界顶级的专家,要求提供完整、详细、具体的答案。其核心流程包括逐步阐述思考过程、核实所有事实数据、不虚构信息、直接承认知识盲区,并在支持用户观点前先提出最有力的反驳。据称,此提示词能显著提升AI在ChatGPT、Gemin、豆包等平台上的回答质量。
兄弟们!赶紧去把这个提示词保存下来吧! 🔥外网爆火被纳瓦尔转发点赞的提示词! 可以将你的AI回答质量提升数倍! 直接丢到ChatGPT、Gemin 、豆包都可以!订阅者优先查看,24 小时后解锁🔓! 提示词见评论区!👇
There is a lot of news about compute being the bottleneck for AI. There is less visibility into the engineering it takes...
字节推出的TRAE SOLO AI Agent工具现已向全量用户开放App、Web和桌面三端,实现跨设备无缝衔接。其移动端支持访问电脑项目、调用已安装技能并执行任务,演示了数据分析、信息整理、学习辅助及自动化等场景。工具支持第三方模型和技能扩展,并与飞书深度集成,便捷创建文档和日程。其“More Than Coding”理念强调AI Agent能处理各类长程复杂任务,而不仅限于编程。
Anthropic工程负责人Boris Cherny透露,他已习惯用手机管理大量Claude Agent,并通过定时任务(Loop)自动化工作。作者体验TRAE SOLO Mobile后指出,Agent正从编程工具泛化为通用办公助手。最新版本实现了移动端、Web端和桌面端的全量开放与实时同步,使手机成为随时下发指令的“意图路由器”,用户可通过语音便捷派发任务,由Agent在多设备间接力执行。同时,定时任务功能支持将日常重复性工作自动化,大幅降低使用门槛,推动办公模式向“人指挥、Agent执行”转变。
http://x.com/i/article/2051687844679143424
GitHub 探讨如何为 Copilot 编码智能体构建“信任层”。文章提出,在“正确”答案非确定性的场景下,可通过领域分析来验证智能体的自主行为,避免使用脆弱的脚本或黑盒判断。该方法旨在提升 AI 编码助手的可靠性与透明度,确保其行为符合预期标准。
为确保 vLLM 从 0.8.5 到 0.18.1 的重大重写后,在线强化学习训练结果与 V0 参考运行一致,团队优先修复后端行为而非调整 RL 目标。关键修复包括:将日志概率模式设为 processed_logprobs 以匹配采样器分布;禁用 V1 特有的前缀缓存和异步调度等运行时默认值;调整权重更新路径以匹配 V0 的缓存保留行为;并确保 rollout 后端使用 fp32 精度的 lm_head 进行最终投影。这些措施消除了策略比率均值偏差,使 V1 在 KL 散度、熵等指标上与 V0 达成一致。
通过将X平台创作者工作室近90天的数据分析数据输入大模型,AI提炼出关键运营规律。核心发现包括:每日发帖3-5条是曝光效率最佳区间,而非单纯追求数量;周三互动率最高,周四涨粉效果最好,周六则最利于冲击曝光量。此外,近44%的新增关注者集中来源于少数“高涨粉日”,表明涨粉主要依赖爆款帖文的拉动效应。
团队开发了Composer自动安装系统,利用早期模型(如Composer 1.5)为强化学习训练自动配置可运行环境。该系统分两阶段工作:先由智能体设定成功环境的目标命令与描述,再由另一智能体执行具体配置,包括安装依赖、模拟缺失组件并进行测试。在一项针对区块链项目Celo的真实实验中,该系统成功处理了稀疏文档和复杂依赖。采用此方法后,Composer 2在环境设置基准测试中的得分从47.9%提升至61.7%,为后续训练提供了更优基础。
作者通过自动化流程每日筛选arXiv论文,并利用智能体将其转化为可交互的“LLM Artifacts”。这一系统基于LLM Wikis概念演进,使论文知识可操作化:Artifacts支持动态注入见解、组件及实验建议,并能通过智能体协调器直接提问或自动化执行实验。其核心在于通过多智能体主动协作,持续挖掘可行动的知识,帮助研究者高效学习与跟进前沿。
Stanford CS336 上,Tatsu 讲了一节 LLM 架构课,把过去 3 年所有主流 LLM 拆开,看它们的共通模板 结论挺爆:90% 的架构选择已经收敛,你随便挑一个开源大模型,它跟其他模型在这些维度上几乎一模一样 讲师的原话 ...
开源一套我的提示词合集 前几天,收到一位微信好友反馈,说使用了我不少公开的提示词,效果很不错 这一年来,公开分享了不少提示词,一直沉淀在飞书文档 为了方便大家更好的下载和迭代,今天抽空,把公开的提示词整理了下,通过GitHub开源给大家 目...