OpenKnowledge 是一款开源、AI 优先的笔记与知识管理工具,可作为 Obsidian 和 Notion 的替代方案。项目代码托管在 GitHub 上。
OpenKnowledge 是一款开源、AI 优先的笔记与知识管理工具,可作为 Obsidian 和 Notion 的替代方案。项目代码托管在 GitHub 上。
研究人员利用高分辨率X射线显微断层扫描和机器学习,在未物理展开的情况下完整虚拟展开并读取了赫库兰尼姆古卷PHerc.1667(Scroll4)。这是首卷被从头到尾连续读取的纸莎草卷,内容为斯多葛哲学论著,提及克里西普斯的侄子Aristocreon。第二卷PHerc.Paris4通过更高分辨率成像使墨水在三维数据中直接可见,独立确认了2023年大奖赛的解读。第三卷PHerc.139确定标题和作者为菲洛德穆《论诸神》第八卷。所有数据与代码已公开。
关联讨论 1 条X:Ethan Mollick (@emollick)两个GitHub开源项目分别提供A股和美港股全量免费数据,做成AI原生Skill,无需对接接口、处理反爬,几乎零API Key。在Claude/Cursor/Codex中一句话即可拉取行情、研报、资金流、龙虎榜。项目与UZI分析引擎可组合使用。
http://x.com/i/article/2069024565901119488
Hacker News 热门讨论指出,所谓“vibe coding”并非凭直觉编写,而是窃取开源和企业授权代码。
6月24日,GitHub宣布Copilot Free与Student计划将自动模型选择设为默认且唯一方式。系统根据任务复杂度动态分配模型:简单提示词用更快成本更低的模型,复杂编码任务用推理能力更强的模型。用户仍可通过悬停(Copilot Chat)或输出旁(Copilot CLI、Copilot Cloud Agent)查看所用模型。此前4月暂停相关订阅新注册,6月17日重新开放个人套餐注册,调整计费后6月用户使用量大幅激增。
GitHub自6月1日将Copilot从包月制改为按量计费后,用户使用量大幅激增,6月成为其成立以来业绩最佳月份。首席技术官费多罗夫在员工会议上透露上述信息,但未披露具体数据。GitHub正面临Cursor、OpenAI Codex、Anthropic Claude Code等竞品竞争。费多罗夫认为无需大幅涨价,但未确认调价方案。受使用量暴涨影响,GitHub在2026年已发生数十次大规模服务中断,微软正求助亚马逊解决算力承载问题。
宝玉分享 GitHub 项目 decode-codex,用于反编译闭源 coding agent Codex App。项目含两个 Skills:codex-app-ref-refresh(解包 app.asar 并格式化)和 deobfuscate-javascript(反混淆 JS 为可读代码)。用法:先解包再反混淆,后者需配合 /goal。用户 @LinearUncle 此前询问反编译模型推荐,宝玉以此项目回应。项目地址:https://github.com/JimLiu/decode-codex
@dotey @lovevfp 宝哥,反编译哪个模型最强?哪些模型不会拒绝,我正在搜索你的推特帖子呢,以前我看你写的是gemini,现在呢? 这个月token 实在太富裕了,闲来无事,想反编译一个闭源的coding agent
开源社发布《2025中国开源年度报告》。GitHub平台中国活跃开发者超210万,全球第三。OpenHarmony以60089 OpenRank值登顶全球开源项目影响力榜首。中美贡献度增速差超10%,按当前态势7年后中国开发者贡献度有望超过美国。中国OpenRank贡献度254963,全球第二。AI大模型相关仓库年均增长率超210%,vLLM进入全球项目Top15。10亿以上参数模型中Meta下载量占23.2%,阿里Qwen系列占20%,DeepSeek占3.8%,其R1训练成本仅550万美元。开源企业影响力微软居首,华为第二。
Simon Willison 受 Mozilla 新 MDN MCP 服务启发,将 mdn/browser-compat-data 的浏览器兼容性数据转为 SQLite 数据库。他用 Claude Code for web (Opus 4.8) 生成基于 sqlite-utils 的转换脚本,再用 Codex Desktop (GPT-5.5) 编写 GitHub Actions 工作流,将约 66MB 数据库 force-push 到仓库的 db 孤立分支,使其可通过 GitHub CDN 访问并附带开放 CORS 头。用户可直接下载或通过 Datasette Lite 在线探索。
JetSpec 是一种头部驱动推测解码框架,通过在冻结目标模型的融合隐藏状态上训练因果并行草稿头,生成与自回归因子分解对齐的候选树,从而将更大草稿预算转化为更长接受前缀和更高端到端加速。在密集和 MoE Qwen3 模型的数学、编码及聊天基准测试中,JetSpec 一致优于双向头和树形基线。在 H100 GPU 上,MATH-500 达 9.64 倍加速,开放对话达 4.58 倍;经 vLLM 集成在现实服务负载下进一步降低延迟。
Matt Pocock 推出 /loop-me 技能,旨在帮你梳理日常工作中的重复“循环”。它采用“严苛面试法”逐一追问直到模糊点消除,最终输出清晰的 workflows/.md 规范文件,任何实施者(人类或AI)看完即可执行。核心包括定义 Trigger、Checkpoint、输出等要素,确保达到“完成的定义”。技能目前仍处于进行中状态,但已可直接使用。它强调先打磨工作流程,使之能被 AI 精确理解,从而降低认知负荷,将重复劳动真正委托出去。
New in-progress skill: /loop-me Interviews you about your work and finds opportunities for delegating your day-to-day wo...
NatureBench是一个跨学科基准测试,包含90个从Nature系列同行评审论文中提取的任务,用于评估AI编码智能体能否超越复现、实现发现。基准基于NatureGym自动化管线,为每个任务提供标准化容器化环境,解决环境碎片化问题。在严格禁用网络搜索的协议下评估10种前沿智能体配置,最强模型仅在17.8%任务上超过已发表SOTA(g>0.1准则)。分析表明,智能体成功主要依赖方法论翻译,失败主因为方法选择错误和计算预算不足。已发布基准、NatureGym管线及公共排行榜。
大语言模型在多步工具使用的强化学习(RL)训练中常出现灾难性崩溃——模型性能骤降且工具调用结构失效。研究发现,崩溃源于特定控制 token 的概率尖峰,但底层工具使用能力并未丢失,仅被格式掩盖。研究者系统探索了离策略监督、提示引导、错误示例等多种监督信号,发现将监督微调(SFT)与 RL 交错训练可显著提升稳定性,但在格式和内容分布外(OOD)评估中性能下降。代码已开源。
GitHub 联合 Black Forest Labs、Hugging Face 与 Mozilla Corporation 组成开源联盟,呼吁对加州 AI 透明度法案(SB 942,拟由 SB 1000 修正)进行针对性修改。当前草案要求开发者在下游用户未履行义务时撤销开源许可证,这与开源许可证永久不可撤销的性质冲突。联盟认为该要求非必要,已有直接监管和执法机制,并建议参考欧盟 AI 法案的透明度实践规范,以向下游用户通知最佳实践文档的方式替代撤销条款。GitHub 支持这些修正,以在保持透明度目标的同时兼容开源开发模式。
Sky Computing Lab 发布 FastWan-QAD 视频生成模型系列,基于 FastVideo 的量化感知蒸馏(QAD)方案训练。在单张 NVIDIA GeForce RTX 5090 上,端到端生成一段 5 秒 480P 视频仅需 1.8 秒。模型、代码及博客已开源。
UC Berkeley研究人员发现,近2000个GitHub Pages站点(18000+页面,累计530K+星标)仍在加载来自polyfill.io及其关联恶意CDN的脚本。这些CDN由已被OFAC制裁的Funnull Technology Inc.(现更名Triad Nexus)运营,2024年被出售后开始条件性注入恶意载荷,劫持移动用户、跳转欺诈站点、伪造认证弹窗窃取凭证。扫描12000+站点确认786个加载polyfill.io,1191个加载其他Funnull CDN。更严峻的是,所有测试的大语言模型在生成前端代码时仍推荐这些被污染的CDN URL,包括CyC2018/CS-Notes(184K⭐)、microsoft/AirSim(18K⭐)等知名项目及多所大学课程页面。
网友Vista通过AI分析新智元标题风格,总结出中位长度32字、标点使用率近八成、数字出现率56.7%、英文名出现率90.8%等规律,并发布名为joeseesun/qiaomu-xinzhiyuan-title的Skill,可用npx skills add安装,生成类似标题。
看看这个skill生成的标题,是不是有新智元的味道了😂
商汤科技利用 Office Raccoon 与 SenseNova-Skills 构建数据驱动预测引擎,用于 2026 年世界杯小组赛结果预测。引擎整合 FIFA 排名、Elo 评分、Transfermarkt 球队身价、WinnersAndWhiners 赔率、RotoWire 战术分析、FootballBerry 排名及 ESPN 市场数据,并从长期阵容能力、近期状态、阵容完整度、战术适应性四个维度评估各队。相关项目已开源:SenseNova-Skills 的 GitHub 仓库(含 Hermes Agent 与 OpenClaw 安装指南)及 Office Raccoon 官网已公布。
Paul Bakaus宣布创立Renaissance Geek,旗下设计工具Impeccable获a16z领投融资(Anish Acharya主导),并与GitHub合作——Impeccable预装在GitHub Copilot应用中。他认为AI拉高了创作下限,但优秀作品仍依赖人类意图、迭代与品味;Impeccable只剥离“设计泔水”而非输出品味。设计正从Figma迁入浏览器生产环境,Impeccable让用户用自然语言指导Agent实时修改生产代码,推出Live Mode实现主动人机交互。他定义“文艺复兴极客”为跨学科的T型通才,AI将放大这类人的能力。
Paul Bakaus 宣布成立 Renaissance Geek(Impeccable 母公司),获 a16z 投资并与 GitHub 合作。他认为 AI 降低了创作门槛,但未自动提高上限;真正优秀的工作仍需清晰意图、迭代、判断力与工艺。公司方向为“增强工艺”——让人类深度参与智能体循环的最后 20%。首款产品 Impeccable 为 AI coding agent 提供设计词汇表,支持在真实代码库视觉迭代,避免低质量输出。同时提出“文艺复兴极客”画像:T 型通才、高品味、高主动性、强好奇心,AI 赋能其跨领域移动,而品味与判断力是 AI 最稀缺的能力。
http://x.com/i/article/2069426743950417920
IBM 开源了 CUGA(Configurable Generalist Agent),一个处理规划、执行循环、工具调用和状态管理的轻量级智能体框架。开发者只需提供工具列表和提示词即可构建 CugaAgent。内置计划-执行-反思循环,在 AppWorld(2025年7月–2026年2月)和 WebArena(2025年2月–9月)基准上排名第一。支持 Fast / Balanced / Accurate 三种推理模式,代码执行可在本地、Docker 或 E2B 沙箱中运行。可互换工具支持 OpenAPI、MCP 和 LangChain 函数,通过环境变量一键切换 OpenAI、watsonx、Ollama 等提供商。随框架发布二十余个单文件示例应用,涵盖电影推荐、IBM Cloud 架构顾问等场景,每个应用仅需一个 FastAPI 文件。
网易有道推出“子曰 4.0”TTS 引擎 Confucius4-TTS,声称是业内首个支持 14 种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型。用户仅需 3 秒音频即可实现零样本音色克隆,克隆音色与原声相似度超 85%,任务准确度达 97%。模型支持中文、英语等 14 种语言,首创音频 Prompt 情感克隆迁移。底层采用 GPT 式语义大模型、SSL 预训练特征与 ECAPA-TDNN 说话人编码器、Flow Matching 框架。已全量开源(Apache 协议),提供 54GB 资源包供本地部署。
UniverSat是一种基于Vision Transformer的骨干网络,采用通用补丁编码器(Universal Patch Encoder),将来自任意空间、光谱和时间分辨率以及光学和非光学传感器的补丁映射到共享嵌入空间,使用共享权重。这使得单个模型能够在异构多模态数据集上通过自监督训练,生成鲁棒的传感器无关空间特征。在GeoBench、PANGEABench和SpectralEarth等标准地球观测基准的分类和分割任务中,取得了强劲结果。代码和模型已开源。
EnterpriseClawBench 是一个从专有真实工作会话档案构建的企业智能体基准,产出 852 个可复现任务,配有恢复的夹具、重写的提示词、角色类、技能子类、硬规则和语义评估细则。因含企业内部内容,不公开基准数据。在 EnterpriseClawBench 上,最佳配置(Codex with GPT-5.5)仅达 0.663。结果表明企业智能体评估必须报告多种维度(如 harness-模型组合、产物交付、视觉质量、成本、运行时和技能迁移行为),而非单一分数。代码已公开。
Z.ai 发布 GLM-5.2,开源 744B 参数(40B 活跃),1M 上下文窗口,性能与 Claude 4.8 Opus、GPT-5.5、Gemini 3.1 Pro 持平。通过 Unsloth 动态量化,2-bit GGUF 版本内存需求降至 239GB(-84%),1-bit 版降至 217GB(-86%),可运行于 256GB 统一内存 Mac 或 1×24GB GPU+256GB RAM。提供非思考、高、最大三种思考模式。评测显示动态 1-bit 准确率约 76.2%,2-bit 约 82%。
同一事件,精选展示《GLM-5.2 上线并开源:专注 Coding 与长程任务》商汤SenseTime发布推文,感谢YouTuber xCreate对SenseNova U1模型的详细拆解,重点展示其文本-图像交错推理(text-image interleaved reasoning)和信息图表(infographic)生成能力。推文附有逐步指南,指导用户通过SenseNova Studio在线使用或本地运行模型。相关资源包括YouTube视频、HuggingFace模型集合、GitHub仓库及Discord社区链接。
Anthropic Claude Code 负责人 Fiona Fung 称工程师每季度交付代码量是 AI 普及前的 8 倍,采用常驻远程会话和定时 agent 自动生成 PR,以 bad/sad 质量框架守住质量。苹果 WWDC26 上库克卸任,John Ternus 接任;AI 权力重构:John Giannandrea 离开,Mike Rockwell 接手 Siri 并向 Craig Federighi 汇报,从谷歌挖来 Amar Subramanya 主导自研模型。新一代 Apple Foundation Models 包括端侧 30B 参数 AFM 3 Core 和 200B MoE AFM 3 Core Advanced,云端 AFM Cloud Pro,端侧需 iPhone 17 Pro 等设备。GitHub 公开内部数据分析智能体 Qubot,采用三层架构,返回正确答案速度提升 3 倍。
SingGuard是一种将活跃政策作为运行时输入的多模态LLM护栏模型系列,可逐条检查内容并预测安全标签与触发规则。支持快速、混合和慢速三种推理模式,并通过快慢解耦强化学习优化。同时发布SingGuard-Bench基准,含56,340个样本,覆盖80+细粒度风险类型及跨模态联合风险。在6个基准家族(35个数据集)上均取得平均F1 SOTA;动态规则评估下政策遵循准确率从0.6465提升至0.7415。代码已开源。
同策略蒸馏平等对待所有学生生成输出。实验发现,仅用错误输出训练效果优于仅用正确输出,因错误输出保留模型能力边界附近的探索性推理。为此,ReNIO利用学生-教师概率比识别导致错误推理轨迹的关键token,聚合为归一化样本权重,无需观测最终答案正确性即可自动赋予负轨迹更高权重。在数学推理和代码生成任务上,ReNIO同时提升同策略蒸馏和同策略自蒸馏,对Qwen3-1.7B最高提升8.90%,对R1-Distill-Qwen-7B最高提升10.00%。代码已开源。
不求设计师!Codex一句话生成App图标,加快项目开发速度。 开源乔木icon设计Skill,支持两种方案: 1. Codex内调用Imagen生图能力,参考小耳@xiaoerzhan收集的几百个图标参考生成。 2. 支持搜索 2w SV...
Cowart:Codex + 无限画布工具插件开源,大家可以来试试啦,这个插件先取名叫 Cowart,别问为什么叫这个,我只能说 Code with Art 这种冠冕堂皇的理由:https://github.com/zhongerxin/c...
思科 AI 推出 FAPO,一个由 Claude Code 驱动的多步 LLM 流水线自动化优化系统,基于 Apache 2.0 开源。FAPO 通过步骤级故障归因,从提示词、参数到链式结构逐级升级优化。在六项基准测试中,以 GPT-4.1-mini、GPT-5.4-mini 和 Gemma 3-12B 为任务模型,与 SOTA 优化器 GEPA 对比:18 个模型-基准比较中赢下 15 个,平均增益 +14.1 个百分点;在 HoVer 和 IFBench 上触发结构升级时六组全胜,平均增益达 +33.8 个百分点;仅在 AIME 上略逊 3.1 个百分点,在采样噪声范围内。防过拟合机制包括仅检查训练集、不可变文件及独立审查。
Netflix 高级工程师 Tejas Chopra 开发的开源工具 Headroom(v0.26.0)在 AI 应用与 LLM 间建立本地透明压缩层,通过压缩 JSON、代码、RAG 片段和对话历史等冗余数据减少 Token 消耗,支持可逆压缩与 CCR 缓存机制。实测代码搜索场景 Token 从 17765 降至 1408(节省 92%),SRE 事故调试场景从 65694 降至 5118(同样节省 92%)。累计帮助用户节省约 70 万美元成本、释放超 2000 亿 Token。提供 Python/TypeScript 库、智能体代理模式、直接包装现有 AI 编程智能体以及 MCP 服务器模式,并可精简 AI 回复中客套话进一步降低成本。
GitHub 内部开发了 Qubot,一个由 Copilot 驱动的数据分析智能体。员工可以用自然语言直接提问公司数据,无需编写 SQL 或使用 BI 工具。团队在构建过程中积累了关于设计、集成和用户体验的经验。
商汤 SenseNova U1 具备行业首创的文本-图像交错生成能力。用户上传客厅照片后,U1 可瞬间将其风格转变为温馨阅读角。该演示由 @eigi_and_ai 完成。U1 现已通过 SenseNova Studio、HuggingFace 模型库、GitHub 源码及 Discord 社区开放体验。
Humanize PPT v0.9 是一款专为演讲场景设计的PPT Skill,核心通过AST(Audience, State, Transfer)逻辑重新编排大纲,将页面渲染外包给下游Skill。渲染前先输出4张真实预览页,并将图片、视频素材的占位与生成prompt写入大纲。新增质检环节自动修复常见渲染问题,并支持演讲模式:按S键在独立窗口显示演讲稿备注,按ESC键打开全局索引快速跳页。项目已开源至github.com/LearnPrompt/humanize-ppt,由卡尔 & yc星辰开发。
baoyu-design skill 可以在本地生成动画视频,导出 mp4 格式,就像附件视频这个。 Claude Design 网页版可以用提示词创建动画视频,但你需要在网页上才能看到视频,无法下载。也有人基于第三方插件录屏软件实现过,不...
Agent Builder 正式上市(GA)。基于 Elasticsearch 的持久化内存层将记忆分为情景、语义、程序三类,分别存入独立索引,各设不同写速率与过期规则。召回采用 BM25 与 Jina v5 稠密向量的 RRF 融合,再经交叉编码器重排序。在 168 道 QA 题评估中,R@10 平均 0.89,零跨租户泄漏。该层可通过支持 MCP 协议的客户端访问,不绑定特定运行时,已开源至 GitHub。
姚金刚使用高级agent Codex连续38小时、提交301个分支,将自己创建其他skill的元Skill(yao-meta-skill)重构并升级至2.0版本,已推送到GitHub。Codex持续拆解任务、修复问题,产出完整升级方案与1.0→2.0对比报告。新版本在结构、可靠性和可扩展性上明显提升,所有文档公开。此次升级本身成为典型案例:高级agent已能参与“如何更好地使用agent”的框架迭代。
终于完成了对元Skill(创建skill的skill)的2.0升级 已推送到GitHub 这两天又进行了一些微调和测试,欢迎体验 相关资源与文档分享: 1、元skill仓库:https://github.com/yaojingang/yao...