CODEX SKILL THAT TURNS LOCAL SEARCH INTO CLIENT LEADS! I made a Codex skill that helps find local businesses that may ne...
CODEX SKILL THAT TURNS LOCAL SEARCH INTO CLIENT LEADS! I made a Codex skill that helps find local businesses that may ne...
http://x.com/i/article/2053655813877870592
牛津大学博士后Kevin Lin开源视频翻译工具Violin,旨在打破高质量视频内容的语言壁垒。该工具将语音识别、大语言模型翻译与语音合成整合为自动化流水线,支持多语言互译与个性化翻译风格调整,例如将学术报告转化为儿童易懂版本。用户还能直接与视频内容进行对话并获取相关答案。Violin提供Web应用、命令行界面和Agent Skill三种使用方式,所有功能基于MIT协议开源,由Together Compute提供技术支持,适用于内容创作、教育及多模态智能体开发等领域。
🌟Introducing🎻Violin - an Open-source Video Translation Skill. 📹Video is the dominant medium on the internet, yet most...
由于这篇文章太伟大了,所以我把它变成了一个 Agent Skill。 大家可以使用自己的 Coding Agent 安装一下这个 Skill,这样就可以用「最佳实践」来轻松地重构或者开发一个既容易跨平台、又极其接近 Native 性能的桌面...
OpenClaw 2026.5.12 🦞 🧠 OpenAI setup defaults to Codex login 🛟 Runtime fallbacks + stalled-stream recovery 📬 Telegram...
Tom 兄弟开源了“html-anything”项目,旨在让 AI Agent 能将多种数据格式直接转换为专业设计的 HTML。该工具支持 Markdown、CSV、JSON 等 11 种输入格式,并内置 75 套模板,可生成杂志、海报、推文卡片等多种形态。它能自动兼容 Claude Code、Cursor 等主流本地 code agent,实现一键切换、完全本地运行,无需 API 密钥,边际成本极低。这一能力显著提升了 Agent 的内容呈现效果,对日常使用 Agent 进行内容创作、报告和演示的用户具有实用价值。
正式开源 html-anything 🚀 1:1 让你感受全网爆火 Claude code 作者提的 HTML 效果! 你的 Agent 现在可以将任何数据转为世界级设计水准的 HTML 🔥 历时 3 天,1万五千行代码!支持 75 套...
MLX框架的CUDA后端已实现所有测试通过,标志着其从苹果芯片专属工具正式进军NVIDIA GPU领域。这意味着开发者能用同一套代码,在Mac和NVIDIA显卡上获得高性能运行体验,有望打破PyTorch等框架的兼容性壁垒。此举可能强力推动本地AI应用的跨平台发展进程。
We have achieved a milestone in MLX that all tests are passing in CUDA backend now.
腾讯AI团队耗时6个月,针对AI agent在长会话中频繁丢失上下文的问题,开发并开源了一套记忆系统。该系统通过三大核心操作提升性能:实时压缩过期上下文,将token消耗降低61%;利用mermaid语法生成结构化任务地图,使agent在30多步复杂工作流中不易迷失;建立专用Persona记忆,将人格一致性从48%提升至76%。方案基于实际踩坑经验,强调agent记忆的难点在于在正确时间以正确方式回忆正确信息,而非单纯堆叠token。项目已在GitHub开源,为AI agent发展提供实用解决方案。
We spent 6 months on one problem: agents losing context in long sessions. Ended up building and open-sourcing an agent m...
Proud to announce the release of the SenseNova U1 Tech Report - together with the a new set of model weights based on Mo...
Long-running agents shouldn't pay frontier-model prices for every turn. We've been quietly building our agent with conte...
开源项目OpenSquilla针对大语言模型应用Token消耗过高的问题,提出了智能模型路由与本地向量检索相结合的解决方案。系统能自动判断任务复杂度,将简单问题路由至廉价模型,复杂任务则分配给更强模型,且路由决策在本地完成,不消耗Token。通过增量发送与缓存命中机制,实际传输Token减少了90%以上。其记忆系统能在上下文将满时自动筛选并压缩关键信息,支持混合检索。项目还具备成本统计、安全沙箱、支持OpenClaw一键迁移及定时任务等功能,显著提升了使用效率与经济性。
http://x.com/i/article/2054702609756508160
so we built psql_bm25s. exact BM25 retrieval. native Postgres access method. ~23x faster than pg_search on the standard ...
SenseNova-U1 技术报告详尽披露了构建前沿原生多模态模型的方法,核心包括原生多模态统一建模、无损视觉接口、联合自回归与像素空间流匹配训练、以及原生混合专家骨干网络。报告提供了六阶段训练方案、强化学习后训练与蒸馏的完整实践指南。其开源版本 SenseNova-U1-A3B-MoT 基于混合专家架构,仅激活30亿参数,实现了高效快速的性能。相关资源已全面开放,涵盖技术报告、模型权重、代码和演示平台。
New in @openclaw beta: one path scheme to rule them all. `openclaw path read|write|append` works the same across md, jso...
自己的博客,想了大半年,终于上线了。 说来惭愧,"搭一个自己的写作阵地" 这件事在我 TODO 里躺了很久。 选框架、挑主题、搞部署、接公众号...... 每次一想就觉得工程量太大,然后就搁置了。 直到看到 @vista8 乔木老师开源了他...
oMLX项目更新至0.3.9.dev2版本,集成了Gemma 4的MTP视觉路径、DFlash引擎和ParoQuant技术,显著提升了图文处理速度。新增一键启动copilot功能,可便捷接入Claude等工具,并通过oQ自动代理解决显存瓶颈。这些改进大幅增强了本地AI在速度、集成与易用性上的表现,正推动AI能力从云端向个人电脑回归。
Jina在其新版嵌入模型发布首日,即同步提供了全套MLX格式变体,改变了以往社区缓慢移植的节奏。这表明MLX已被视为核心部署目标,背后应有自动化流程支持。这一动向反映了MLX生态的崛起:Qwen、DeepSeek等主流模型官方开始集成MLX,Hugging Face将其提升为一级框架标签。嵌入模型因其体积小、推理频繁的特性,尤其适合在Mac的M系列统一内存上运行,为本地RAG等场景提供了理想的端侧AI解决方案。
https://huggingface.co/collections/jinaai/jina-embeddings-v5-omni
Introducing Renderers RL trainers work in tokens. Environments work in messages. Going back and forth corrupts sampled t...
读了一篇叫HeavySkill的论文,非常有意思。 让多个 AI先并行"独立思考",生成多条独立推理。 再用另一轮推理来综合所有思路,得出最终答案。 按论文测试结果,回答质量会提升非常多。 正在按这个思路写一个Skill,Claude Co...
We just launched holaOS Beta 0.1 - the first product version of what started as our open-source agent computer. I record...
AI Agent 连你平时买啥、吃啥的上下文都没有, 怎么了解你的消费品味?怎么做你的个人管家? 想拥有吃货Agent、买手Agent、导购Agent? 我又搓了个通宵,替你们调研实操了: 淘宝/京东/闪购(饿了么)/美团外卖/大众点评.....
AI Agent面临技能发现难、匹配不准及运行安全等挑战。SkillsVote利用GPT-5.4分析了Github上超160万个技能,筛选出79万多个,并提取功能、环境及权限等关键信息。它不仅提供精准推荐,还能记录执行步骤、反馈结果以优化技能,并生成工作流组合建议,提升技能价值。相比Vercel仅支持发现安装,SkillsVote覆盖了从发现、适配、归因到迭代的全流程,支持多种Agent客户端,是AI Agent的重要基础设施工具。
推文指出Apple的统一内存架构是端侧AI的理想平台。同时,OpenBMB发布了专为消费级硬件优化的1.3B多模态模型MiniCPM-V 4.6。该模型采用LLaVA-UHD v4技术,将视觉编码成本降低55%,实现了高效的边缘原生部署。其在多项关键基准测试中超越了更大的模型,且token消耗仅为对比模型的2.5%。在RTX 4090上处理高分辨率图像时,首token延迟仅75.7ms,速度快2.2倍。模型技术亮点包括Intra-ViT早期压缩和混合视觉压缩,有效平衡了分辨率与延迟。其部署友好,支持iOS、Android、HarmonyOS及多种主流推理框架与量化格式,相关资源已在各大平台开源。
1/5 MiniCPM-V 4.6 (1.3B) is now live 🚀🚀 High-res visual processing, optimized for consumer-grade and mobile hardware. ...
中国软件著作权申请材料 生成器 Skills https://meta.appinn.net/t/topic/85159
🌞我的私人工具库web开源了👹 ⚔️不是爬虫爬的合集 ⚔️不是随意收的合集 而是 🐝一个一个手动拷贝 🐝记录在我notion的 🦋很多跟审美相关 🦠也跟AI艺术相关 做个酷网页相关 自己一路的累积 实在太多了 存的时候没时间记录...
开源项目Claude Code Game Studios利用Claude Code构建了完整的虚拟游戏开发工作室。该项目包含48个AI智能体,1:1还原从创意总监到关卡设计师等全部岗位,覆盖游戏开发全流程。系统提供36条斜杠指令一键启动工作流,适配Godot、Unity、Unreal三大游戏引擎,并集成自动化校验钩子及28套行业标准文档模板。所有AI仅负责梳理方案,最终决策权由用户掌握。项目采用MIT开源协议,可免费商用,克隆仓库即可快速部署。
一款开源Skill“Create Onboarding Video”利用AI(通过Remotion)为iOS App生成高质量的用户引导视频。它强制遵循一套“反AI油腻感”的硬性规则,以制作出具有“App Store预览”级质感的片段。核心规则包括:视频需聚焦于证明功能在工作的特定UI组件,而非展示完整屏幕;字幕需有固定的位置、大小和入场动画;光标交互必须真实自然,禁止瞬移。该Skill定义了从素材采集、分镜规划到编码实现的四步工作流,强调“展示而非叙述”,旨在快速引导用户达成“aha moment”。
http://x.com/i/article/2053059568121282560
OpenCLI 现在可以读取微信、Telegram、Discord 的内容了!!! wx-cli / tg-cli / discord-cli 全部接入。 群消息、聊天记录、朋友圈、收藏夹--全部可以用 CLI 直接拿到。 以前 Agent...
如果你喜欢到Huggingface读最新的AI论文。 可以安装官方的cli: curl -LsSf https://hf.co/cli/install.sh | bash 安装好以后,提示词: hf papers read [论文编号或论文...
为应对公司要求将工作经验提炼为AI可执行技能(即“技能蒸馏”)的做法,有开发者提出了“反蒸馏”工具。用户可将写好的技能文件输入,工具会生成一份表面完整但核心知识已被抽离的“清洗版”用于提交,同时私密备份被移除的关键经验与知识,以保护个人真正的职业资产。例如,将具体技术实践“Redis key必须设TTL”泛化为“缓存使用遵循团队规范”。该项目旨在帮助从业者在AI时代维护自身知识价值。
字节跳动开源的UI-TARS-desktop是一个本地运行的桌面GUI智能体,允许用户通过自然语言指令操控电脑。它通过截屏和视觉模型理解屏幕内容,并精准控制鼠标键盘来操作各类应用,如打开VS Code或浏览网页,全程保障数据隐私。项目支持Windows和macOS,可操作本地或远程电脑及浏览器,并提供了SDK供开发者构建自动化工具。近期发布的v0.3.0版本增强了CLI功能。该项目在GitHub上已获得31.4K星标,增长迅速。