一款名为“小耳”的开发者制作的macOS右键工具,利用AI多模态模型(如Gemini)智能识别文件内容,并自动将其重命名为“内容+日期”的格式,解决了系统自带批量重命名功能不够智能的问题。该工具以Quick Action形式集成,无需安装新应用或后台进程,支持图片、视频、PDF、Word等多种文件类型的批量处理。其关键优势包括处理在本地完成、可使用Gemini Flash免费额度、支持撤销操作,并建议用户也可考虑使用Gemma或Qwen等本地小模型以降低成本。
我是一个 AI Builder & Learn in Publish 👇 🔥一键让AI帮你改文件名🔥 你是不是有这种情况: 📁 截图全叫 Scre…
蚂蚁灵光App推出“体验世界模型”新功能,用户上传图片后,可在几秒到几十秒内生成一个可供探索的3D世界。该功能疑似主要依赖云端算力完成生成,尽管手机本地算力有限,但其生成速度仍被评价为“牛P”。目前生成效果虽未达到“惊艳”程度,但已具备可玩性,用户实测可成功进入多个由图片生成的3D场景。
Browser Use团队发布Browser Use Box(bux),一个可部署在自有设备(如VPS、树莓派)的24/7在线个人代理盒子。它通过将Claude Code Agent部署于本地,并将浏览器外移至Browser Use Cloud,解决了传统智能体会话不持久、本地浏览器环境脆弱(受2FA/CAPTCHA等限制)以及无法随时随地调用的问题。用户可通过Telegram或Web终端远程触发,Agent通过CDP-over-WSS协议驱动云端真实Chromium执行自动化任务(如预订航班、回复消息)。该项目已开源。
Telegram上线Managed Bots功能,极大简化了专属AI助手机器人的创建和管理流程。用户只需点击链接并确认名称,几秒内即可获得一个以自己名字命名的专属Bot,体验从使用公共客服转变为拥有私人助手。该功能支持机器人创建和管理其他机器人,并能互相通信。其核心潜力在于支持大规模个性化部署,应用场景包括:为每个用户创建隔离记忆与配置的个人AI助手;让商家一键开通品牌客服Bot的客服SaaS平台;用户点链接即开通的AI Agent平台;以及为每位订阅者提供定制化内容推送的专属Bot。
微软开源了40亿参数的TRELLIS.2模型,可将单张图片在3秒内转换为具备完整PBR材质(粗糙度、金属度、不透明度)的专业级3D资产。该模型生成的并非粗糙网格,而是直接可用于生产流程的高质量模型,能够准确处理开放表面、空心结构以及复杂几何体,显著提升了图像到3D内容的生成效率与实用性。
关联讨论 1 条Hacker News 热门(buzzing.cc 中文翻译)前_buildspace创始人Farza发布了Mac端AI助手Clicky。它常驻光标旁,用户无需打开应用或打字,直接对屏幕说话即可触发。AI能理解指令并自动执行任务,例如整理桌面截图、创建提醒事项、搜索整理网红列表生成CSV文件,甚至能在几分钟内根据描述编译并运行一个功能完整的原生Mac App。其核心突破在于从“用户主动寻找并操作AI”转变为“AI常驻感知屏幕,听令即执行”,直接完成而非仅提供操作路径,类似于数字员工而非聊天机器人。目前该产品已可免费下载。
NotebookLM最新更新解决了资料过多导致混乱的核心问题。当用户添加超过5个来源后,AI会自动按主题对所有文档进行智能分组并命名,例如将园艺资料分为堆肥、种植日历等类别。文档可跨组归属,用户也能手动调整。此次更新的关键在于AI仅在资料量达到需要整理的阈值(5个以上)时才自动介入,既避免了过度干预,又有效帮助用户从繁琐查找中解放出来,更专注于思考与学习。
AI驱动的BestBlogs平台发布v2.1.0版本,带来多项核心功能更新。主要包括深度改进的主题解读页面、重新设计图文并茂的早报展示、新上线的文档中心以整合帮助资源。同时,内容翻译功能升级至v2版,提升了中英翻译质量与切换便捷性。移动端用户体验获得显著优化,UI更简洁流畅。专为移动端开发的应用也已完工,待上架后将提供更佳体验。
Obscura是一个用Rust编写的轻量级无头浏览器引擎,专为AI Agent自动化和大规模网络爬取优化。其核心优势在于极致的性能与资源效率,内存占用仅30MB,页面加载约85毫秒,远超Headless Chrome。项目采用务实架构,复用Servo的DOM与V8引擎,并构建独立网络层。关键特性包括深度反检测的“隐身模式”,能随机化指纹并拦截追踪域名;通过兼容Chrome DevTools Protocol,实现与Puppeteer/Playwright生态无缝对接。此外,它内置了DOM转Markdown等专为AI Agent优化的功能,旨在作为高效的常驻网页感知端点。
前斯坦福机器人博士Aaron Tan发布的Lume机器人,外观设计为一盏豪华床头灯,但内置机械臂可自动叠放衣物。其核心理念是家用机器人应像一件会干活的家具,专注于解决叠衣服这类具体痛点,而非以人形形态在家庭中活动。团队将于下周在Palo Alto举办展示会,邀请公众自带脏衣服进行测试,强调产品解决实际问题的实用性,认为这种形态比追求拟人化功能更接近真正的家用机器人未来。
工具Anything推出新功能,能一键生成设计师级别的App Store截图。用户仅需15秒即可从空白状态获得4张完美适配官方规格的截图,系统会自动生成包含图标、评分和下载按钮的完整画面。修改文案也只需输入一句话并点击生成。此举解决了应用开发中制作和适配多尺寸截图的传统痛点,该过程以往需耗费数百美元聘请设计师或投入大量时间自行设计。AI正将开发者从繁琐的“脏活累活”中解放出来,大幅降低了从创意到应用上架全流程的门槛,尽管最终审美把关仍需人工,但已节省约90%的精力。
卧槽,OpenAI Codex团队刚放了个大招, 直接把所有第三方语音输入工具干懵了, 所有ChatGPT订阅用户,现在可以在桌面任何地方直接语音输入, 不用…
OpenClaw之父steipete推出AI维护机器人Clawsweeper,旨在应对AI生成代码带来的管理洪流。该工具部署50个AI智能体全天候扫描仓库issue和PR,仅在证据确凿时按严格限定的五类理由建议关闭,单日可处理约4000条。其设计极简,无传统仪表盘,所有状态数据实时写入README。这标志着开源维护从“人盯仓库”转向“AI管AI”,核心瓶颈从模型能力变为平台速率限制,被视为对开源维护范式的根本性改变。
OpenAI为ChatGPT订阅用户推出系统级语音输入功能,用户设置热键即可在桌面任何应用(如记事本、VS Code)中直接语音输入并转为文字。此举直接冲击Wispr Flow等付费第三方工具,用户无需额外付费,体现OpenAI将AI嵌入操作系统的战略,推动AI与工作流集成。
这周要发的GPT-5.5可能是人类离 AGI 最近的一次尝试🚀 Greg Brockman 是 OpenAI 的联合创始人兼现任 President(总裁),…