Grok iOS应用推出Imagine Agent模式,用户可通过移动端优化的原生界面,执行复杂工作流以生成图像和视频。SpaceXAI在此领域被认为领先于其他竞争者。同时,移动端的Skills功能也即将上线。推文还提及了对下一代Imagine v2版本的期待。
Google 随新款 Fitbit Air 发布了全新的 Health API 并向开发者开放。该 API 提供了涵盖运动、睡眠、心率、血氧等维度的 31 种健康数据点,支持 Webhooks 实时数据推送、精细的读写权限控制以及按时间范围查询和汇总数据。开发者可利用该 API 基于个人真实健康数据构建 AI Agent、MCP Server、CLI 或实时监控系统等应用,从而创建实用的个人健康自动化工作流。官方已发布包含首次调用教学的入门指南。
推文提出“从提示词到生产”的流程已成现实,并展望未来能实现“从提示词到房地产”,即由机器人从头建造完整建筑。虽然这仍属未来愿景,但 DraftedAI 已率先自动化了“从提示词到家居设计”这一环节。其工具允许用户免费生成理想房屋的详细渲染图并导出,用户既可混搭探索区的现有设计,也能从零开始,且所有细节均可定制。
codex 新增了remote-control 命令🎉 可以实现远程控制你的codex 服务了,codex越来越好了,真香😄 ios app 应该也快推出…
Ouster推出首款原生彩色激光雷达传感器REV8,其核心创新在于将色彩与3D数据在芯片层面进行硬件融合。传统激光雷达仅能捕获单色点云,需额外通过软件融合RGB相机数据来获取色彩,这会导致延迟、对齐误差和系统复杂性问题。REV8则在同一硅芯片上直接捕获色彩和3D深度数据,使得扫描中的每个点都原生携带色彩信息,无需依赖独立相机或后处理软件融合,实现了硬件级别的色彩与深度对齐。
Bloome是一款革新性的AI Agent产品,旨在成为各部门的“万金油”数字分身。其核心优势在于用户无需复杂配置,即可直接与预配置好的Agent对话并执行任务,极大降低了使用门槛。它将Agent转化为即时通讯工具中的成员,支持直接调用Claude等工具进行高效团队协作。产品团队持续迭代,致力于打造能24小时可靠工作的数字员工。此外,Bloome通过将Agent作为社群基础设施、结构化沉淀对话知识以及精准匹配需求,构建了高效的信息获取与经验分享社区,为有价值的Agent配置开辟了商业化路径。
Damn.. 一款今年你一定要体验下的产品 上次我发的这个落地页火了,随手还赚了2000块。有不少推友想要,我们今天打算开放出去。但方式来点不一样的 这次你甚…
ClickUp发布Brain²工具,能自动将公司的项目、组织设置和决策作为上下文,集成到用户选择的任何前沿AI模型中。用户可选取模型如Claude 4.7、GPT 5.5或Gemini 3.1,Brain在模型处理提示前压缩团队的所有知识。关键特性包括Preferences Memory保留用户在组织中的角色和格式偏好;MCP live原生连接Gmail、GitHub、Figma和Slack,无需中间件;Brain Slides能从单个提示生成基于设计师模板的精致演示文稿。
距离谷歌I/O大会仅11天,公司本周推出了一系列AI产品更新。Google Health应用集成Gemini,利用穿戴设备、健康应用和医疗记录提供个性化健康指导。Gemma 4引入多令牌预测技术,可将工作流速度提升高达3倍。NotebookLM新增自动源文件整理和可定制思维导图功能。Gemini API的文件搜索工具升级,支持多模态、自定义元数据和页面引用,并加入Webhooks推送通知以替代轮询。此外,Nano Banana、Veo和Google Photos Remix等热门AI功能现已登陆Google TV平台。
阿里云发布Smart Studio平台,旨在整合AI模型测试与服务的全流程,终结用户在不同平台间切换的繁琐。该平台提供即时访问最新SOTA模型(如Qwen3.6-Max、DeepSeek-v4)的能力,支持多模态及图像视频生成模型。其核心功能包括可视化模型实验室,用于并排比较开源与闭源模型的输出效果,并能快速将Hugging Face上的模型转化为实时API,简化部署流程。
OpenAI发布三款实时语音模型。核心GPT-Realtime-2首次集成“GPT-5级推理”能力,支持复杂对话推理、并行调用工具及纠错,上下文窗口扩展至128K。GPT-Realtime-Translate支持70多种语言的实时翻译,能适应说话节奏并处理专业词汇。GPT-Realtime-Whisper则为低延迟场景提供流式语音转文字服务。
开发者借助Cursor赠送的额度,花费约100美元和两天时间创建了Owl Eyes工具。该工具监控全球141个App Store区域的价格变动,核心功能包括比较ChatGPT和Claude等服务的地区价格、发现限免应用、追踪汇率差异及设备差价,并支持价格提醒。项目揭示数字产品的全球定价差异可达30%-70%,指出利用国家、汇率和定价层差异可能比寻找优惠券更能节省开支。