Midjourney V8.1 版本现已登陆 Discord 平台及其官方网站。本次更新重点提升了图像的清晰度与整体画质,这一改进在风格参考(SREF)和情绪板(Moodboards)功能中效果最为显著,同时所有类型的图像生成质量均有所增强,为用户带来更精细的视觉体验。
2025年数据显示,美国员工工作AI使用率已从2023年的20%升至40%。真正获得持续竞争优势的企业正将智能体AI深度嵌入工作流程,并将机构知识编码成可累积的系统。本指南以欧莱雅、Lyft和乐天为例,提出企业AI转型三大支柱:跨越“智能体思维鸿沟”、基于实际工作流程培训员工、在压缩信息密集型流程时保留人工判断,以及构建能创造收入的新产品能力。Claude Cowork平台为此提供了无需定制开发的团队级解决方案,并包含六个月的落地框架。
关联讨论 1 条OpenAI:官网动态(RSS · 排除企业/客户案例)Google正式发布Gemini Embedding 2统一嵌入模型,该模型能将文本、图像、视频、音频和文档映射到同一语义空间。开发者可通过单请求处理交织多模态输入,显著提升智能RAG、视觉搜索等内容审核任务的性能。模型支持超100种语言,并提供任务特定前缀和马特廖什卡降维等特性,为构建复杂AI智能体提供高效精准的基础。
关联讨论 1 条X:Google AI (@GoogleAI)新推出的 Response Caching 头部实现了 API 请求的缓存机制,完全相同的请求可获得缓存响应,响应时间大幅缩短至微乎其微的水平,且不会产生额外成本。该功能通过自动识别并复用已生成的响应,显著提升了重复请求的处理效率。
关联讨论 1 条X:OpenRouter (@OpenRouter)Claude Security 现已面向所有 Claude Enterprise 客户开放公开测试。该功能基于 Claude Opus 4.7 模型,能够扫描代码库中的漏洞并生成针对性修复方案。公开版本新增了计划扫描与定向扫描功能,更易于与审计系统集成,并改进了问题追踪流程。此外,Opus 4.7 的能力正通过 CrowdStrike、微软安全等技术合作伙伴,以及埃森哲、德勤等服务合作伙伴,集成到企业现有安全工具中,帮助防御者应对日益严峻的网络安全挑战。
关联讨论 1 条The Decoder:AI News(RSS)DataCenter.FM是一款以“AI泡沫”之声为特色的背景噪音应用。该应用将数据中心服务器风扇的持续嗡鸣、硬盘读写声以及网络设备指示灯闪烁的轻微滴答声混合,生成了模拟AI热潮下数据中心繁忙运转的环境音。这款应用在Hacker News上获得了103个投票,反映了科技社区对当前AI投资与基础设施扩张热潮的一种趣味性听觉呈现。
平台推出了高级账户安全功能,核心更新包括抗钓鱼登录验证、更强大的账户恢复机制以及增强型保护措施。这些升级旨在更有效地保护用户的敏感数据,并重点防范账户被恶意接管的风险。新安全体系通过多重技术强化了整体防护层级。
Claude Code 对提交内容中提及“OpenClaw”的请求采取了限制措施,会直接拒绝处理或收取额外费用。这一政策变化源于相关社区讨论,并在 Hacker News 上获得了超过 127 个关注点。该调整表明平台正对特定关键词关联的提交实施更严格的管控或成本规则。
KTC在京东上架新款27英寸Mini LED显示器M27P6S,售价2999元。该显示器采用2304分区Mini LED背光Fast IPS面板,支持双模切换:4K分辨率下刷新率为160Hz,1080P分辨率下可达320Hz。其HDR峰值亮度为1400尼特,响应时间2ms,色域覆盖99% sRGB、99% DCI-P3和97% Adobe RGB。支架支持多向调节,接口包括双HDMI 2.1、DP 1.4、支持65W供电的USB-C以及两个USB-A 3.0接口。
开源法律人工智能项目“迈克”正式发布。该项目旨在提供免费、可访问的法律AI工具,其核心变化在于将原本可能收费或封闭的法律AI技术开源化,允许开发者自由使用、修改和分发。项目网站mikeoss.com已上线,相关讨论在Hacker News上获得了超过100个社区积分。
Qwen Studio 发布了一个集成了多种功能的综合平台。该平台的核心功能包括智能聊天机器人、图像与视频理解、图像生成以及文档处理。此外,它还整合了网络搜索能力,支持工具调用,并能生成可用的“工件”或成果物。这一系列功能旨在通过一个统一的界面,全面解码并释放人工智能在不同模态任务中的潜力。
快手于4月30日发布AI桌面智能体KroWork。用户可通过自然语言指令驱动AI完成文件处理、浏览器自动化等任务,并能将重复性工作流固化为本地桌面应用,实现零token消耗、输出稳定且保障数据安全。该产品面向市场营销、财务等非技术用户,集成Qwen、Kimi等主流模型,支持沙箱执行和权限管控,旨在降低软件开发门槛,让个人能将日常需求转化为桌面工具。
在第九届数字中国建设峰会上,中国移动发布了“灵犀机器人家族”,包括人形机器人和四足机器狗等形态。人形机器人零售价22.9万元/台,日租5199元;四足机器狗零售价3.99万元/台,两只起租日租699元。产品应用于家庭、养老、园区及展厅等场景,并提供销售、租赁、订阅等多种服务模式。技术方面,中国移动自研了“VLA-RAIL”实时异步推理框架,提升自主执行效率1.5倍,并搭载“韬驭”导航系统,以实现复杂环境下的自主移动。
钉钉正式发售DingTalk A1 Pro“充电宝版录音卡”,定价1299元。该产品采用卡片式设计,厚度仅6.4mm,内置行业首发的MEMS指向麦克风,拾音距离可达10米。其配备2980mAh电池,支持连续录音180小时、待机180天,并可作为磁吸移动电源为手机充电。购买用户可获6个月专属权益,每月享有1500分钟语音转文字服务。
阿里发布业界首个安全可控、持续进化的生产级数字员工产品QoderWake,可在真实工作中承担软件工程师、运营、分析师等岗位。目前已上线“数字程序员”,能自主完成代码变更简报整理、错误诊断与初诊报告、告警分诊等工作,全流程基本无人值守。该产品已在阿里内部应用,将单条问题的根因分析耗时从30分钟大幅缩短至2分钟。近期还将上线数字分析师、数字客户经理等多种数字员工角色。QoderWake已开放邀测,个人和企业可通过官网申请雇佣或定制专属数字员工。
华硕为其2026款ProArt创13笔记本推出了高配新版本,售价28999元。该机型搭载16核心32线程的AMD锐龙AI Max+ 395处理器,配备128GB LPDDR5X内存和1TB PCIe 4.0 SSD。笔记本采用13英寸2880x1800分辨率触控屏,支持360度翻转,机身厚度为15.8mm,重量1.39千克,并配备三热管四出风口散热系统。接口方面提供了HDMI 2.1、两个USB4、一个USB-A 3.2 Gen 2以及MicroSD读卡器等。
谷歌宣布其Gemini应用现已支持直接生成并下载多种格式文件。用户仅需输入一条提示词,即可在对话中创建PDF、Microsoft Word、Excel、谷歌Workspace文档等,无需离开应用即可完成从构思到成文的流程。该功能已面向全球所有Gemini用户开放,生成的文件可直接下载至设备或导出至谷歌云端硬盘。支持的格式包括谷歌文档、表格、幻灯片、PDF、Word(docx)、Excel(xlsx)、CSV、LaTeX、Markdown、纯文本(TXT)和富文本格式(RTF)。
vivo 为 X300 Ultra 和 X300s 手机推出影像系统升级。X300 Ultra 在 19.10 及以上版本中获得了多项功能提升,包括支持追光、浓郁等风格的拍后可逆编辑;新增与上海迪士尼度假区的联名样张水印及旅拍风格水印;人像模式加入希区柯克变焦实况;通过云端大模型增强长焦画质;人像录像可手动调节曝光;录像支持地平线防抖;Log视频支持外接硬盘录制。X300s 在 10.5 及以上版本中,主要获得了拍后可逆编辑和全新的迪士尼联名、旅拍水印两项升级。
宇树科技发布新款双臂人形机器人,起售价2.69万元。该机器人主打上半身双臂操作,配备视觉双目算力模组,支持15至31个自由度,手臂自由度可选5x2或7x2。机身和头部各搭载8核CPU,头部模组算力达10TOPS。下半身可选固定底座或移动底盘,末端执行器可更换为双指、三指或五指灵巧手。产品提供四个不同配置版本。
微软于4月29日宣布,为拥有Microsoft 365 Copilot许可的用户在Windows、macOS及iOS平台的OneNote应用推出AI功能更新。新版内置Copilot AI突破纯文本限制,新增对表格、图像及标签的理解与分析能力。例如在规划旅行时,AI可综合分析行程表格、检查清单和景点照片,智能排查行程漏洞并提供优化建议。该更新通过服务器端推送自动部署,用户无需手动更新,只需确保设备版本符合要求即可。
ASUSTOR宣布将推出新一代全闪存NAS产品Flashstor Gen3系列,包括Flashstor 6 Gen3和Flashstor 12 Pro Gen3两款型号。新品均搭载AMD锐龙5 PRO 8640U处理器,提供16 TOPS的NPU AI算力,支持本地边缘计算和智能影像识别。该系列分别提供6个和12个M.2 NVMe SSD盘位,最高支持PCIe Gen4,并配备USB4、HDMI等接口。其支持双USB网络直连,传输效率可超越10GbE。同期推出的还有12盘位存储扩充设备Xpanstor 12R Gen2,配备550W白金效率冗余电源和热插拔风扇,可为特定NAS系列提供额外存储空间。
Simon Willison 发布了其命令行工具 LLM 的 0.32a0 版本。此次更新为 alpha 预发布版本,主要变更与详细说明可通过 GitHub 的发布页面及作者博客上的注解式发布说明获取。该版本标志着 LLM 工具在功能或兼容性上的进一步迭代,通常涉及对大型语言模型(如 GPT、Claude、LLaMA 等)进行访问或操作的改进。
llm 发布了 0.32a1 版本,修复了 0.32a0 版本中存在的一个关键缺陷。该缺陷会导致从 SQLite 数据库重新加载时,工具调用对话无法正确恢复。此次更新解决了 GitHub 上的 issue #1426。
苹果计划在 iOS 27 版相机应用中新增 Siri 模式,整合 Visual Intelligence 功能。该模式将与现有拍照模式并列显示,使智能视觉能力更易访问。功能包括扫描食品营养标签记录卡路里数据并同步至健康应用,识别名片信息添加联系人,以及扫描活动门票和会员卡生成数字版本存入钱包。此前需长按按钮激活的隐蔽操作被直接集成,提升用户使用便捷性。
<谷歌相册推出AI衣橱规划功能,通过人工智能自动提取用户照片中的服装图像,整理到数字衣橱。用户可按类别筛选服装,混搭单品设计穿搭,并支持虚拟试穿预览;还可保存穿搭到数字情绪板,适用于不同场合。该功能预计今年夏季首发于安卓平台,随后登陆iOS设备。>
本月发布聚焦视频生成、工作空间、智能体SDK与重排序模型。多家公司推出前沿大模型,包括GPT、Claude和LLaMA系列的新版本。核心变化体现在模型多模态能力增强,特别是视频生成功能成为竞争焦点。部分新模型在标准基准测试中性能提升超过15%,同时上下文窗口扩展至百万token级别。开发者工具方面,新的智能体SDK支持更复杂的任务编排,而重排序模型显著提升了检索精度。
据报道,苹果正加速研发其首款智能眼镜,预计与Meta Ray-Bans等产品竞争。该产品定位并非完整AR设备,核心聚焦于拍摄、语音助手和手势控制。硬件上配备两颗摄像头:高分辨率主摄用于拍照录像,低分辨率广角镜头则用于手势识别并为Siri提供环境视觉。为保障续航与轻薄,眼镜不内置显示屏及LiDAR等模块,并采用醋酸纤维材料提升佩戴舒适度。系统将搭载更智能的Siri,支持拍照、通话及环境交互。产品可能于2026年晚些时候预览,2027年正式上市。
LLM Python库和CLI工具发布0.32a0 alpha版本,进行了两项核心架构升级。首先,模型输入现支持表示为消息序列,能直接处理包含多轮对话历史的完整上下文,解决了此前难以载入已有对话的局限。其次,模型响应升级为支持由不同类型部分组成的流式输出,以更好地适配现代前沿模型处理多样化输入(如图像、音频)和输出(如结构化JSON、工具调用)的能力。此次重构旨在让该库的抽象层跟上LLM技术自2023年以来的快速演进。
Anthropic发布《企业级Claude Cowork部署指南》,旨在帮助非技术岗位员工规模化应用AI。该指南基于内部团队及Thomson Reuters等客户实践,提供了从试点到全面推广的完整路径。核心内容包括一个五级成熟度模型、试点用例评估方法以及为期六个月的组织级部署路线图。Claude Cowork作为桌面应用,能深度集成本地文件、Slack、Google Drive及浏览器,并结合Claude for Excel/PPT实现跨文档工作流,适用于金融、法律、销售等多行业的生产场景。
Cloudflare 宣布 AI 代理现可作为独立客户直接使用其服务。代理能够自主创建 Cloudflare 账户、开通付费订阅、注册域名,并立即获取 API 令牌以部署代码。人类用户可保留授权监督权限,但无需手动操作控制台、复制粘贴 API 令牌或输入信用卡信息。这一更新使代理能够以自动化流程完成从账户开设到服务部署的全链路操作。
Claude API技能现已扩展集成至CodeRabbit、JetBrains、Resolve AI和Warp四款开发工具中,使开发者能在其常用环境中直接获得生产就绪的Claude API代码支持。该技能能自动捕获API最佳实践细节,如适配的智能体模式、参数变更与提示缓存规则,从而减少错误并简化模型迁移。开发者可在工具内直接指示Claude执行“提高缓存命中率”或“升级至最新Claude模型”等任务。此开源技能会随SDK更新自动同步,帮助团队更快采用新功能,避免因API知识过时导致的生产问题。
Google Gemini 新增了在聊天界面内直接创建完整办公文档的功能。用户现可基于PDF、Word文件等源材料,让AI生成对应的文档、电子表格和演示文稿。这一集成将内容创建流程进一步简化,用户无需切换应用即可在对话中完成多种办公文件的制作。
Google Cloud推出了一项高性能集成方案,通过fsspec接口将Rapid Storage直接连接至PyTorch,以消除AI训练瓶颈。该方案利用Google的Colossus架构和双向gRPC流技术,可提供高达15 TiB/s的聚合吞吐量,并显著降低延迟。开发者仅需更新存储桶类型而无需修改代码,即可将总训练时间缩短23%。
DeepInfra 作为高性能、低成本的推理服务提供商,现已在 Hugging Face 平台正式上线。该服务支持众多开源模型,包括 LLaMA、Mistral 等系列,并提供按需付费的灵活计费模式。其 GPU 实例涵盖 H100、A100 等多种型号,显著降低了 AI 模型部署与调用的门槛,进一步推动了开源人工智能技术的普及与应用。
华为鸿蒙“龙虾”小艺 Claw 迎来11.6.3.300版本更新。核心升级包括上线“自进化”能力,可学习用户长期偏好以减少重复沟通;并正式接入DeepSeek V4模型,获得百万级上下文处理能力,在信息搜集、文档处理等任务中具备更强推理能力。此外,更新引入了社区与生态伙伴的精选技能,覆盖金融、办公等多领域。该智能体已获得信通院首个终端厂商权威安全认证。目前,支持该功能的小艺App已开启尝鲜升级。
Gemini 现已具备记忆用户偏好的能力,并支持从其他人工智能应用导入聊天历史记录。该功能率先在欧洲市场推出,允许用户将外部数据(例如来自 ChatGPT 的对话记录)迁移至 Gemini,以提升服务的个性化体验。
Cursor 正式推出 SDK 公开测试版,开发者仅需几行 TypeScript 代码即可构建和部署智能体。该 SDK 提供与 Cursor 应用相同的运行时、框架及前沿模型(如 GPT-5.5)支持,并允许将智能体部署于本地或 Cursor 云的专用虚拟机。借助其生产级云基础设施,如安全沙箱和持久状态管理,智能体正从个人工具演变为组织的可编程基础设施。许多团队已将其集成至 CI/CD 流水线、工作流自动化及核心产品中。
运行 `stripe projects add openrouter/api` 命令,即可直接从命令行创建 OpenRouter 账户、获取 API 密钥并开通 Stripe 计费功能。该操作支持自动化代理执行,实现了账户开通与支付配置的一站式集成。
砺算科技宣布其国产显卡砺算科技7G100将于5月20日在京东首发开售。为回应“画大饼”质疑,官方通过视频展示了该显卡的制造与测试产线。该GPU采用TrueGPU架构,基于6nm工艺,宣称从核心到架构均为自主研发。同系列消费级型号LX 7G106配备12GB GDDR6显存,兼容主流图形API,可运行《赛博朋克2077》等游戏并支持AI PC大模型,且7G100已通过微软WHQL认证。
三星在法国发布了新款Windows 11 Arm笔记本Galaxy Book 6 Edge。该机配备16英寸Dynamic AMOLED 2X屏幕,支持120Hz刷新率,并搭载了算力更强的骁龙X2 Elite处理器,NPU算力最高达80 TOPS。机身厚度显著缩减至12.3毫米。其续航表现突出,满电可播放视频22小时,并支持65W快充。提供512GB和1TB存储版本,冰川灰配色,预计5月初开售,起售价约为2199欧元。