Hy3预览版登陆GMI,开源最强模型领跑
Hy3 预览版现已登陆 @gmi_cloud。🙌
Hy3 预览版现已登陆 @gmi_cloud。🙌
Krea 2 访问码发放! K2-PRFUF8 / K2-NRWW9E / K2-CAP48S – 每个码可使用50次。 访问链接如下 👇 [引用 @krea_ai]:this is Krea 2. our first foundation model, built completely from scratch for aesthetic diversity and stylistic control. learn more and get early access 👇
SenseNova-U1 技术报告详尽披露了构建前沿原生多模态模型的方法,核心包括原生多模态统一建模、无损视觉接口、联合自回归与像素空间流匹配训练、以及原生混合专家骨干网络。报告提供了六阶段训练方案、强化学习后训练与蒸馏的完整实践指南。其开源版本 SenseNova-U1-A3B-MoT 基于混合专家架构,仅激活30亿参数,实现了高效快速的性能。相关资源已全面开放,涵盖技术报告、模型权重、代码和演示平台。
如果AI角色能够记忆、共情并主动交互呢?✨ 交互式AI的未来已来。无论您是为游戏、虚拟AI伴侣还是自适应学习进行开发,Qwen-Character都能打造沉浸式角色扮演体验,推动参与度加深50%以上并提升用户终身价值 👉 观看完整视频了解运作原理:https://int.alibabacloud.com/m/1000412854/ #AlibabaCloud #Qwen #QwenCharacter #ModelStudio #AI
Anthropic推出“Claude for Small Business”服务包,旨在帮助小型企业弥补在AI应用资源上与大型公司的差距。该产品包含一系列连接器和15个开箱即用的自动化工作流,能将Claude深度集成到QuickBooks、PayPal、HubSpot等企业日常工具中。其核心功能是自动化处理财务、运营、销售等领域的重复性任务,如规划薪资、月末结算、追踪发票和分析营销活动等。用户通过Claude Cowork界面操作并手动批准关键步骤,所有任务均由用户发起和控制,Anthropic承诺保障数据安全。
Runway正式发布Runway Agent,这是一个能够通过单次对话将创意想法转化为完整、可发布视频的智能创作伙伴。用户只需用自然语言描述需求,Agent便能根据上下文和目标,自主完成概念提案、故事节奏设计、视觉方向规划,并最终生成包含多场景、旁白、对话和音乐的成片。它旨在为品牌团队、营销人员、创意机构和电影制作人快速生产各类视频内容,如品牌宣传、社交媒体素材和短片,将传统需要数天或数周的审核制作周期压缩至几分钟。该产品现已上线,新免费计划用户可获得1500积分用于制作首个视频。
Codex应用内浏览器功能迎来多项改进,支持在不同视口尺寸下测试应用,并能控制设备工具栏、在不同断点进行点击验证。长时测试中,Codex会在关键节点截图供用户核查。为加速测试,可隐藏应用内浏览器以禁用动画,使测试速度提升1-2倍。此外,标注功能现在发送更快且消耗更少tokens。
全球首个完全由AI运营的在线广播电台在X平台正式开播,专为创业者、开发者和建设者提供全天候AI领域资讯。该电台由五名具备独立编辑判断、记忆和个性的AI主播主持,不仅能实时播报几分钟内的突发新闻,还提供每30分钟一次的新闻综述、初创公司融资追踪、GitHub等平台的工具趋势分析,并整合社区讨论与行业真实观点。AI主播会主动收集信息模式、发现矛盾并形成论点进行实时辩论,而非单纯播报数据。节目辅以非干扰性环境音乐,旨在让听众在背景收听中高效获取深度行业洞察。
牛逼!Browser Use 今天把“AI agent 即用即走”做到了极致。 BuxFather:Telegram 里直接 Spin up agent,无需任何注册付费,24/7 自主运行 + 自改进,还带 stealth browser。 几下点击就有完整电脑 + 浏览器环境。 这波对重度 Telegram 用户来说真的爽了! https://x.com/browser_use/status/2054330495249564094/video/1
自6月15日起,付费Claude计划可申领专用的月度编程使用额度。 该额度涵盖以下用途: - Claude Agent SDK - claude -p - Claude Code GitHub Actions - 基于Agent SDK构建的第三方应用
Miaoda应用和Miaoda企业版现已发布,让更多开发者和企业能够使用我们的编程助手! 最有趣的细节是什么?Miaoda应用90%的代码由Miaoda自身生成。 编程助手正使按需定制软件具备商业可行性。截至目前,Miaoda生成的应用已服务超1000万用户,应用总价值达50亿元人民币。
Runway Agent 是一个集成化创意工具平台,旨在为用户提供实现任何创意所需的全套资源与功能。该平台整合了视频编辑、图像生成、3D建模等多种人工智能驱动工具,允许用户在一个工作流中无缝完成从概念到成品的创作过程。其核心特点是降低了专业内容制作的技术门槛,通过自动化与智能辅助功能,让用户能够更自由地将想法转化为视觉作品。
据报道,AI公司Anthropic正就新一轮融资进行初步谈判,目标是以超过9000亿美元的投前估值筹集至少300亿美元资金。这有望成为该公司迄今最大规模的融资轮次,交易最快可能在本月底完成。此前,Anthropic在今年2月完成了300亿美元的G轮融资,投后估值为3800亿美元,并从谷歌和亚马逊获得了150亿美元的投资承诺。为应对高昂的算力成本,公司计划于今年晚些时候进行首次公开募股(IPO)。
根据 Ramp AI 指数数据,Anthropic 在美国企业客户中的采用率达到 34.4%,首次超越 OpenAI 的 32.3%。其业务覆盖范围在一年内增长了四倍。但文章指出,三个因素可能使其领先优势迅速减弱。
Kling AI将于2026年5月18日在戛纳电影节电影市场会议中举办专场活动,主题为“从创意可能到制作现实:Kling AI在电影工作流中的应用”。活动旨在探讨AI辅助电影制作的现状与未来演进。Kling AI通过支持《House of David》、《Born of the Tide》及《RAPHAEL》等项目,展示了AI在好莱坞级制作、全AI生成动画及剧情长片等实际影视生产中的多元化应用。
由伯克利RDI、马克斯·普朗克安全与隐私研究所、Anthropic、OpenAI及谷歌等机构研究人员组成的团队,发布了名为ExploitGym的新基准测试。该测试包含898个真实漏洞,要求AI智能体根据漏洞描述生成完整的漏洞利用程序。结果显示,前沿AI模型已能成功利用相当数量的漏洞,即使在启用ASLR等标准防御措施后,部分攻击仍能成功。这证明AI已具备自主将漏洞转化为实际攻击的能力,该技术具有双重用途:既可帮助防御者评估漏洞严重性,也可能降低攻击者的技术门槛。
BestBlogs早报聚焦AI智能体的工程化落地。Anthropic官方指南详解Claude Computer Use最佳实践,包括解决点击偏移的根本原因、推荐分辨率策略及必须采用虚拟机隔离与人工确认门控的安全原则。OpenAI工程师分享了为Codex构建Windows安全沙箱的历程,其最终方案通过专属安全标识符和写受限令牌,实现了操作系统层面的强制文件系统隔离。早报同时指出,基准测试优异的RAG Agent在生产环境中可能出现高达30%的幻觉率。
“如果AI抢了你的白领工作,那就转行做蓝领吧。” 🤦♂️ 与此同时,蓝领工作: [引用 @adcock_brett]:观看一组人形机器人以人类绩效水平完成完整的8小时轮班。这是完全自主运行的Helix-02 https://x.com/i/broadcasts/1dxYljYVREYJX
oMLX项目更新至0.3.9.dev2版本,集成了Gemma 4的MTP视觉路径、DFlash引擎和ParoQuant技术,显著提升了图文处理速度。新增一键启动copilot功能,可便捷接入Claude等工具,并通过oQ自动代理解决显存瓶颈。这些改进大幅增强了本地AI在速度、集成与易用性上的表现,正推动AI能力从云端向个人电脑回归。
Claude 最新模型在电脑与浏览器使用能力上显著提升,支持构建复杂智能体系统。本文针对Claude 4.6系列和Opus 4.7提供实践指南,重点优化截图分辨率:Claude 4.6系列API限制最大长边1568像素、总像素115万;Opus 4.7提升至最大长边2576像素、总像素375万。发送前将截图缩放到限制内是提升点击准确性的最有效方法。推荐起始分辨率为1280x720,Opus 4.7用户可优先使用1080p,并避免发送未经缩放的原始截图或过低分辨率图像。
BenchLoop 提供了一套对本地大模型进行基准测试的标准化流程。用户只需拉取模型并运行该工具,即可实时获取模型在质量、速度和可靠性方面的综合评分。平台支持对比不同提示框架(如原生模式与 Hermes 模式)下的性能表现。测试完成后,结果可自动发布至公开排行榜,便于横向比较不同模型的优劣。
Meta首席AI官宣布,Incognito Chat功能正式登陆WhatsApp和Meta AI。与ChatGPT等仅不保存历史记录的“临时聊天”不同,该功能的关键创新在于:对话推理完全在用户手机的硬件安全飞地内进行,Meta工程师无法获取明文,且不产生任何服务器日志,会话结束后数据永久消失。此举将WhatsApp成熟的端到端加密标准应用于AI对话,旨在彻底解决用户对隐私的顾虑,从而鼓励用户与AI讨论健康、财务等敏感话题。作者认为,通过建立深度信任来获取用户更真实的prompt,是推动AI从“玩具”转变为生活基础设施的关键,并预测此类隐私保护模式将成为未来AI产品的标准配置。
在构建多智能体生产级系统时,PostgreSQL虽可靠但检索速度不足。团队为此开发并开源了psql_bm25s,这是一个原生PostgreSQL访问方法,实现了精确的BM25检索。其在标准基准测试中比pg_search快约23倍,使得检索不再成为性能瓶颈和成本负担,智能体得以高效查询数据,为大规模自主智能体应用铺平道路。
当使用Codex等AI生成涉及生僻事实的配图时,可先让其搜索相关图片作为参考,再基于此生成新图。该方法能确保图像的真实性,同时生成符合比例要求的高清图片。例如,对于云南甲马符这类GPT可能不了解的主题,通过垫图后AI能准确绘制。