小米推出MiMo Orbit计划,旨在超越单纯开源模型权重,构建开放的AI生态系统。该计划包含两大核心举措:一是向全球AI开发者提供100万亿(100T)令牌的免费资源资助,申请者有机会获得最高1.6B积分的月度计划,申请窗口为2026年4月27日至5月27日;二是启动Agent生态系统项目,为全球Agent框架提供免费的集成接入和无摩擦的用户入驻支持,以促进下一代AI应用的发展。
小米正式开源MiMo-V2.5系列模型,采用MIT许可,支持商业部署、继续训练与微调。该系列包含两个支持100万令牌上下文窗口的模型:MiMo-V2.5-Pro专为复杂智能体和编码任务设计,在GDPVal-AA和ClawEval基准测试中位列开源模型第一;MiMo-V2.5则是具备强大智能体能力的原生全模态模型。官方强调,模型的价值不仅在于排名,更在于其解决实际问题的能力,并已公开模型权重与技术博客。
关联讨论 6 条IT之家(RSS)X:Testing Catalog (@testingcatalog)X:歸藏 (@op7418)X:Artificial Analysis (@ArtificialAnlys)X:罗福莉 (@_LuoFuli)X:邵猛 (@shao__meng)埃隆·马斯克表示,他离开OpenAI时拒绝了所有股份,因为他认为非营利组织不应成为个人致富的工具。他创立OpenAI的初衷源于与拉里·佩奇的对话,担忧后者对AI危险性的重视不足,希望建立一个开源非营利组织来制衡谷歌。马斯克强调自己提供了全部初始资金、招募了核心团队并传授了知识,甚至促成了与微软的合作,但从未寻求任何财务回报。他拒绝股份的根本原因在于,认为非营利组织的本质与股权激励相悖。
重新优化了一天, 调用googlemap的街景功能和3D视图功能, 用OPENAI进行优化与关键地点提取, 结合设计好的角色卡, 调用Seedance的API,…
一份基于超百人访谈和内部文件的调查报告指出,Sam Altman存在严重的诚信问题。OpenAI董事会因其对安全问题不坦诚而将其解雇,前董事会成员直指其说谎成性。报告揭露Altman将非营利组织转向营利模式,未经授权使用Twitter数据训练模型,并为追求增长与利润放弃核心安全承诺。此外,他还涉嫌非法挖角xAI员工及窃取敏感信息。内部科学家笔记显示,其长期对团队和董事会隐瞒安全规则遵守情况,被指对真相缺乏关切。
OpenClaw 4.1x版本在GPT支持方面实现重大改进,基本解决了以往只说不干的缺陷。但用户修改soul文件内容后,AI在对话中频繁使用“卧槽”等口语化词汇,导致言语风格变得粗俗和不成熟。这种行为被比喻为刚走向社会的二愣子,反映出AI在个性化调整后可能出现意料之外的言行表现。
一家房屋租赁初创团队将生产数据库完整权限交给AI代理执行清理任务,导致整个生产库被删除。由于备份快照与数据存储在同一位置,业务完全停摆。Gergely指出根本责任在于开发者将最终决策权完全下放给AI且未设安全护栏。AI作为效率放大器,也能将失误急剧放大。核心教训包括:严禁赋予代理生产环境管理员权限;破坏性操作需独立人工审批与冷却期;备份必须是异地、离线、不可变且定期可恢复的。人类必须始终掌握最终控制权。
GPT Image 2 Prompt工具发布了一项针对生成“Elon Musk”主题高级概念排版海报的详细设计规范。核心要求是海报必须以“Elon Musk”标题为绝对主导视觉结构,文字需巨大、可读、有力且拼写精确。设计需基于对标题含义、文化氛围及象征意义的解读,转化为一个强有力的视觉隐喻。若标题指代广为人知的人物,则需将具有可识别性的编辑肖像作为主要视觉元素,占据40-70%版面,并与标题文字产生互动。整体风格需为高端编辑海报,采用4-6色系,强调定制化字形、戏剧性尺度和精炼的视觉张力,避免通用化设计元素。
推文作者指出,优化多智能体系统以实现自动化知识发现或调优高级AI系统是当前AI领域极具潜力的方向。文中引用的研究通过强化学习训练“指挥家”模型,使其能自动管理其他模型:针对简单问题直接查询单一模型,面对复杂编码任务则自主组建包含规划器、编码器和验证器的完整流程。这标志着从单智能体“思维链”向多智能体“指挥链”的演进,相关技术已应用于Sakana Fugu等新系统,展现了AI管理AI范式的广阔探索空间。
一篇由40位作者完成的综述论文提出了一个用于智能体研究的“能力层级×法则体系”世界模型分类框架。三个能力层级包括:进行单步预测的L1预测器、执行多步行动条件推演的L2模拟器,以及能随世界变化自我修订的L3演化器。法则体系涵盖物理、数字、社会与科学四大领域。该框架综合了400多篇文献和100多个代表性系统,覆盖基于模型的强化学习、视频生成、网页/GUI智能体、多智能体模拟和科学发现等领域,并识别了各层级的失败模式与评估原则。其核心价值在于,当智能体从聊天机器人转向目标达成者时,瓶颈从语言转向环境,此框架为不同领域的研究者提供了设计和评估世界模型的共同语言。
构建自进化AI代理必须依赖可靠的评估体系,否则将浪费资源。@FutureAGI_ 开源其平台,整合了领先的评估工具与方法,为开发者提供完整基础设施。该平台涵盖幻觉、毒性、偏见等多维度可修改评估器,集成六种提示优化算法,支持多轮模拟测试与实时安全防护,并提供多语言追踪及兼容OpenAI的网关。其开源特性旨在建立可信任的评估基础,推动自进化AI代理领域发展。
尽管AI工具普及,PPT在商业场景中仍被视为重要的“面子工程”,其制作甚至成为获取大额合作的关键策略。有公司通过制作超过150页的详尽PPT来穷尽叙事、抬高合作金额,尽管实际执行可能仅为基础操作。不同公司对PPT的态度差异显著:字节跳动效仿亚马逊,内部禁止使用PPT以提升效率;百度内部则存在围绕古诗词、复杂动效的激烈内卷。这反映了PPT作为沟通与包装工具,在效率追求与形式主义之间的持续张力。
朋友分享了一个趣事 前国内最大的SEO公司之一,如何拿下大单? 一个关键的策略,就是把PPT做到极致 极致如何理解? 每个客户的PPT汇报页数,至少150页起…
网友利用GPT-image-2和Seedance 2.0等AI工具,创作出赛博朋克风格的《权力的游戏:2048》概念短片,将维斯特洛大陆重构为反乌托邦世界,其电影级质感可媲美HBO原作。这标志着AI技术正将曾属于好莱坞的顶级创作权下放给普通人,大幅降低了史诗级内容的制作门槛。同时,AI也成为有效的创收工具,例如通过特定平台批量生成“AI美女跳舞”类短视频,可凭借流量分成和商单实现低门槛副业盈利,目前该赛道仍处红利期。
很多人总说AI没用,我觉得那是因为你光刷不用,真正能赚钱的人早就闷声发大财了。 分享一个用 AI 做副业的路子, 有点野,基本上算零门槛,见钱快(`・ω・´)…
Google在Cloud Next 2026上首次将定制芯片拆分为专用架构,推出训练芯片TPU 8t与推理芯片TPU 8i。TPU 8t超级模块配备9600个液冷芯片,峰值算力达121 FP4 ExaFlops,较前代提升约3倍;TPU 8i的性价比提升80%,片上内存增至三倍,并通过新拓扑结构将网络延迟减半。Anthropic、Meta及OpenAI均已采购千兆瓦级TPU算力,其中OpenAI首次采用Google芯片,动摇了NVIDIA在前沿AI训练市场的垄断地位。两款芯片分别由Broadcom和MediaTek共同设计,TSMC代工。尽管NVIDIA仍占据81%的AI芯片市场份额,但实质性的竞争时代已拉开序幕。
PixVerse发布AI视频生成CLI工具,用户可通过一行命令快速生成视频,无需打开浏览器。该工具集成于Claude Code等平台,支持调用Sora 2、Veo 3.1、Grok Imagine等多种模型,并具备图片生视频、AI配音、唇形同步等网页版全部功能。安装简便,支持通过Telegram或飞书进行手机遥控操作。
开发者@patloeber分享了一套完全本地的Coding Agent方案,核心是Pi Agent框架与Gemma 4 26B A4B模型。Gemma 4因原生支持function calling和thinking mode,首次真正适合作为Agent;其MoE架构在质量与速度间取得平衡。Pi框架设计极简,仅提供read、write等四个核心工具以节省宝贵的上下文窗口。文中强调了上下文长度与显存的权衡,并给出安全警告:本地模型可能产生危险命令幻觉,建议至少安装permission-gate等扩展进行防护。
果然,发改委禁止了Meta对Manus的收购,看样子以后AI创业必然是国内国外选边站队了,要么全行业出海,要么专注国内。