Midjourney 创始人透露,团队因使用 TPU + JAX 训练、GPU + PyTorch 推理的混合技术栈,导致工具链断裂、调试困难,且无法利用开源社区丰富的 PyTorch 资源,严重拖慢了产品迭代速度。创始人反思,若重新开始会选择基于 NVIDIA 的统一方案。对比之下,其他文生图模型在功能上发展迅速,Midjourney 虽在风格艺术性上仍有优势,但在核心功能竞争上已显疲态。
作者通过亲身经历指出,AI正在成为像水电煤一样的基础服务,变得简单、普遍且不可或缺。一位70岁阿姨用ColaOS为公益组织轻松搭建了受欢迎的网站,而歌手胡彦斌也通过AI进行vibe coding开发了自己的应用。这些例子共同印证了作者的观点:AI的核心价值是放大人类意志,让技术门槛消失,使其融入各行各业与不同年龄层的日常创造力中,开启一个生产力普遍增强的时代。
在Google I/O 2026大会尾声,Google DeepMind首席执行官Demis Hassabis宣布,公司计划利用其AI平台重新构想药物发现流程,目标是“有朝一日解决所有疾病”。这一表态将AlphaFold与AlphaGenome等前沿AI科学项目,与解决人类最重大健康挑战的雄心联系起来,但同时也引发了关于技术预期与现实复杂性的广泛讨论。
This is a general-purpose LLM. It wasn't targeted at this problem or even at mathematics. Also, it's not a scaffold. We ...
If you are a mathematician, then you may want to make sure you are sitting down before reading further.
"We are only a few years away from AGI (...) we can start feeling it now. 2026,2027 is when it's starting." Demis Hassab...
Midjourney创始人暗示他们被Google的 TPU坑了 白白浪费了一年时间… 如果回到过去他会选择英伟达的GPU🤣 “这大概让我们的研究进度,比起一开始就完全采用 Nvidia 技术栈,落后了差不多一年。并不算特别理想。如果我能回到过去,我会从第一天开始就全部使用 Nvidia 的方案。”
@bubbleboi it probably put our research a year behind where it could have been if we were pure Nvidia stack, not totally...
Google I/O大会发布了Gemini 3.5 Flash和Gemini Spark。Gemini Spark是一个基于Gemini 3.5 Flash与Antigravity运行的个人AI代理,能原生连接Gmail、日历等Google应用。Antigravity是开源工具套件,包括桌面应用、CLI工具、Python SDK及VS Code分支IDE。Gemini Spark在Google Cloud运行,采用临时隔离虚拟机和安全网关保障企业数据安全。此外,开源的Gemini CLI将于6月18日后停服,由闭源的Antigravity CLI取代。
当前生成式AI的狂飙突进正引发深度审视,其潜在风险与社会反弹可能将该技术拖入类似“越南战争”的漫长泥潭。公众的担忧与抵制运动,正从数据隐私、内容真实性到伦理冲击等多方面施加压力,迫使行业进行根本性反思。这些反作用力虽可能延缓发展,却也可能成为校准方向的关键力量,推动技术在安全、透明和负责任的基础上重新定义进步。我们正身处一个充满挑战与不确定性的“有趣时代”。
New @latentspacepod Essay: why Agent Labs are clearly emerging in 2025 as a complement to Model Labs' all becoming AI Cl...
Google promised that Gemini Omni Flash would change the game, but when you put it side-by-side with Seedance 2.0... it's...
推荐QodoAI出品的播客《Agentic Review》,该节目以平衡的视角探讨AI代码生成的真实场景。通过主持人与Dexter Horthy、Scott Hanselman等嘉宾的深度对话,节目强调了上下文工程作为关键技术壁垒的重要性,并指出AI无法弥补破碎的开发流程,反而更凸显了代码审查与工程技艺的持续价值。核心观点认为,尽管编码方式可能变革,但软件开发生命周期的本质与严谨性将更加重要。节目避免了过度炒作或悲观论调,为AI工程师提供了有价值的实践参考。
阿里巴巴集团主席蔡崇信与CEO吴泳铭在致股东信中指出,集团AI业务已跨越初期投入阶段,正式进入商业化回报周期。在AI需求推动下,云智能集团上季度外部商业化收入增长达40%,其中AI相关收入占比30%。阿里正持续投入AI基础设施、自研芯片及基础模型研发,千问大模型近期迭代三版,最新Qwen3.7-Max专为智能体设计。同时,集团推出C端千问App与B端悟空平台,加速AI应用落地,致力于将“AI+云”打造为公司新的增长引擎。
we've been busy redesigning the desktop app from the ground up the beta taught us a lot most importantly, that left side...
Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative....
The most interesting fact here is that Andrej did not raise a few billion dollars to do what he'd supposedly be doing no...
在2026年谷歌开发者大会上,谷歌发布了新一代Android XR智能眼镜。谷歌安卓生态系统总裁萨米尔·萨马特总结认为,早期Google Glass项目未能普及的最大教训是外观时尚远比技术吸引力更重要。他指出,Meta与时尚品牌合作的智能眼镜自2023年面世以来销量已突破700万台,印证了这一观点。为此,谷歌此次携手Warby Parker和Gentle Monster等知名眼镜品牌,推出注重实用与颜值的纯语音版智能眼镜,预计今年秋季上市。搭载显示屏的版本则计划于明年推出,并将借助Gemini大模型承担核心功能。
getting some yeses getting some nos. have you run a Deep Research recently?
Larry Ellison says AI is now writing Oracle's Code. "We just tell the model what we want the program to do, and then the...
Take-Two首席执行官泽尔尼克重申,AI能有效加速游戏开发与素材生成,但无法独立创造出具有原创性和意外感的爆款大作。他以《GTA》系列为例指出,AI基于历史数据擅长模仿,而爆款游戏的核心是超越拼接的创意。泽尔尼克认为,AI工具的普及反而会抬高行业对内容规模与质量的门槛,带来更多而非更少的工作。
Google 每次都是想象力满分,产品力拉跨。就看看隔壁 Claude 和 Codex,抄都不屑于抄。 这一点倒是跟我很像😂 不管怎么样,还是再期待一次吧,毕竟之前也做过几个惊艳的产品。
the outcome of the Culture series is total human disempowerment - but the ship minds obfuscate that fact and let people ...
Honestly I'm still really impressed with the Codex app. It works reliably. It adds useful features consistently. It has ...
谷歌DeepMind CEO哈萨比斯近期强烈批评“AI取代开发者”的论调,指出这是重大错误且别有用心。他认为企业应利用AI将工程师生产力提升3-4倍所带来的能量去扩展业务规模、探索更多创新,而非进行裁员。在谷歌I/O大会期间,公司发布了编程能力强大的Gemini 3.5 Flash模型及编程工具Antigravity,并宣布更强大的Gemini 3.5 Pro将于下月推出。这一系列动作旨在表明,AI的核心价值在于增强人类生产力,而非替代工作。