AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 301 条
全部一手资讯X论文
标签「端侧」清除
歸藏(guizang.ai)@op7418 · 5月29日63

有了 Claude Code 和 Cursor 这种软件以后,真的不只是写代码厉害。 我之前拿到豆包手机以后,想给它装个谷歌框架,但一直在 Google Play 那有点问题,死活装不上。 今天突然想起来,打开让 Claude Code 帮我装。 打开 USB 调试模式后,它直接就帮我搞定了:自动下载安装包、自动安装、自动调试好 这个未来感觉很有用。

译推文指出,Claude Code、Cursor等AI编程工具的能力已超越代码编写。作者分享了一个实际用例:在手机安装谷歌框架遇到问题时,通过Claude Code自动完成了下载安装包、安装和调试的全过程,体现了这类工具在解决日常技术问题上的潜在实用价值。

小互@xiaohu · 5月29日65

苹果 iOS 27 曝光 Siri 将变成一个独立聊天 App,长得像 ChatGPT,还住进灵动岛 而且 苹果将允许Sir接入各种AI模型,包括ChatGPT、Gemini、Claude等 主角:Siri 大改造 交互方式变了,出现一个叫「Search or Ask(搜索或提问)」的新界面。 体验会更像聊天,你既能搜东西,也能直接像聊天一样问它问题。有分析说这其实有点像 iPhone 用了多年的 Spotlight 搜索,区别是它可能在任何 App 里都能调出来。

译苹果iOS 27或将对Siri进行大改造,将其转变为类似ChatGPT的独立聊天App,并可能整合进灵动岛。核心变化是允许Siri接入ChatGPT、Gemini、Claude等多种外部AI模型。交互界面将变为“Search or Ask(搜索或提问)”,体验更偏向对话式。

Berryxia.AI@berryxia · 5月28日58

Google直接把本地AI从“玩具”干成了真正的生产力武器。 他们刚刚发布最新一代Coral板,搭载Gemma系列模型,能在设备端实时完成: - 板载语音翻译 - 自然语言直接控制硬件 - 视觉+声音生成音乐 完全不需要云端,不需要联网,不需要把数据传出去。 以前大家总觉得本地AI“差点意思”,现在Google用硬件+模型的深度结合,直接把延迟、隐私、成本这些老大难问题一次性解决。 Coral板今年夏天就上线,这波操作等于把AI的战场从云端彻底拉回到了你手里的设备上。

译Google发布最新Coral开发板,搭载Gemma系列模型,实现高效的本地设备端AI。核心演示包括板载实时语音翻译、通过自然语言控制硬件,以及利用视觉与声音生成音乐。此次升级的关键在于无需云端联网,解决了传统本地AI在延迟、隐私和成本方面的痛点。通过硬件与模型的深度结合,Google将AI的应用场景从云端拉回设备本地,计划于今年夏天推出。

Rohan Paul@rohanpaul_ai · 5月27日40

Huawei's new breakthrough "LogicFolding". To close the gap with TSMC and Intel without relying only on smaller transistors, by making chip signals travel less distance. Their main ideas is that chip progress should now be measured by time saved, not just space shrunk. What they call "τ scaling" - changes the question from “how small is the transistor?” to “where is time being lost?” LogicFolding is Huawei’s physical answer to that question inside a chip. LogicFolding partitions digital, analog, and memory circuits across vertically stacked active tiers, so the chip behaves less like a city spread across a plain and more like a compact building with elevators between floors. Because chip delay is often not just the transistor switching time, but the resistance and capacitance of wires between logic gates. By folding critical paths upward into another active layer, the design can shorten wires, reduce parasitic delay, tighten clock skew, and raise frequency without changing the device node. So LogicFolding is not simply “3D chips” as a packaging. Its deeper idea is that topology has become a scaling tool. When lithography stops giving easy gains, the next improvement may come from rearranging where logic, memory, power, and communication physically live.

译华为推出“LogicFolding”芯片设计技术,旨在不依赖单纯缩小晶体管制程,以缩小与竞争对手的差距。其核心思想是通过垂直堆叠活跃电路层,将关键信号路径“折叠”向上,从而缩短导线长度、减少寄生延迟并收紧时钟偏差,最终在不改变器件节点的情况下提升芯片频率。此技术并非传统3D封装,其深层创新在于将芯片拓扑结构本身变为一种性能缩放工具。华为指出,该技术能大幅压缩相邻触发器间的传播时间,收紧关键路径。预计其高端芯片将在2031年实现等效于14 Å(1.4 nm)工艺的晶体管密度。

Berryxia.AI@berryxia · 5月27日62

还有个骚操作就是M芯片的mac电脑下载iOS客户端,直接在mac上使用。 不过使用的化要将电脑重启然后安全性降低,完整安全性的降低其安全策略,这个大家可以试试。

译PrismML推出官方iOS应用“Bonsai Studio”,允许用户在iPhone或iPad上完全本地运行Bonsai Image 4B图像生成模型。该模型基于FLUX.2 Klein,通过1-bit/3-bit量化将权重从7.75GB压缩至0.93GB。在iPhone 15 Pro及以上设备,生成一张512×512图片约占1.5GB内存,1024×1024约占2GB,全程离线推理,无需联网或支付token费用。应用免费,支持多种风格,可用于教学素材等轻量场景,但生成中文文字存在乱码。此外,M芯片的Mac电脑也可下载该iOS客户端使用,不过需要重启并降低设备安全策略。Android端暂无官方App,可通过网页版体验。

Berryxia.AI@berryxia · 5月27日72

iPhone 上直接用 App Store 下载就行: 👉 Bonsai Studio — PrismML 官方 iOS 应用,免费安装,模型在手机本地跑 我觉得给学校老师做一些素材展示,或者幼儿园小朋友教学还是可以的。 不需要额外的TOKEN费用,风格支持的挺多的。 中文文字还是乱码但是可以快速理解你的意境(图2) 技术背景: Bonsai Image 4B 基于 FLUX.2 Klein,把模型权重压缩成 1-bit/3-bit,体积从 7.75GB 压到 0.93GB iPhone 上生成一张 512×512 图约占 1.5GB 内存, 1024×1024 大概 2GB,iPhone 15 Pro 以上没问题 完全本地推理,不联网 就可以跑起来! Android 暂时没官方 App,只能走 WebGPU 网页版。 我实际在iPhone 17 Pro Max 测试了一下,出一张5125*512的画的速度不到几十秒就可以出来一张。 浏览器中需要下载1.8G 左右模型就可以玩~ 地址在评论区👇🏻

译PrismML发布官方iOS应用Bonsai Studio,用户可免费下载,在iPhone上本地离线运行其Bonsai Image 4B扩散模型。该模型基于FLUX.2 Klein,其1-bit压缩版仅0.93GB,比全精度版小8.3倍。在iPhone 15 Pro及以上机型生成512×512图像耗时约几十秒,内存占用约1.5GB。应用支持多种风格,但中文文字生成目前为乱码。Android用户可通过WebGPU网页版体验。

Berryxia.AI@berryxia · 5月27日56

我最近在Mac上折腾本地AI时,发现一个叫oMLX的项目一直在默默更新。 它的作者是个有全职工作的solo开发者。 刚刚发布了v0.3.11版本。 这个也是基于Apple MLX 框架来延展出来的框架,让端侧模型在Apple 设备提速。 过去几轮更新,他把稳定性当成了头等大事。 尤其是高内存压力下的表现,这次他希望大家再多测测。 他的初心其实很简单。 哪怕你昨天刚买了MacBook,也能立刻打开工具就用本地模型。 不用看文档,不用调参数,不用等半天。 整个流程像用原生App一样自然流畅。 甚至模型还在下载的时候,你已经能开始对话了。 在大家都在卷参数规模和推理速度的时候,他却把精力全放在了让普通人真正用得爽这件事上。 这可能是本地AI真正走向普及的最关键一步。 项目地址见评论区👇

译oMLX项目发布了v0.3.11版本,这是一个基于Apple MLX框架、旨在提升Apple设备端侧模型性能的项目。本次及前几轮更新均以在高内存压力下的稳定性为首要目标,开发者正呼吁用户对此进行更多测试。该项目由一位有全职工作的独立开发者维护,其核心目标是提供“开箱即用”的本地AI体验——让用户无需阅读文档或调整参数,甚至在模型下载过程中即可开始对话,从而降低本地AI的使用门槛。

Artificial Analysis@ArtificialAnlys · 5月27日67

OpenBMB has released MiniCPM5-1B (Non-reasoning), the leading 1B open weights model, scoring 17.9 on the Artificial Analysis Intelligence Index @OpenBMB is a China-based lab jointly founded in 2022 by Tsinghua University’s NLP Lab and ModelBest Inc. This release extends the open weights Pareto frontier for Intelligence vs. Parameters at the sub-2B scale. It sits almost 2 points ahead of the best-performing 2B open weights model, @Alibaba's Qwen3.5 2B (Reasoning, 16.3), and 7 points ahead of Qwen3.5 0.8B (Reasoning, 10.5). Unlike the recently released MiniCPM-V 4.6 1.3B Instruct, MiniCPM5-1B (Non-reasoning) does not support native multimodal input, and is text input and output only. Key results: ➤ MiniCPM5-1B scores 17.9 on the Artificial Analysis Intelligence Index, the highest of any open weights model at 1B parameters or below by 7.4 points. The next-most-intelligent open weights model at this scale is Qwen3.5 0.8B (Reasoning, 10.5). No other open weights model under 2B parameters has exceeded 15 on the Intelligence Index; its predecessor MiniCPM-V 4.6 1.3B sits at 12.7. ➤ MiniCPM5-1B extends the open weights Pareto frontier on both Intelligence vs. Total Parameters and Intelligence vs. Active Parameters at the sub-2B scale. It surpasses its predecessor MiniCPM-V 4.6 1.3B (12.7) by 5.3 points at ~23% fewer parameters, and beats Qwen3.5 2B (Reasoning, 16.3) by 1.6 points at less than half the parameter count. ➤ MiniCPM5-1B is more token-efficient than the larger reasoning peers it surpasses, but uses more output tokens than its (also non-reasoning) predecessor MiniCPM-V 4.6 1.3B. It used 12.6M output tokens to run the Intelligence Index, ~31x fewer than Qwen3.5 2B (Reasoning, 389M) and ~8x fewer than Qwen3.5 2B (Non-reasoning, 100M), but ~2.3x more than MiniCPM-V 4.6 1.3B's 5.4M. ➤ AA-Omniscience score of -1 is the highest in its size class, earned by abstaining rather than hallucinating. MiniCPM5-1B declines to answer the vast majority of AA-Omniscience questions, avoiding the hallucination penalty that pulls sub-2B peers down to the -70 to -89 range (Qwen3.5 0.8B Non-reasoning at -89, MiniCPM-V 4.6 1.3B at -85, Exaone 4.0 1.2B Non-reasoning at -83). Choosing to abstain rather than guess is the more honest posture, and AA-Omniscience credits it positively. Additional model details: ➤ Size: 1B total parameters (dense) ➤ Context window: 128K ➤ Modality: Text input and output only ➤ Precision: BF16 ➤ License: Apache 2.0 ➤ Providers: No confirmed providers upon release

译OpenBMB发布了MiniCPM5-1B(Non-reasoning),一款1B参数的稠密大语言模型。该模型在Artificial Analysis Intelligence Index上获得17.9分,成为1B及以下开源模型中得分最高者。其得分领先同规模模型Qwen3.5 0.8B(10.5分)和Qwen3.5 2B(16.3分),性能超越前代模型MiniCPM-V 4.6 1.3B(12.7分)。MiniCPM5-1B为纯文本模型,上下文窗口128K,采用Apache 2.0许可证。在AA-Omniscience测试中,其通过选择“拒绝回答”而非猜测,避免了模型幻觉惩罚,获得了同尺寸类别的最高分。

Berryxia.AI@berryxia · 5月27日71

兄弟们,端侧生图模型又有新东西了! 之前有客户端Drawthing 客户端也是支持iPad 手机进行文生图~ 今天PrismML也来了一个好玩的… 他们发布了1-bit和Ternary版本的Bonsai Image 4B扩散模型。 1-bit那版只有0.93GB,比全精度模型小8.3倍。 Ternary版1.21GB,用-1、0、+1的三元权重,在保持极致小巧的同时,把图像质量和提示词遵循度拉得更高。 两者在Mac M4 Pro上生成速度最高能快5.6倍。 更重要的是,质量上它跟那些大得多的模型打得有来有回。 对象构图、人像偏好、美学评分、复杂提示跟随,全都不落下风。 他们还同步上线了Bonsai Studio这个iOS App。 直接在iPhone上本地生成图像,不用订阅,不用调用API,彻底离线可用。 这套极致压缩技术,把以前只有云端才能玩的高质量图像生成,真正塞进了个人设备。 完了测试效果看看如何… 等我

译PrismML发布了Bonsai Image 4B扩散模型的1-bit和Ternary两个极致压缩版本。1-bit版本仅0.93GB,比全精度模型缩小8.3倍;Ternary版本为1.21GB,采用-1、0、+1三元权重。两者在Mac M4 Pro上的生成速度最高可提升5.6倍,且生成质量可与更大模型相媲美。同时,PrismML推出了配套的iOS应用Bonsai Studio,支持在iPhone上完全离线、本地生成图像。

X.PIN@thexpin · 5月26日67

Huawei plans to scale AI chips without smaller nodes. A new paper by Huawei's He Tingbo, "A Time Scaling Theory for Multi-Layer Electronic Systems," outlines how they'll advance Ascend AI chips as transistor shrinking slows down. Instead of next-gen lithography, Huawei will scale its Ascend SuperPoD line through ~2030 by packing mature tech across the 2025 910C, 2026 950, and 990: 🔹 Chiplets 🔹 2.5D fan-out packaging 🔹 3D stacking (via micro-bumps & hybrid bonding) Around 2030, Ascend 990 will debut LogicFolding in AI accelerators, aiming for a 100x integration leap by 2035.

译华为将不依赖更小制程节点,通过封装与架构创新来扩展其昇腾AI芯片。根据何庭波的论文,华为计划在2025年至2030年间,通过Chiplets、2.5D扇出封装和3D堆叠技术,推进其昇腾SuperPoD系列,具体产品包括2025年的910C、2026年的950及后续的990。约2030年,Ascend 990将引入LogicFolding技术,目标是到2035年实现100倍的集成度跃升。

Chubby♨️@kimmonismus · 5月26日79

Apple isn’t just adding Gemini to Siri. It is reportedly using a custom 1.2T-parameter Google model as the brain behind parts of the next Siri overhaul (Reuters). That is no small size. The question, therefore, is how Apple’s Gemini will perform and how fast it runs. In particular, simple queries are expected to run locally. Gemini 3.5 Flash is estimated to have around 300 billion parameters; Apple’s model will thus be significantly larger. However, the question also remains whether size actually pays off in this context. Apple’s model must deliver answers to everyday queries quickly-and be fast enough while doing so. Anyways, next months will be exciting in so many ways: -WWDC / Apple Intelligence with Gemini - GPT-5.6 - Sonnet4.8/Opus 4.8 (probably) -Gemini 3.5 pro (confirmed) Super hyped!

译据报道,苹果为改造下一代Siri,正使用一个定制版、参数规模达1.2T的Google大模型作为其核心,这显著大于预估约300B参数的Gemini 3.5 Flash。该模型将驱动Siri的部分功能,其中简单查询预期会在本地设备运行。苹果面临的关键挑战是确保该大模型能够足够快速地响应日常问题。此外,下个月AI领域预计将有多项重要发布,包括WWDC上的Apple Intelligence与Gemini整合、GPT-5.6、可能的Sonnet 4.8/Opus 4.8,以及已确认的Gemini 3.5 Pro。

Rohan Paul@rohanpaul_ai · 5月25日75

🇨🇳 Huawei just released breakthrough chip design approach "LogicFolding" that will close it's gap with TSMC. The technical paper behind it. The core idea is that chips should stop measuring progress mainly by how small transistors are and start measuring progress by how much time delay can be removed from the whole machine. A chip wastes time when signals move through long wires, memory paths, chip-to-chip links, and software communication layers, so Huawei calls this delay τ, or tau. Huawei’s paper introducing "LogicFolding" says the next chip breakthrough may come from cutting wasted time inside the machine. That is what "τ scaling" means. τ is the delay that accumulates before useful computing happens: a transistor switches, a signal crosses a wire, data reaches memory, a chip talks to another chip, or a server waits for a response. Moore’s Law reduced this delay indirectly because shrinking transistors also shortened many of the paths around them. But modern chips are no longer slowed only by transistor size. They are slowed by wire resistance, parasitic capacitance, clock skew, memory distance, protocol conversion, chip-to-chip communication, and the cost of moving data. So τ scaling changes the question from “how small is the transistor?” to “where is time being lost?” LogicFolding is Huawei’s physical answer to that question inside a chip. In a normal chip, related logic gates are spread across a flat surface, so signals often travel sideways through long metal routes before reaching the next important gate. Those wires behave like sticky pipes: resistance slows current, capacitance must be charged and discharged, and every extra distance creates delay and wastes energy. LogicFolding tries to stack active circuit layers vertically and connect them with very fine hybrid bonds, so circuits that need to talk are placed above and below each other instead of far apart on one plane. The signal now takes a shorter route, the critical path becomes faster, clock timing becomes cleaner, and the same manufacturing node can deliver more performance. Huawei is trying to win not by making every switch smaller, but by making every important signal travel less, wait less, and arrive sooner.

译华为提出了“τ缩放”和“LogicFolding”两种新方法,旨在不依赖最先进光刻工具的前提下,缩小与台积电的性能差距。其核心思想是将衡量芯片进步的指标从晶体管尺寸转向信号传输延迟(τ)。LogicFolding作为具体实现,通过垂直堆叠逻辑电路层并采用混合键合,将需要通信的电路紧邻放置,从而缩短关键线路、降低电阻和寄生电电容,提升信号速度。华为表示,其下一代麒麟手机芯片将是对τ缩放规律的首次全面测试。

X.PIN@thexpin · 5月25日58

More from Huawei's Tau Law talk—the slides spill the 2026 Kirin specs! 📈 Vs a traditional 2D-design chip, the new Kirin hits: 🔹 +53.5% Transistor Density (238 MTr/mm²) 🔹 +41% P-core Efficiency 🔹 +12.7% Peak Frequency → 3.1GHz (First Kirin to clear 3GHz) And the roadmap keeps climbing: by 2031, Huawei targets 400+ MTr/mm² density and a 5.0GHz clock. This is the LogicFolding architecture's first commercial outing—likely in the Mate 90 this fall.

译更多来自华为陶哲轩演讲的内容——幻灯片泄露了2026年麒麟芯片的规格!📈 与传统2D设计芯片相比,新款麒麟芯片实现了: 🔹 晶体管密度提升53.5%(238 MTr/mm²) 🔹 P核效率提升41% 🔹 峰值频率提升12.7% → 3.1GHz(首款突破3GHz的麒麟芯片) 路线图持续攀升:到2031年,华为目标是实现400+ MTr/mm²的密度和5.0GHz的时钟频率。这是LogicFolding架构的首次商用亮相——很可能搭载于今年秋季的Mate 90。

Chubby♨️@kimmonismus · 5月25日73

Chinas Huawei can't access EUV. So they wrote their own scaling law. The leverage of US export controls erodes. Huawei just presented the Tau (τ) Scaling Law at IEEE ISCAS, a framework that replaces geometric transistor scaling with time-based optimization across devices, circuits, chips, and systems. Huawei is not trying to win the nanometer race anymore. They're redefining it. 381 chips designed and mass-produced over six years. Kirin chips with their new LogicFolding architecture ship this fall. Target by 2031: transistor density equivalent to 1.4nm processes - without EUV (ASML embargo still hits hard) Whether Tau Scaling delivers on that promise remains to be seen. But it shows one thing: US export controls cut Huawei off from cutting-edge lithography, and instead of hitting a wall, they built a parallel road. China's semiconductor independence isn't hypothetical anymore. It's shipping in phones, running AI workloads, and now has its own scaling law presented at one of the world's top circuit design conferences. If Huawei can close the performance gap through architecture instead of lithography, the entire leverage of US export controls erodes. The sanctions were designed to keep China two generations behind. Huawei is trying to make that metric irrelevant. h/t @AndrewCurran_ for finding this interesting blogarticle and @zephyr_z9 for the photo

译华为在IEEE ISCAS上公布了Tau(τ)Scaling Law框架,通过时间维度优化替代传统的晶体管几何尺寸微缩。公司六年内设计量产了381款芯片,采用新LogicFolding架构的麒麟芯片将于今年秋季出货。其目标是到2031年,实现等效于1.4nm工艺的晶体管密度,而无需依赖受ASML禁运影响的EUV光刻技术。这一基于架构创新的路径若成功,将削弱美国出口管制的效力。

Rohan Paul@rohanpaul_ai · 5月25日67

🇨🇳 Huawei reveals a new chip design breakthrough under US sanctions pressure. A design approach meant to close the gap with TSMC and Intel without relying only on smaller transistors, by making chip signals travel less distance. They want 1.4nm-class density without owning the world’s best lithography tools i.e. they are trying to replace Moore’s Law with Tau Scaling Law. To note, Huawei has been blocked from normal access to TSMC since the US tightened foreign direct product rules around Huawei in 2020, and TSMC later said it had not supplied Huawei since mid-September 2020. Proposed τ Scaling as a new way to make chips faster when shrinking transistors is no longer delivering the same gains. Said its next Kirin phone chip will be the first full test of Tau Scaling Law, Old chip progress mostly came from making every transistor smaller, but Huawei’s idea shifts the target from smaller geometry to shorter signal delay, meaning less time wasted while electrical signals crawl through wires, gates, memory paths, and system links. LogicFolding attacks the circuit layout itself by folding logic blocks closer together, shortening critical wires, reducing resistance and parasitic capacitance, and letting signals switch faster with denser placement. So LogicFolding is the circuit-level piece: it tries to place related logic closer together, shorten key wires, cut electrical drag from resistance and parasitic capacitance, and raise performance without needing a full manufacturing-node leap. Huawei is also pushing the same timing idea across the full stack: transistors, circuits, chip architecture, software scheduling, and system interconnects all get tuned to reduce τ, the delay constant that limits speed and efficiency. The bold claim is that Huawei has already mass-produced 381 chips using this thinking, and future high-end chips could reach density comparable to 14Å, or 1.4nm, without relying only on classic process shrinkage. Says this path could reach 1.4nm-class, or 14Å-class, density by 2031, while TSMC and Intel target similar physical nodes around 2029. Huawei calls it Her’s Law, after He Tingbo, the chip leader who helped turn HiSilicon into Huawei’s survival engine after US export controls. --- huawei. com/en/news/2026/5/ieee-iscas-tau-scaling

译华为提出τ缩放定律,旨在不依赖更先进制程的情况下,通过LogicFolding技术折叠逻辑模块、缩短信号传输距离来提升芯片性能与密度。华为称已量产采用此思路的381颗芯片,并计划于2031年实现等效1.4nm(14Å)密度,该定律以海思负责人何庭波命名。同样,华为在存储领域也展示了类似的“侧向创新”路径,其通过改变封装方式(Die-on-Board)而非追求最先进的NAND层数,推出了容量达122.88TB的AI SSD。

Rohan Paul@rohanpaul_ai · 5月24日51

Somebody just ran one trillion param model (Kimi K2.5) on a single RTX 3060 12GB GPU at over 4 tokens/sec and 768GB of second-hand Intel Optane memory. What happened is that a sparse model met an unusual memory tier that could hold its enormous body while the GPU handled the most time-sensitive organs. i.e. the bulk of the sparse expert weights live in a larger, cheaper memory tier and are pulled into the computation as needed. This worked because Kimi K2.5 is a Mixture-of-Experts model, so it has 1T total parameters but activates only 32B per token. The RTX 3060’s 12GB VRAM holds latency-sensitive parts like routing, attention, dense layers, and shared experts. The huge expert weights sit in Optane PMem, configured as RAM, while 192GB DDR4 ECC acts as cache. He is using 6 Optane PMem (DCPMM) sticks. This retired memory format was made to bridge DRAM and SSD performance. The 768GB Optane configuration, using 6x128GB modules, does beat the best NVMe SSDs on latency by a wide margin, but remains 2x to 3x slower than DRAM. llama.cpp handled hybrid GPU/CPU inference, with tensor placement tuned through flags like override-tensor. The result was roughly 4 tokens/sec, which is slow for chat but impressive for a local 1T-parameter model on cheap retired enterprise hardware. The DDR4 acted as cache, the Optane acted as a giant memory pool, and llama.cpp pushed routing and other critical tensors onto the 12GB GPU.

译近期有技术爱好者成功在单张二手RTX 3060 12GB显卡上,运行了拥有1万亿参数的Kimi K2.5大语言模型,速度约为每秒4个token。这一成果得益于模型的混合专家架构,虽然总参数量巨大,但每次推理仅激活32B参数。实现的关键在于将延迟敏感的核心组件置于GPU显存,而将庞大的专家权重存储在由二手英特尔傲腾持久内存(PMem)构成的768GB大容量内存池中,并以DDR4内存作为缓存。通过llama.cpp工具进行混合调度,该方案为本地部署超大规模模型提供了一条低成本的技术路径。

歸藏(guizang.ai)@op7418 · 5月23日39

M5 Stack 新出的 Paper Color 彩色墨水屏也做了适配

Rohan Paul@rohanpaul_ai · 5月23日64

New Google paper shows that wearable data becomes far more useful when AI learns the person behind the signals. It's is not another heart-rate algorithm, but a general model trained on more than one trillion minutes of sensor data from five million people. The authors propose SensorFM, a foundation model trained on more than 1 trillion minutes of unlabeled wearable data from 5 million people, so it can learn general patterns of human physiology before seeing specific health tasks. That scale changes the problem from measuring isolated events to learning patterns of lived physiology: sleep, movement, temperature, oxygen, heart rhythms, and their ordinary daily messiness. Wearables are not weak because they lack data; they are weak because most systems compress that data into crude summaries before the meaningful structure has a chance to appear. SensorFM tries to learn that structure first, then reuse it across tasks, which is why the same representation can help with cardiovascular, metabolic, mental health, sleep, lifestyle, and demographic predictions. The evidence is strongest as a scaling story: larger models trained on more data performed better, and the learned embeddings beat engineered-feature baselines on 34 of 35 prediction tasks. ---- Paper Link – arxiv. org/abs/2511.15352v3 Paper Title: "People readily follow personal advice from AI but it does not improve their well-being"

译谷歌研究院提出基础模型SensorFM,通过学习超过500万人产生的逾1万亿分钟可穿戴设备传感器数据,掌握了人类生理活动的一般性模式。该模型超越了将数据压缩为简单指标的传统方法,能够从数据中提取出有意义的结构并将其复用于多种健康预测任务。实验显示,模型规模和数据量越大性能越强,且其学习到的数据表征在35项预测任务中的34项上,均优于基于工程特征的基线方法。

向阳乔木@vista8 · 5月22日36

在AJ安利下,歸藏买了安克 AI 录音豆。 在歸藏安利下,我也买了。 初步体验,这是目前个人最喜欢、最实用的 AI 硬件产品。 就是绳子带着不舒服,打算淘宝换个。

Rohan Paul@rohanpaul_ai · 5月22日75

BitCPM-CANN just became the world’s first open-sourced 1.58-bit ternary LLM trained entirely on Chinese-developed AI infrastructure. Developed by ModelBest, Tsinghua Univ, and OpenBMB community, the entire training pipeline, from quantization operators and algorithms to the full-stack framework, was natively executed on Huawei Ascend 910B NPUs. 1.58-bit ternary weights use only 3 weight states, so the model needs far less memory when deployed on phones, PCs, cars, and local industrial devices. The harder achievement is the training system behind it: QAT, STE, low-bit operators, algorithms, framework work, and reproducible training scripts all had to hold together on Ascend 910B. When hardware costs rise, the winning model is not merely the one that scores higher in a chart, but the one that can be trained, reproduced, deployed, and improved under real constraints.

译ModelBest、清华大学与OpenBMB社区联合发布了BitCPM-CANN,这是全球首个完全基于华为昇腾910B NPU训练的开源1.58比特三元大模型。其核心创新在于采用仅含三种权重状态的极低比特量化技术,使模型内存占用相比BF16降低约6倍,可高效部署于手机、电脑、车载设备等边缘端。更关键的是,整个训练全栈(从量化算子到框架)均在昇腾上原生构建与验证,而非简单移植。该模型家族(0.5B-8B)在多项基准测试上保持了全精度模型95-97%的性能,为资源受限环境下部署和复现大模型提供了可落地的解决方案。

Rohan Paul@rohanpaul_ai · 5月22日32

Edge AI runs on each insect backpack, enabling low-latency coordination, secure data exchange, formation control as a group and task execution. Swarm Biotactics scales by breeding insects and has raised ~€13M.

译边缘AI运行在每只昆虫的背包上,实现低延迟协调、安全数据交换、群体编队控制和任务执行。 Swarm Biotactics通过培育昆虫实现规模化,已融资约1300万欧元。

歸藏(guizang.ai)@op7418 · 5月22日73

http://x.com/i/article/2057775296712196096 # 开源一个 Skill,让 AI 接管你屏幕边那张便签纸 上个月我做了 M5 Paper Buddy,把一块墨水屏接到 Claude Code 上,监控 AI 在干什么、需要审批什么。 当时挺兴奋的,物理按键审批操作那个仪式感很好。 但用了几周之后我发现,它放在桌上的时间,远比我看它的时间长。 AI 跑得稳的时候根本不需要监控,需要审批的时候我大概率人就在电脑前。它解决的是一个边缘问题。 ## 真正的场景藏在屏幕边框上 后来我注意到一个很普遍的现象:很多人会在屏幕边框上贴便签纸,甚至有很多这种便签纸在卖。 写着今天要做什么、几点开会、某个项目的下一步动作。 便签纸的存在不是因为它好用,而是因为人需要"抬头就能看见"的提醒,不想为了看一眼日历切窗口、解锁手机。 但便签能记的东西非常有限,写完就静止了。 日程变了,便签不会变。任务做完,便签还在那。它是一个被时间冻住的物件。 而现在,我们手边有了 AI。它有 Memory,有 Agent,能读我的日历、看我的 GitHub、跟我对话。 如果让 AI 来决定屏幕边框上应该贴什么、什么时候撕掉、什么时候换新的,那就是另一个东西了。 这就是 AI Desk Card Skill 想做的事。 形态上是一块 4.7 寸的墨水屏,带磁吸(类似 MagSafe),可以直接贴在显示器旁边。 背后是一个 Skill —— 装到 Claude Code 或者 Codex 这类 AI Agent 里,AI 接管所有事: 决定推什么、什么时候推、息屏时显示什么。 Github:https://github.com/op7418/ai-desk-card 下面我把它实际怎么用、能解决什么问题讲清楚。 ## 案例一:日程和待办自己会更新 我把 top-left 槽位设成日历,middle 槽位设成 todo。 早上坐到电脑前,屏上已经是当天的完整安排:上午的会、下午健身、晚上要交的稿子。 这些数据来自飞书日历,AI Agent 通过飞书 CLI 直接读取。 下午跟一个朋友约了周四的咖啡。 我跟 AI 说"周四下午加一个咖啡,3 点",AI 一边把日程写进飞书日历,一边把屏上的卡片刷新了一下。 新的日程出现在 todo 槽位里。 更舒服的是反向同步。我做完 AIGC Weekly 的初稿,跟 AI 说"周刊写完了",屏上对应的那一行就被划掉了。 便签纸做不到这件事。便签纸只能记录某个瞬间的快照,而日程的本质是一个不断变化的状态流。 当显示设备和你的 Memory 联通之后他会直接展示你和你的上下文当下的状态。 ## 案例二:息屏的时候,它是你的名片 这是我做完之后最喜欢的一个功能。 墨水屏有个物理特性:断电之后画面会保留。 我专门为这个特性加了一个 Quiet Hours 模式 —— 到了晚上 11 点,或者你长按"睡眠"按钮,屏幕会自动切换到一张电子名片,然后进入深度休眠。 名片上是你的头像、介绍、二维码。整张屏黑白分明,墨水屏特有的纸质感。 这块屏从那一刻起就完全不耗电了,但画面一直在。 它带磁吸,从显示器边上摘下来揣进包里,重量很轻。 下次跟新朋友吃饭,从包里掏出来递过去:黑白名片 + 二维码,加完好友放回口袋。 整个过程没有插电、没有开机、没有打开 App 翻二维码的尴尬。 而早上你坐到桌前,它又会被 AI 唤醒,自动切回工作模式 —— 日程、todo、PR 队列回来了。 墨水屏的限制(不发光、刷新慢、断电保留)在大多数场景下都是缺点,但当你不去硬刚这些限制,反而顺着它去设计场景,会发现它有些屏幕做不到的事。 ## 案例三:GitHub 的动态我不再错过了 我维护 CodePilot 这种开源项目,最大的负担是看不见 — 不打开 GitHub 就不知道有没有新 PR、新 Issue。 但每隔十分钟打开一次 GitHub 是非常糟糕的工作节奏,注意力会被切碎。 现在 AI Desk Card 的 bottom 槽位常驻一个 pr-queue widget。 CodePilot 仓库有新 PR、有人在 Issue 里 at 我、CI 挂了,AI 都会把它推上去。 数字小不打扰,但抬头扫一眼就知道有没有要处理的事。等我手头这段写完,再统一去看。 更进一步的玩法是,AI 知道我在做什么。 我现在专注写 AIGC Weekly 的时候,它会自动把 PR 队列降级,只在出现 critical 标签的 Issue 时才推上来。 等我切到 CodePilot 的开发,PR 队列又会回到主位。 屏幕上显示什么,本质上是一个调度问题,不是一个配置问题。 传统 dashboard 让你配 widget,配完一周内还行,之后就变成一面没人看的墙。 AI 主动决策是因为它知道你正在做什么、它能换。 ## 案例四:天气、休息、所有那些"该有但你想不起来配"的东西 最让我自己意外的一类 widget 是 break-reminder。 我经常一坐就是三四个小时不动。 这个 widget 会在一段时间没有按键活动之后,在某个槽位上轻轻推一句"该起来走走了"。 墨水屏不发光,不会弹窗、不会响、不会震动,但你抬头看到一行字,自然会停一下。 它和番茄钟最大的区别是:没有强制性。它只是存在,不打扰你。 如果你正在跑代码、写文章的状态里,那一行字会被你忽略; 如果你已经累了、状态浮的时候,看到那行字会真的去倒杯水。 天气也是一样。 我不会专门去查今天会不会下雨,但顶部 widget 静静显示"下午有雨"几个字之后,下楼前我会把雨伞拿上。 这种"低优先级但有用"的信息,过去只能靠你自己记得去查,现在它们待在视野边缘,需要的时候被你扫到。 ## 它是怎么装上的:AI 全程引导 整个安装流程没有 App,没有蓝牙配对页面,没有手机扫码。你跟 AI 说: > "帮我把 ai-desk-card 装上:https://github.com/op7418/ai-desk-card" 接下来发生的事: 1. AI 检测你电脑上有没有 PlatformIO,没装就自动装 1. 检测你有没有插 USB,没插就提示你插 1. 自动编译固件、烧录到 M5Paper,1 分钟左右 1. 问你 Wi-Fi 密码,写进设备 1. 问你"想看哪些卡片、多久刷一次" 1. 推第一个 widget 上去 整个过程你只回答 Wi-Fi 密码和"想看什么"两个问题。 之后设置定时任务也是一句话:"让卡片每 30 分钟刷新天气和未读邮件,工作日 8 点到 22 点。" AI 自己去写 cron、自己去注册 loop、自己去调度。 定时任务跑的时候,AI 会读取你的 Memory 来决定推什么内容。 比如我让它每天早上 9 点更新一次,它会去看我 Memory 里最近活跃的项目(CodePilot、AIGC Weekly等),按重要度安排槽位。 这里没有"App 工程师做的设置页面",因为 AI 就是设置页面。 你过去要点十下才能调好的设置,现在一句话就行。 ## 一个跟传统硬件相反的设计:组件预置,AI 只填数据 讲到这里需要单独说一下实现思路,这是 AI Desk Card 跟传统 IoT 设备最大的不同。 通常做一个智能硬件,组件是写死在固件里的: 时钟样式、天气图标、字体大小,都是固件工程师在出厂前定好的。要加新功能,要发新固件 / OTA / 重新认证一遍。这是为什么 99% 的智能硬件买回来三个月就跟刚拆封时长得一样。 AI Desk Card 走的是反方向:16 种 widget 模板预置在服务端,AI Agent 只负责往里面塞 JSON 数据。 举个例子,pr-queue 这个 widget 的视觉布局(一个标题区、4 行 PR 信息、每行带状态图标)是渲染端写好的。 AI 不需要画图、不需要排版、不需要选字号。它只要往 daemon 发一个这样的请求: 服务端用 Python + Pillow 把这个 JSON 渲染成一张 540×280 的像素图,推到墨水屏上。 这个思路其实来自我们在 CodePilot 桌面端做的生成式 UI。 那边走的是相反的极端:模型实时生成 HTML/SVG,渲染成可交互的 widget。 两个方向看起来截然相反,但精神是一致的 —— UI 由 AI 决策,不由用户配置。 为什么墨水屏要反着来?因为约束不一样。 浏览器能跑任意代码、有强大的字体引擎、可以加载 CDN,所以让 AI 生成 UI 本身没问题。 墨水屏渲染受限,全屏 GC16 刷新要 2 秒、中文字体一套就要几兆、像素精度不能算错,AI 直接生成 UI 太重了。 所以反过来:UI 提前准备好,AI 只决定填什么、放哪个槽位、什么时候换。 这个组件库还在不断扩。硬件本身基本不变,能力却在持续生长。 ## 写在最后:AI Agent 把硬件从内置功能里解放了出来 聊点更大的事。 传统硬件公司的护城河是 "我设备里能做什么"。 CPU、传感器、操作系统、内置 App,决定了它的能力上限。一旦造好出厂,能力就基本封顶。 AI Desk Card 这种思路下,硬件的能力来源被换掉了。 它本身只是一块墨水屏 + ESP32,能做什么取决于 AI Agent 能拿到什么信息。 日历来自飞书 CLI、PR 来自 GitHub CLI、天气来自任意 API、Memory 来自你的 Obsidian 仓库 —— 这些信息源全都在 Agent 那边,不在硬件里。 当 AI Agent 成为信息中枢之后,硬件可以做得很薄、很专用。 它不需要内置一百个功能,只需要做好一件事 —— 在 AI 决定推送的时候,把内容显示出来。 这件事的成本也降到了很低的水平。M5Paper V1.1 大概 600 块,未来类似的开源开发板会更便宜,三四百块就能买到。墨水屏、彩色墨水屏、TFT 小屏、甚至 Kindle、墨水屏阅读器,理论上都可以适配同一套 Skill。 后面我还想做几件事: - 适配 M5Paper S3 和 Inkplate / Waveshare 等其他墨水屏开发板 - 尝试给老 Kindle 写一个适配层,把闲置的阅读器变成桌面副屏 - 跟 Home Assistant 联动,把智能家居状态推到桌面卡上 —— 客厅温度、门锁状态、扫地机器人位置 - 探索彩色墨水屏的可能性,开放更多 widget 类型 每多支持一种硬件,就多一种 AI 触达物理世界的方式。这些设备不需要变聪明,它们只是 AI Agent 的物理出口。 真正在变聪明的是你桌上那个 AI,而它聪明的速度,比硬件迭代快得多。 GitHub:https://github.com/op7418/ai-desk-card 如果你觉得这次的内容对你有帮助,可以帮我点个赞或者转发给需要的朋友。

译AI Desk Card 是一款 4.7 寸磁吸墨水屏,结合 AI Agent(如 Claude Code),通过预置模板与数据填充,动态显示日历、待办、GitHub PR 队列、天气等内容。它解决了传统便签纸的静态限制,实现内容自适应和场景切换(如夜间变为电子名片)。核心理念是将硬件从固定功能中解放,使显示能力由 AI 可获取的信息动态定义,从而提升效率并减少手动配置。

歸藏(guizang.ai)@op7418 · 5月22日15

哈哈,新设备来了,这玩意有麦克风和扬声器,那可玩性可就强多了! 最近疯狂在 M5 Stack 家消费,他家出个新的就断货

译一款集成麦克风与扬声器的新设备发布,大幅提升了可玩性与应用潜力。作者近期持续购入M5 Stack产品,但该公司新品常迅速售罄。结合引用信息,该设备可能支持语音交互、音频处理等功能,为开发者提供了更丰富的创作空间。

PixVerse@PixVerse_ · 5月22日63

Create Image is live in PixVerse App Prompt or reference in, generate on your phone. 3 free generations for everyone, May 24–31, 11:00 UTC. RT +Follow +Reply = 300 Creds (72H Only)

译Create Image已在PixVerse App上线。 输入提示词或参考图,在手机上即可生成。 5月24日至31日11:00 UTC,每人可免费生成3次。 转发+关注+回复 = 300 Creds(仅限72小时)

歸藏(guizang.ai)@op7418 · 5月22日57

完全体

译探讨了墨水屏硬件作为低功耗副屏的创新应用场景。设备开机时,可作为AI信息显示终端,自动接收并展示待办事项、日历等推送信息,便于用户快速查阅;关机后则转变为电子名片,利用墨水屏的静态显示特性方便线下社交扫码。该方案通过“磁吸”方式灵活部署,旨在将硬件功能打包为可复用的技能模块。

Berryxia.AI@berryxia · 5月22日60

卧槽,兄弟们你敢信? 现在可以本地Mac电脑就可以跑音乐模型! 这一刻苹果的本地的统一内存架构又发挥了它的优势,早买早享受😎 Stable Audio 3 官方版刚出,直接整了个狠货: 59x realtime 在 M5 Pro 上跑,MacBook Pro 直接起飞。 最离谱的是: - LoRA 微调不到 1 小时就能搞定 - Sm 模式更快,Medium 模式更高质量 - 一行命令直接装(MLX 优化版) curl -LsSf https://raw.githubusercontent.com/Stability-AI/stable-audio-3/main/optimized/mlx/bootstrap.sh | bash 这已经不是“云端试试水”了,而是真正在本地就能高强度玩音乐生成的工具。 想快速出 demo?想自己训风格?想在飞机上继续作曲?现在基本都能做了。 而且他们直接说“break it plz”,明显是想让社区狠狠折腾。 整起来~

译Stable Audio 3官方正式发布,并提供了针对苹果MLX框架的优化版本,使得强大的音乐生成模型能够直接在本地Mac电脑上高效运行。其核心亮点在于在M5 Pro芯片上可实现59倍实时生成速度,性能表现突出。此外,该工具支持在不到1小时内完成LoRA微调,并提供快速(Sm)与高质量(Medium)两种生成模式。开发者鼓励社区积极探索其潜力,标志着本地化音乐创作工具达到了新高度。

小互@xiaohu · 5月22日61

Codex 推出 Locked Use(锁屏使用)功能 可以在你的 Mac 锁屏之后操作你的电脑继续干活 你也可以通过手机远程给Codex下达任务,它在锁屏状态下依旧能工作... 用的是苹果官方 Authorization Plug-in 机制,临时解锁 Mac,干完该干的事,自动再锁上。 而且全程屏幕依旧是黑的,处于保护状态... 四层安全设计: 🛡️ 授权窗口极短,只针对单次解锁尝试 🛡️ 自动解锁只在 Codex 主动操作期间可用 🛡️ 解锁期间 Codex 会遮住所有显示器,旁人看不到屏幕在干什么 🛡️ 一旦检测到本地键盘鼠标输入,立即重新锁屏 给你办公室的电脑装codex后,你回家躺在床上,老板临时有需求来,你依然能通过手机操控你的电脑干活,或者提取电脑里的文件等等。

译Codex 新增“锁屏使用”功能,允许用户在 Mac 锁屏状态下,通过手机远程下发指令,让电脑继续执行任务。该功能基于苹果官方授权机制临时解锁,操作全程屏幕保持黑屏以保护隐私,并具备四层安全设计,如短时授权、检测到本地操作即刻重锁,确保了远程操作的安全性与便利性。

Tencent Hy@TencentHunyuan · 5月21日74

🚀 Introduce Hy-MT2: New Open-Source Multilingual Translation Model We proudly launch our new Hy-MT2 translation model and the Tencent Hy Translation mini-program! Hy-MT2 is a powerful multilingual model supporting seamless translation across 33 languages — and it's fully open-source! It's 7B and 30B-A3B models achieve state-of-the-art performance among all open-source models on various translation tasks, surpassing models with dozens of times more parameters. The lightweight 1.8B model even outperforms mainstream commercial APIs like Microsoft and so on. Powered by Tencent AngelSlim 1.25-bit extreme quantization, it needs just 440MB storage and enables effortless local inference on mainstream mobile chips — with 1.5x faster speed vs. Hy-MT1.5. Open-source AI translation just got way smarter, faster, and more accessible! 🌏 Project Page: https://aistudio.tencent.com/llm/zh?tabIndex=0 Hugging Face: https://huggingface.co/collections/tencent/hy-mt2 Modelscope: https://modelscope.cn/collections/Tencent-Hunyuan/Hy-MT2 Github: https://github.com/Tencent-Hunyuan/Hy-MT2

译腾讯正式开源Hy-MT2多语言翻译模型,支持33种语言间的无缝互译。其7B与30B-A3B版本在开源模型中达到最先进的翻译性能,超越了许多参数规模大数十倍的模型。更具突破性的是,1.8B轻量级版本性能超越微软等主流商业API,并凭借腾讯AngelSlim 1.25-bit极量化技术,仅需440MB存储空间,即可在主流手机芯片上本地运行,推理速度较前代提升1.5倍,显著降低了高质量AI翻译的部署门槛。

Berryxia.AI@berryxia · 5月21日35

AI&硬件的结合玩起来会很好,有点像当年的安卓刚出来的时期,大家都可以自定义ROM包刷机的感觉。

译主推文认为,AI与硬件的结合将带来类似安卓早期自定义ROM的创造性体验。具体案例展示了一种墨水屏硬件的设想:设备运行时,AI可推送待办、日历等动态信息供实时查看;关机后则利用墨水屏特性常显个人名片,便于社交。该方案将功能模块化打包为Skills,分享给社区,体现了AI赋能传统硬件、实现个性化场景应用的潜力。

歸藏(guizang.ai)@op7418 · 5月21日40

用了几天 Mac 版豆包输入法,已经离不开了。 准确性、中英文混合输入、专业名词的识别,响应速度,都是市面上最顶的。 我现在手机上已经离不开豆包输入法了,一直在等待桌面端上线。前几天发现 MacOS 版终于来了,赶紧下载试了一下。 我觉得表现最好的就是多语言混合输入。 我日常会涉及到非常多中英文混合输入的场景,因为我们这个行业很多词没有翻译,比如说 Claude Code、AntiGravity、Perplexity,这种词和中文混合的时候,就非常难以去润色和识别。 豆包在这方面处理得巨好。 之前我用其他语音输入法,它主要有两个问题: 首先是过度优化: 它有时候改动非常大,比如在跟朋友聊天时,它会突然给一段非常正式的 Markdown 格式,让人很难接受。而且它还会批量自动添加无序列表和有序列表,修改起来非常麻烦。 然后是无法实时预览: 必须等全部说完、润色完,才会给出一整段结果。当你一次说五六百字时,很难审查其中的细节。如果其中有一两个词识别错了,很难在润色后的长文本里精准找到并修改,导致很多时候错误的信息就直接发出去了。 相比之下,豆包输入法在这两点上效果非常好: 它会实时出结果,生成完成后还会再润色一遍,这样你能清晰地看到输出文案及其对应的变化。 它不会乱加 Markdown 格式或列表,用起来很省心。 此外,豆包的识别速度极快,基本上是“言出法随”,说完立刻就能吐字,润色也很快。我现在手机上已经离不开它了,这下电脑端上线也必须得用了。 期待豆包输入法后续的版本能够支持自定义提示词润色。比如在一些特定的、独特的场景下,通过自定义提示词让它生成对应的格式,这个功能还是挺需要的。 但总的来说,从识别本身的硬功夫来看,豆包已经做得无可挑剔了。

译豆包输入法Mac版上线后,用户试用体验极佳,称其在准确性、中英文混合输入、专业名词识别和响应速度方面均为市面顶尖。与其他输入法相比,它解决了过度优化和无法实时预览的痛点,实现“言出法随”的快速输出与实时润色,避免乱加Markdown格式。对于如Claude Code、AntiGravity、Perplexity等专业术语与中文混合的场景,豆包输入法处理出色,用户已完全依赖其手机和电脑端。未来期待支持自定义提示词润色功能,但目前识别能力已无可挑剔。

歸藏(guizang.ai)@op7418 · 5月20日63

终于找到了这种墨水屏硬件最适合的场景: 开机的时候,让 AI 往里边推一个 To-do、日历,一些基础的需要记的信息 把它挂在屏幕边上(用磁吸) 关机的时候,利用墨水屏的特性让它显示名片,这样大家加好友什么的直接看就行 太实用了! 到时候打包成 Skills。有类似硬件的朋友到时候可以玩玩。

译墨水屏硬件可通过AI推送日历、待办事项等基础信息,利用磁吸设计便捷固定。关机时,借助墨水屏的常显特性可切换为电子名片,简化社交场合的加好友流程。该方案将打包为Skills分享,为同类硬件用户提供实用参考。

X.PIN@thexpin · 5月20日57

Russia is looking to source Chinese chips to train its GigaChat AI. The news was announced during Putin's recent visit to Beijing. Sberbank's CEO confirmed that the company is eyeing Huawei's Ascend 950, the most advanced Chinese-made AI chip despite it trailing behind Nvidia's H200.

译俄罗斯正寻求采购中国芯片以训练其GigaChat AI。该消息于普京近期访华期间宣布。俄罗斯联邦储蓄银行CEO确认,公司正关注华为的昇腾950,这是目前最先进的中国产AI芯片,尽管其性能仍落后于英伟达的H200。

Rohan Paul@rohanpaul_ai · 5月20日49

Google's Android XR glasses demo showed real-time visual capture via the glasses' camera feeding into Gemini. The AI edited the image per voice instructions, with the result pushed directly to the paired smartwatch for viewing.

译谷歌的Android XR眼镜演示展示了通过眼镜摄像头进行实时视觉捕捉,并将画面输入Gemini。AI根据语音指令编辑图像,结果直接推送到配对的智能手表上查看。

小互@xiaohu · 5月20日60

Google 智能眼镜 展示 让你"不用掏手机"就能完成日常的事情 让 Gemini 帮你 点咖啡,手机放兜里,眼镜只在最后一步确认时提示即可

凡人小北@frxiaobei · 5月19日59

Google 每次都是想象力满分,产品力拉跨。就看看隔壁 Claude 和 Codex,抄都不屑于抄。 这一点倒是跟我很像😂 不管怎么样,还是再期待一次吧,毕竟之前也做过几个惊艳的产品。

译本次更新亮点在于展现了“操作系统级感知力”的交互新方向。其核心优势并非单一模型,而是Gmail、Drive等服务的深度生态整合,这为重度用户构建了高迁移成本的壁垒。桌面端AI竞争已进入新阶段,谁先实现顺畅的系统级感知体验,谁将占据先机。

🚨 AI News | TestingCatalog@testingcatalog · 5月19日50

GOOGLE 🔥: A new AI Studio mobile app is now available on Google Play for pre-registration! > "Your next big idea is just a conversation away. Inspiration doesn't wait for you to be at your desk. It strikes on the couch, on the bus, or in the middle of the night. With Google AI Studio, you finally have a way to capture that spark and turn it into something real—right from your phone." > "Whether you want to create a custom tool for your business, a personalized game for your friends, or a new way to track your goals, Google AI Studio makes building as easy as describing what you want." APKPLZ 👀

译Google宣布推出AI Studio移动应用,现已在Google Play开启预注册。该应用旨在让用户随时随地将灵感快速转化为实际应用,支持通过自然语言描述来构建个性化工具、游戏或目标追踪系统等,大幅降低AI开发的门槛。移动化设计强调即时捕捉创意,无需受限于电脑前的场景,提升创作与开发的灵活性。

AYi@AYi_AInotes · 5月19日66

为啥昨天发的这颗葡萄在X上炸锅了?一天跑了4800赞,280万浏览, 先说结论,炸锅倒不是因为它有多好看,主要是因为它把3DGS的最难考卷做成了满分答案。 用了6660张宏观照片,43万个高斯点,模型压到50MB以下,手机能实时旋转,半透明果肉里的光都还原了, 讲真,这种半透明物体一直是3DGS的噩梦,但他偏偏选了最难的那个来打样, 接下来我们来拆两件事: 1️⃣3DGS为什么在这个赛道把NeRF甩开了, 2️⃣它还有哪些硬伤没解决 👇

译一颗葡萄的3D模型在社交平台X上引发热议,一天内获4800赞和280万浏览。其核心在于利用3DGS技术成功攻克了半透明物体重建的公认难题。项目使用6660张宏观照片训练,生成仅43万高斯点,压缩后模型小于50MB,实现了在手机端实时360度旋转和光影还原。这一突破验证了“最难案例跑通,则更简单物体皆可数字化”的逻辑,展示了从专业扫描仪和建模团队降维到个人相机加自动训练的低成本、高效率新流程,为手办、珠宝、文物等领域的数字资产化指明了方向,开发者正通过工具miqula将此流程产品化。

DogeDesigner@cb_doge · 5月19日44

Elon Musk met with NVIDIA’s Ian Buck, who gave him the new Vera CPU for SpaceXAI.

译埃隆·马斯克会见了英伟达的伊恩·巴克,后者向他赠送了用于SpaceXAI的新款Vera CPU。

Rohan Paul@rohanpaul_ai · 5月17日61

So much possibilities for on-device small models. Here @adrgrondin is running Google’s Gemma 4 E2B on iPhone 17 Pro. ~40tk/s with MLX optimized for Apple Silicon SOTA coding & math on mobile with 128K context. Fully offline with thinking mode.

译设备端小模型拥有如此多的可能性。 这里 @adrgrondin 正在 iPhone 17 Pro 上运行 Google 的 Gemma 4 E2B。 针对 Apple Silicon 优化的 MLX 实现约 40tk/s 的速度 在移动端实现 SOTA 编程与数学能力,支持 128K 上下文。完全离线运行并具备思考模式。

🚨 AI News | TestingCatalog@testingcatalog · 5月17日42

OPENAI 🔥: In the future, Codex will be able to control other desktop devices with the Codex installation. All your Mac Minis, your desktop station at work, or even your grandparents' old computers can form your own "Codex network". Along with the upcoming "Locked Use" setting, this feature will allow Codex to invoke Computer Use capabilities on other machines from your main device.

译OPENAI 🔥: 未来,Codex将能够通过已安装Codex的设备控制其他桌面设备。你所有的Mac Mini、工作台式机,甚至祖父母的旧电脑都可以组成你自己的“Codex网络”。 结合即将推出的“锁定使用”设置,该功能将允许Codex从你的主设备调用其他机器的计算机使用能力。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月29日
22:42
歸藏(guizang.ai)@op7418
63
AI编程工具不止写代码:新实用场景涌现

推文指出,Claude Code、Cursor等AI编程工具的能力已超越代码编写。作者分享了一个实际用例:在手机安装谷歌框架遇到问题时,通过Claude Code自动完成了下载安装包、安装和调试的全过程,体现了这类工具在解决日常技术问题上的潜在实用价值。

智能体Anthropic教程/实践端侧
17:40
小互@xiaohu
65
苹果 iOS 27 曝光:Siri 将大改造

苹果iOS 27或将对Siri进行大改造,将其转变为类似ChatGPT的独立聊天App,并可能整合进灵动岛。核心变化是允许Siri接入ChatGPT、Gemini、Claude等多种外部AI模型。交互界面将变为“Search or Ask(搜索或提问)”,体验更偏向对话式。

产品更新端侧语音
5月28日
11:31
Berryxia.AI@berryxia
58
Google发布新一代Coral板,本地AI进入生产力时代

Google发布最新Coral开发板,搭载Gemma系列模型,实现高效的本地设备端AI。核心演示包括板载实时语音翻译、通过自然语言控制硬件,以及利用视觉与声音生成音乐。此次升级的关键在于无需云端联网,解决了传统本地AI在延迟、隐私和成本方面的痛点。通过硬件与模型的深度结合,Google将AI的应用场景从云端拉回设备本地,计划于今年夏天推出。

Google Gemma: Introducing the newest Coral board, for efficient, on-device AI! Check out the demos in the video: - On-board speech tra...

Google产品更新端侧语音
5月27日
23:05
Rohan Paul@rohanpaul_ai
40
华为LogicFolding芯片技术:垂直堆叠实现性能提升

华为推出“LogicFolding”芯片设计技术,旨在不依赖单纯缩小晶体管制程,以缩小与竞争对手的差距。其核心思想是通过垂直堆叠活跃电路层,将关键信号路径“折叠”向上,从而缩短导线长度、减少寄生延迟并收紧时钟偏差,最终在不改变器件节点的情况下提升芯片频率。此技术并非传统3D封装,其深层创新在于将芯片拓扑结构本身变为一种性能缩放工具。华为指出,该技术能大幅压缩相邻触发器间的传播时间,收紧关键路径。预计其高端芯片将在2031年实现等效于14 Å(1.4 nm)工艺的晶体管密度。

Huawei: What is LogicFolding? For circuit design, it aggressively compresses propagation time between adjacent flip-flops, tight...

端侧行业动态
10:27
Berryxia.AI@berryxia
62
PrismML推出官方iOS应用"Bonsai Studio",允许用户在iPhone或iPad上完全本地运行Bonsai Image 4B图像生成模型。该模型基于FLUX.2 Klein,通过1-bit/3-bit量化将权重从7.75GB压缩至0.93GB。在iPhone 15 Pro及以上设备,生成一张512×512图片约占1.5GB内存,1024×1024约占2GB,全程离线推理,无需联网或支付token费用。应用免费,支持多种风格,可用于教学素材等轻量场景,但生成中文文字存在乱码。此外,M芯片的Mac电脑也可下载该iOS客户端使用,不过需要重启并降低设备安全策略。Android端暂无官方App,可通过网页版体验。

Berryxia.AI: iPhone 上直接用 App Store 下载就行: 👉 Bonsai Studio - PrismML 官方 iOS 应用,免费安装,模型在手机本地跑 我觉得给学校老师做一些素材展示,或者幼儿园小朋友教学还是可以的。 不需要额外的TO...

图像生成教程/实践端侧
09:27
Berryxia.AI@berryxia
72
Bonsai Studio:iPhone端侧离线图像生成应用上线

PrismML发布官方iOS应用Bonsai Studio,用户可免费下载,在iPhone上本地离线运行其Bonsai Image 4B扩散模型。该模型基于FLUX.2 Klein,其1-bit压缩版仅0.93GB,比全精度版小8.3倍。在iPhone 15 Pro及以上机型生成512×512图像耗时约几十秒,内存占用约1.5GB。应用支持多种风格,但中文文字生成目前为乱码。Android用户可通过WebGPU网页版体验。

Berryxia.AI: 兄弟们,端侧生图模型又有新东西了! 之前有客户端Drawthing 客户端也是支持iPad 手机进行文生图~ 今天PrismML也来了一个好玩的... 他们发布了1-bit和Ternary版本的Bonsai Image 4B扩散模型。 1-...

图像生成端侧评测/基准
08:27
Berryxia.AI@berryxia
56
oMLX发布v0.3.11:专注稳定性,打造"开箱即用"的本地AI体验

oMLX项目发布了v0.3.11版本,这是一个基于Apple MLX框架、旨在提升Apple设备端侧模型性能的项目。本次及前几轮更新均以在高内存压力下的稳定性为首要目标,开发者正呼吁用户对此进行更多测试。该项目由一位有全职工作的独立开发者维护,其核心目标是提供“开箱即用”的本地AI体验——让用户无需阅读文档或调整参数,甚至在模型下载过程中即可开始对话,从而降低本地AI的使用门槛。

Jun Kim: Just released oMLX v0.3.11. The last few updates have focused on stability as my top priority, and I'm planning to ship ...

GitHub产品更新开源/仓库端侧
07:37
Artificial Analysis@ArtificialAnlys
67
OpenBMB发布1B参数模型MiniCPM5-1B,在小规模开源模型中表现最优

OpenBMB发布了MiniCPM5-1B(Non-reasoning),一款1B参数的稠密大语言模型。该模型在Artificial Analysis Intelligence Index上获得17.9分,成为1B及以下开源模型中得分最高者。其得分领先同规模模型Qwen3.5 0.8B(10.5分)和Qwen3.5 2B(16.3分),性能超越前代模型MiniCPM-V 4.6 1.3B(12.7分)。MiniCPM5-1B为纯文本模型,上下文窗口128K,采用Apache 2.0许可证。在AA-Omniscience测试中,其通过选择“拒绝回答”而非猜测,避免了模型幻觉惩罚,获得了同尺寸类别的最高分。

开源生态模型发布端侧
07:27
Berryxia.AI@berryxia
71
PrismML发布Bonsai Image 4B极致压缩版本

PrismML发布了Bonsai Image 4B扩散模型的1-bit和Ternary两个极致压缩版本。1-bit版本仅0.93GB,比全精度模型缩小8.3倍;Ternary版本为1.21GB,采用-1、0、+1三元权重。两者在Mac M4 Pro上的生成速度最高可提升5.6倍,且生成质量可与更大模型相媲美。同时,PrismML推出了配套的iOS应用Bonsai Studio,支持在iPhone上完全离线、本地生成图像。

PrismML: Today we're releasing 1-bit and Ternary Bonsai Image 4B. A new family of image-generation models designed to run high-qu...

图像生成模型发布端侧
5月26日
18:28
X.PIN@thexpin
67
华为AI芯片:绕过制程限制的扩展路径

华为将不依赖更小制程节点,通过封装与架构创新来扩展其昇腾AI芯片。根据何庭波的论文,华为计划在2025年至2030年间,通过Chiplets、2.5D扇出封装和3D堆叠技术,推进其昇腾SuperPoD系列,具体产品包括2025年的910C、2026年的950及后续的990。约2030年,Ascend 990将引入LogicFolding技术,目标是到2035年实现100倍的集成度跃升。

端侧论文/研究部署/工程
03:58
Chubby♨️@kimmonismus
同事件精选79
苹果据称正使用定制版1.2T参数Google模型重塑下一代Siri

据报道,苹果为改造下一代Siri,正使用一个定制版、参数规模达1.2T的Google大模型作为其核心,这显著大于预估约300B参数的Gemini 3.5 Flash。该模型将驱动Siri的部分功能,其中简单查询预期会在本地设备运行。苹果面临的关键挑战是确保该大模型能够足够快速地响应日常问题。此外,下个月AI领域预计将有多项重要发布,包括WWDC上的Apple Intelligence与Gemini整合、GPT-5.6、可能的Sonnet 4.8/Opus 4.8,以及已确认的Gemini 3.5 Pro。

Google端侧行业动态
同一事件,精选展示《受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》
推荐理由:Apple 把 1.2T 参数的定制 Gemini 塞进 Siri,简单查询还打算跑本地,这比单纯集成 Gemini 激进得多,WWDC 见真章。
5月25日
19:28
Rohan Paul@rohanpaul_ai
75
华为发布突破性芯片设计方法"LogicFolding"

华为提出了“τ缩放”和“LogicFolding”两种新方法,旨在不依赖最先进光刻工具的前提下,缩小与台积电的性能差距。其核心思想是将衡量芯片进步的指标从晶体管尺寸转向信号传输延迟(τ)。LogicFolding作为具体实现,通过垂直堆叠逻辑电路层并采用混合键合,将需要通信的电路紧邻放置,从而缩短关键线路、降低电阻和寄生电电容,提升信号速度。华为表示,其下一代麒麟手机芯片将是对τ缩放规律的首次全面测试。

Rohan Paul: 🇨🇳 Huawei reveals a new chip design breakthrough under US sanctions pressure. A design approach meant to close the gap...

端侧论文/研究
关联讨论 1 条IT之家(RSS)
18:52
X.PIN@thexpin
58
更多来自华为陶哲轩演讲的内容--幻灯片泄露了2026年麒麟芯片的规格!📈 与传统2D设计芯片相比,新款麒麟芯片实现了: 🔹 晶体管密度提升53.5%(238 MTr/mm2) 🔹 P核效率提升41% 🔹 峰值频率提升12.7% → 3.1GHz(首款突破3GHz的麒麟芯片) 路线图持续攀升:到2031年,华为目标是实现400+ MTr/mm2的密度和5.0GHz的时钟频率。这是LogicFolding架构的首次商用亮相--很可能搭载于今年秋季的Mate 90。
端侧行业动态
17:28
Chubby♨️@kimmonismus
73
华为无法获得EUV,于是制定了自己的缩放定律。

华为在IEEE ISCAS上公布了Tau(τ)Scaling Law框架,通过时间维度优化替代传统的晶体管几何尺寸微缩。公司六年内设计量产了381款芯片,采用新LogicFolding架构的麒麟芯片将于今年秋季出货。其目标是到2031年,实现等效于1.4nm工艺的晶体管密度,而无需依赖受ASML禁运影响的EUV光刻技术。这一基于架构创新的路径若成功,将削弱美国出口管制的效力。

Andrew Curran: Huawei says it has made a breakthrough and expects to design high-end chips with transistor density equivalent to 1.4 nm...

端侧行业动态
15:28
Rohan Paul@rohanpaul_ai
67
华为提出"τ缩放定律",以侧向创新突破芯片与存储瓶颈

华为提出τ缩放定律,旨在不依赖更先进制程的情况下,通过LogicFolding技术折叠逻辑模块、缩短信号传输距离来提升芯片性能与密度。华为称已量产采用此思路的381颗芯片,并计划于2031年实现等效1.4nm(14Å)密度,该定律以海思负责人何庭波命名。同样,华为在存储领域也展示了类似的“侧向创新”路径,其通过改变封装方式(Die-on-Board)而非追求最先进的NAND层数,推出了容量达122.88TB的AI SSD。

Rohan Paul: 🇨🇳 🇺🇸 China's Huawei's new 122TB SSD shows how export controls can move innovation sideways instead of simply stoppi...

大佬观点推理端侧
5月24日
14:27
Rohan Paul@rohanpaul_ai
51
二手显卡与过时内存成功本地运行万亿参数大模型

近期有技术爱好者成功在单张二手RTX 3060 12GB显卡上,运行了拥有1万亿参数的Kimi K2.5大语言模型,速度约为每秒4个token。这一成果得益于模型的混合专家架构,虽然总参数量巨大,但每次推理仅激活32B参数。实现的关键在于将延迟敏感的核心组件置于GPU显存,而将庞大的专家权重存储在由二手英特尔傲腾持久内存(PMem)构成的768GB大容量内存池中,并以DDR4内存作为缓存。通过llama.cpp工具进行混合调度,该方案为本地部署超大规模模型提供了一条低成本的技术路径。

开源生态教程/实践端侧部署/工程
5月23日
16:30
歸藏(guizang.ai)@op7418
39
M5 Stack 新出的 Paper Color 彩色墨水屏也做了适配

歸藏(guizang.ai): http://x.com/i/article/2057775296712196096

产品更新端侧
08:27
Rohan Paul@rohanpaul_ai
64
谷歌新研究:AI学习生理模式提升可穿戴设备价值

谷歌研究院提出基础模型SensorFM,通过学习超过500万人产生的逾1万亿分钟可穿戴设备传感器数据,掌握了人类生理活动的一般性模式。该模型超越了将数据压缩为简单指标的传统方法,能够从数据中提取出有意义的结构并将其复用于多种健康预测任务。实验显示,模型规模和数据量越大性能越强,且其学习到的数据表征在35项预测任务中的34项上,均优于基于工程特征的基线方法。

Google数据/训练端侧论文/研究
5月22日
23:50
向阳乔木@vista8
36
在AJ安利下,歸藏买了安克 AI 录音豆。 在歸藏安利下,我也买了。 初步体验,这是目前个人最喜欢、最实用的 AI 硬件产品。 就是绳子带着不舒服,打算淘宝换个。
端侧评测/基准语音
22:56
Rohan Paul@rohanpaul_ai
精选75
首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布

ModelBest、清华大学与OpenBMB社区联合发布了BitCPM-CANN,这是全球首个完全基于华为昇腾910B NPU训练的开源1.58比特三元大模型。其核心创新在于采用仅含三种权重状态的极低比特量化技术,使模型内存占用相比BF16降低约6倍,可高效部署于手机、电脑、车载设备等边缘端。更关键的是,整个训练全栈(从量化算子到框架)均在昇腾上原生构建与验证,而非简单移植。该模型家族(0.5B-8B)在多项基准测试上保持了全精度模型95-97%的性能,为资源受限环境下部署和复现大模型提供了可落地的解决方案。

OpenBMB: 🚀 BitCPM-CANN by ModelBest × @Tsinghua_Uni × OpenBMB is here - and it's not about stacking parameters. Memory costs are...

开源/仓库模型发布端侧
关联讨论 1 条IT之家(RSS)
推荐理由:首个开源的1.58-bit三元LLM,直接在昇腾芯片上原生训练,内存压缩到BF16的六分之一,8B模型就能跑在手机上,做端侧部署的可以立刻上手试试了。
19:56
Rohan Paul@rohanpaul_ai
32
边缘AI运行在每只昆虫的背包上,实现低延迟协调、安全数据交换、群体编队控制和任务执行。 Swarm Biotactics通过培育昆虫实现规模化,已融资约1300万欧元。
具身智能端侧行业动态
19:30
歸藏(guizang.ai)@op7418
73
开源一个 Skill,让 AI 接管你屏幕边那张便签纸

AI Desk Card 是一款 4.7 寸磁吸墨水屏,结合 AI Agent(如 Claude Code),通过预置模板与数据填充,动态显示日历、待办、GitHub PR 队列、天气等内容。它解决了传统便签纸的静态限制,实现内容自适应和场景切换(如夜间变为电子名片)。核心理念是将硬件从固定功能中解放,使显示能力由 AI 可获取的信息动态定义,从而提升效率并减少手动配置。

智能体开源/仓库教程/实践端侧
19:30
歸藏(guizang.ai)@op7418
15
一款集成麦克风与扬声器的新设备发布,大幅提升了可玩性与应用潜力。作者近期持续购入M5 Stack产品,但该公司新品常迅速售罄。结合引用信息,该设备可能支持语音交互、音频处理等功能,为开发者提供了更丰富的创作空间。

歸藏(guizang.ai): http://x.com/i/article/2057775296712196096

其他端侧
19:20
PixVerse@PixVerse_
63
Create Image已在PixVerse App上线。 输入提示词或参考图,在手机上即可生成。 5月24日至31日11:00 UTC,每人可免费生成3次。 转发+关注+回复 = 300 Creds(仅限72小时)
产品更新图像生成端侧
14:30
歸藏(guizang.ai)@op7418
57
探讨了墨水屏硬件作为低功耗副屏的创新应用场景。设备开机时,可作为AI信息显示终端,自动接收并展示待办事项、日历等推送信息,便于用户快速查阅;关机后则转变为电子名片,利用墨水屏的静态显示特性方便线下社交扫码。该方案通过"磁吸"方式灵活部署,旨在将硬件功能打包为可复用的技能模块。

歸藏(guizang.ai): 终于找到了这种墨水屏硬件最适合的场景: 开机的时候,让 AI 往里边推一个 To-do、日历,一些基础的需要记的信息 把它挂在屏幕边上(用磁吸) 关机的时候,利用墨水屏的特性让它显示名片,这样大家加好友什么的直接看就行 太实用了! 到时候打...

教程/实践端侧
08:13
Berryxia.AI@berryxia
60
Stable Audio 3登陆Mac本地运行,音乐生成效率惊人

Stable Audio 3官方正式发布,并提供了针对苹果MLX框架的优化版本,使得强大的音乐生成模型能够直接在本地Mac电脑上高效运行。其核心亮点在于在M5 Pro芯片上可实现59倍实时生成速度,性能表现突出。此外,该工具支持在不到1小时内完成LoRA微调,并提供快速(Sm)与高质量(Medium)两种生成模式。开发者鼓励社区积极探索其潜力,标志着本地化音乐创作工具达到了新高度。

dadabots: 🥳 Announcing Stable Audio 3 🍕 🏆 fastest music models ever 💻 runs on MacBookPro M-series 🧪 break it plz 🧠 LoRA fine...

开源/仓库模型发布端侧语音
05:38
小互@xiaohu
61
Codex 推出 Locked Use(锁屏使用)功能

Codex 新增“锁屏使用”功能,允许用户在 Mac 锁屏状态下,通过手机远程下发指令,让电脑继续执行任务。该功能基于苹果官方授权机制临时解锁,操作全程屏幕保持黑屏以保护隐私,并具备四层安全设计,如短时授权、检测到本地操作即刻重锁,确保了远程操作的安全性与便利性。

产品更新端侧编码
5月21日
16:56
Tencent Hy@TencentHunyuan
精选74
腾讯开源Hy-MT2多语言翻译模型

腾讯正式开源Hy-MT2多语言翻译模型,支持33种语言间的无缝互译。其7B与30B-A3B版本在开源模型中达到最先进的翻译性能,超越了许多参数规模大数十倍的模型。更具突破性的是,1.8B轻量级版本性能超越微软等主流商业API,并凭借腾讯AngelSlim 1.25-bit极量化技术,仅需440MB存储空间,即可在主流手机芯片上本地运行,推理速度较前代提升1.5倍,显著降低了高质量AI翻译的部署门槛。

开源生态模型发布端侧
关联讨论 2 条X:腾讯混元 (@TencentHunyuan)IT之家(RSS)
推荐理由:虽然翻译领域不算最热,腾讯这个1.8B开源模型用1.25位量化直接跑在手机上,效果还超微软商业API,做本地化翻译工具的人值得关注。
13:10
Berryxia.AI@berryxia
35
主推文认为,AI与硬件的结合将带来类似安卓早期自定义ROM的创造性体验。具体案例展示了一种墨水屏硬件的设想:设备运行时,AI可推送待办、日历等动态信息供实时查看;关机后则利用墨水屏特性常显个人名片,便于社交。该方案将功能模块化打包为Skills,分享给社区,体现了AI赋能传统硬件、实现个性化场景应用的潜力。

歸藏(guizang.ai): 终于找到了这种墨水屏硬件最适合的场景: 开机的时候,让 AI 往里边推一个 To-do、日历,一些基础的需要记的信息 把它挂在屏幕边上(用磁吸) 关机的时候,利用墨水屏的特性让它显示名片,这样大家加好友什么的直接看就行 太实用了! 到时候打...

大佬观点端侧
00:14
歸藏(guizang.ai)@op7418
40
Mac版豆包输入法试用体验

豆包输入法Mac版上线后,用户试用体验极佳,称其在准确性、中英文混合输入、专业名词识别和响应速度方面均为市面顶尖。与其他输入法相比,它解决了过度优化和无法实时预览的痛点,实现“言出法随”的快速输出与实时润色,避免乱加Markdown格式。对于如Claude Code、AntiGravity、Perplexity等专业术语与中文混合的场景,豆包输入法处理出色,用户已完全依赖其手机和电脑端。未来期待支持自定义提示词润色功能,但目前识别能力已无可挑剔。

端侧评测/基准语音
5月20日
23:14
歸藏(guizang.ai)@op7418
63
墨水屏新用途:AI推送与磁吸名片场景

墨水屏硬件可通过AI推送日历、待办事项等基础信息,利用磁吸设计便捷固定。关机时,借助墨水屏的常显特性可切换为电子名片,简化社交场合的加好友流程。该方案将打包为Skills分享,为同类硬件用户提供实用参考。

教程/实践端侧
17:50
X.PIN@thexpin
57
俄罗斯正寻求采购中国芯片以训练其GigaChat AI。该消息于普京近期访华期间宣布。俄罗斯联邦储蓄银行CEO确认,公司正关注华为的昇腾950,这是目前最先进的中国产AI芯片,尽管其性能仍落后于英伟达的H200。
端侧行业动态
16:05
Rohan Paul@rohanpaul_ai
49
谷歌的Android XR眼镜演示展示了通过眼镜摄像头进行实时视觉捕捉,并将画面输入Gemini。AI根据语音指令编辑图像,结果直接推送到配对的智能手表上查看。
Google产品更新多模态端侧
08:19
小互@xiaohu
60
Google 智能眼镜 展示 让你"不用掏手机"就能完成日常的事情 让 Gemini 帮你 点咖啡,手机放兜里,眼镜只在最后一步确认时提示即可
Google产品更新多模态端侧
5月19日
23:31
凡人小北@frxiaobei
59
本次更新亮点在于展现了"操作系统级感知力"的交互新方向。其核心优势并非单一模型,而是Gmail、Drive等服务的深度生态整合,这为重度用户构建了高迁移成本的壁垒。桌面端AI竞争已进入新阶段,谁先实现顺畅的系统级感知体验,谁将占据先机。

听澜: 可以!Google这次是认真了, 结合前一段的goolebook看这个消息,光标停在哪个窗口、哪个界面,它就直接读懂那里在干嘛。 这个交互逻辑如果做顺了, 体验会比"点击分享屏幕"自然一个量级。 再加上Spark模式跑本地Agent, 浮窗...

智能体Google大佬观点端侧
17:03
🚨 AI News | TestingCatalog@testingcatalog
50
Google AI Studio移动端上线开启预注册

Google宣布推出AI Studio移动应用,现已在Google Play开启预注册。该应用旨在让用户随时随地将灵感快速转化为实际应用,支持通过自然语言描述来构建个性化工具、游戏或目标追踪系统等,大幅降低AI开发的门槛。移动化设计强调即时捕捉创意,无需受限于电脑前的场景,提升创作与开发的灵活性。

Google产品更新端侧
13:50
AYi@AYi_AInotes
66
葡萄3D模型在X平台爆火:4800赞背后的3DGS技术突破

一颗葡萄的3D模型在社交平台X上引发热议,一天内获4800赞和280万浏览。其核心在于利用3DGS技术成功攻克了半透明物体重建的公认难题。项目使用6660张宏观照片训练,生成仅43万高斯点,压缩后模型小于50MB,实现了在手机端实时360度旋转和光影还原。这一突破验证了“最难案例跑通,则更简单物体皆可数字化”的逻辑,展示了从专业扫描仪和建模团队降维到个人相机加自动训练的低成本、高效率新流程,为手办、珠宝、文物等领域的数字资产化指明了方向,开发者正通过工具miqula将此流程产品化。

AYi: Damn,有点炸裂啊,一颗葡萄用了6660张宏观照片训练3DGS, 模型只有43万个高斯点, 压缩完不到50MB, 但你可以在手机上看它360度旋转, 连果肉里透出来的光都还原了, 更炸的是老哥回复里那句话,有人问底部怎么拍到的,他甩了张g...

多模态现象/趋势端侧
08:51
DogeDesigner@cb_doge
44
埃隆·马斯克会见了英伟达的伊恩·巴克,后者向他赠送了用于SpaceXAI的新款Vera CPU。
xAI端侧行业动态
5月17日
22:10
Rohan Paul@rohanpaul_ai
61
设备端小模型拥有如此多的可能性。 这里 @adrgrondin 正在 iPhone 17 Pro 上运行 Google 的 Gemma 4 E2B。 针对 Apple Silicon 优化的 MLX 实现约 40tk/s 的速度 在移动端实现 SOTA 编程与数学能力,支持 128K 上下文。完全离线运行并具备思考模式。
Google推理端侧行业动态
02:13
🚨 AI News | TestingCatalog@testingcatalog
42
OPENAI 🔥: 未来,Codex将能够通过已安装Codex的设备控制其他桌面设备。你所有的Mac Mini、工作台式机,甚至祖父母的旧电脑都可以组成你自己的"Codex网络"。 结合即将推出的"锁定使用"设置,该功能将允许Codex从你的主设备调用其他机器的计算机使用能力。
智能体OpenAI端侧行业动态
‹ 上一页
1…345678
下一页 ›