7月1日

02:36

AK@_akhaliq

在 Claude Code 中使用 hf-claude 进行 open-fusion。

Anthropic Hugging Face 开源/仓库编码

00:36

AK@_akhaliq

Ornith-1.0-35B 现在可以通过 hf-claude 在 Claude Code 中使用。

Hugging Face 产品更新编码

6月30日

05:35

Hacker News 热门（buzzing.cc 中文翻译）

Ornith-1.0：用于代理编码的自改进开源模型

Ornith-1.0 是基于 Gemma 4 和 Qwen 3.5 后训练的自改进开源模型系列，包含 9B Dense、31B Dense、35B MoE 和 397B MoE 四种规格。采用强化学习同时优化搜索框架和解决方案。在 Terminal-Bench 2.1、SWE-bench Verified 等编程基准上各尺寸均达同类开源最优——397B MoE 在 SWE-bench Verified 上取得 82.4%，Terminal-Bench 2.1 (Claude Code) 78.2%。所有检查点支持 256K 上下文窗口，MIT 许可证，全球可访问。运行需 Transformers ≥5.8.1、vLLM ≥0.19.1、SGLang ≥0.5.9。

智能体 Hugging Face 开源生态模型发布

6月29日

23:57

SenseTime@SenseTime_AI

商汤 SenseNova-U1-8B-MoT 可生成高质量信息图

商汤推出 SenseNova-U1-8B-MoT-Infographic 模型，能够生成工作室级别的高密度信息图，此前这类工作流程缓慢且昂贵。YouTuber CAPITAL R 制作了演示视频，模型已在 HuggingFace 上线，GitHub 页面展示示例图片，并开放 Discord 社区。

GitHub Hugging Face 图像生成模型发布

03:03

AK@_akhaliq

baidu/Unlimited-OCR 现在在 HuggingFace 上排名第一

Hugging Face 开源生态行业动态

6月28日

22:56

Nathan Lambert@natolambert

这是真实的，也是前沿模型氛围监管的可怕后果。

clem 🤗: Getting regulated by a government because your model is "too dangerous" is the best marketing (especially for enterprise...

Hugging Face 大佬观点安全/对齐政策/监管

16:10

The Decoder：AI News（RSS）

精选70

新浪开源VibeThinker-3B：推理可压缩，事实知识不能

新浪发布仅3B参数的VibeThinker-3B，在AIME26等数学编程基准上持平DeepSeek V3.2等大200–333倍的模型，LiveCodeBench超越所有20B以下模型，LeetCode竞赛解决123/128题超过GPT-5.2、Kimi K2.5等。但知识密集型GPQA-Diamond大幅落后。模型基于阿里Qwen2.5-Coder-3B，经SFT、强化学习、自蒸馏等多阶段后训练。研究提出“参数压缩-覆盖假说”：逻辑推理依赖少数可压缩模式，而广泛世界知识仍需大参数。模型已开源。

Hugging Face 开源生态推理模型发布

推荐理由：VibeThinker-3B 用 3B 参数在数学编程上匹敌百倍大模型，推理可压缩而知识不能的假设值得深思。对做推理应用的人来说是个信号。

15:28

MarkTechPost（RSS）

在Colab中构建Fable 5 Traces工作流：解析工具调用、审计数据与训练基线

本教程使用Hugging Face上的Fable 5 Traces数据集，在Google Colab中搭建轻量环境并手动下载JSONL文件。流程包括预览原始agent trace示例、规范化工具调用与文本输出、审计数据结构、检测密钥模式，以及可视化输出类型、工具、源根目录和文本长度等分布。还创建了安全的no-CoT聊天/SFT导出，构建关键词搜索辅助，并训练纯Python朴素贝叶斯基线，评估trace上下文能否预测助手的输出类型与工具使用。

智能体 Hugging Face 教程/实践

13:07

MarkTechPost（RSS）

Liquid AI 发布 LFM2.5-230M 开源文本模型，支持 llama.cpp、MLX、vLLM、SGLang 和 ONNX 设备端推理

Liquid AI 推出 LFM2.5-230M，230M 参数开源文本模型，基于 LFM2 架构，开放权重。支持 llama.cpp、MLX、vLLM、SGLang、ONNX 推理，内存占用 293–375 MB。Galaxy S25 Ultra 上达 213 tok/s，Raspberry Pi 5 上 42 tok/s。IFEval 指令跟随得分 71.71，领先 Qwen3.5-0.8B（59.94）和 Gemma 3 1B IT（63.49）；CaseReportBench 临床数据提取得分 22.51。上下文窗口 32768 tokens，预训练于 19 万亿 tokens。专为数据提取和工具调用设计，不适用于数学推理、代码生成或创意写作。

Hugging Face 模型发布端侧

03:25

Hugging Face：Blog（RSS）

精选62

一条命令在HF Jobs上启动vLLM服务器

HuggingFace Jobs 支持一条命令启动 vLLM 服务器，用于测试、评估或批量生成。使用 hf jobs run 命令，指定官方 vllm/vllm-openai 镜像、GPU flavor（如 a10g-large）、暴露端口 8000 并设置超时。服务器启动后可通过 OpenAI 兼容 API 访问，每次请求需携带 HF token 作为 bearer token（仅限有读权限的用户）。示例部署了 Qwen/Qwen3-4B（多 GPU 需 --tensor-parallel-size）。a10g-large 价格为 $1.50/小时，按分钟计费，可通过 hf jobs cancel 停止。

Hugging Face 教程/实践部署/工程

推荐理由：这是一条命令在HF上启动vLLM的完整教程，适合快速测试模型的开发者，但方案完全绑定Hugging Face平台，通用性有限。

6月27日