大咖博客Gary Marcus:The Road to AI We Can Trust(RSS)
Gary Marcus 在文章中分享了对 AI 领域刚刚发生事件的看法,表达了对当前 AI 发展方向的思考。
官方Hugging Face:Blog(RSS)
Thousand Token Wood v2使用四个不同实验室的小模型(gpt-oss-20b、MiniCPM3-4B、Nemotron-Mini-4B及微调Qwen 0.5B)驱动金融模拟游戏的智能体。核心发现是异构服务层摩擦在于vLLM 0.22.1需CUDA工具包,而非模型本身。通过容忍性JSON解析层,添加模型只需一条配置。信息隔离确保内幕标志不在提示词中,扫描测试验证无泄露。记忆用情绪摘要截断避免淹没。微调0.5B模型实现0%自成交、100%有效报价,真相防火墙零泄露。小模型是可靠格式生成器但不可靠推理器,可通过结构化、提示词和微调弥补。
官方Hugging Face:Blog(RSS)
Hugging Face 发布 Job Searcher,一个基于 AI 的求职搜索工具。用户上传简历并设定偏好后,系统使用教师模型 DeepSeek V4 Pro 生成 LinkedIn 搜索查询,通过 JobSpy 抓取职位,再对学生模型 Qwen3-8B(8B 参数)进行 LoRA 微调,对每个职位从技能匹配、经验相关性、教育背景、行业领域契合度和资历对齐五个维度给出评分和推理。训练在 Modal 平台单张 A100 上完成。推理部署于 Hugging Face ZeroGPU Space,使用 llama.cpp 实现流式输出。项目开源。
官方·XX:MiniMax (@MiniMax_AI)
对 Claude Opus 4.8 和 MiniMax M3 进行相同的代码审计:同一代码库、同一提示词,预先植入 17 个已知 bug。MiniMax M3 以 $0.07 抓到 13 个;最便宜的 Claude 运行同样抓到 13 个,花费 $1.30。MiniMax 表示这一对比非常有趣,绝对值得一读。
大咖博客Gary Marcus:The Road to AI We Can Trust(RSS)