AIHOT

4月10日

08:00

HuggingFace Daily Papers（社区热门论文）

腾讯发布首个专为近距离人机交互感知的视觉语言模型TAIHRI，突破传统全身重建范式，实现任务相关身体部位的精确度量级3D空间定位。该模型通过将3D关键点量化为有限交互空间，结合2D关键点推理与下一token预测机制，在自我中心相机坐标系下精准定位关键身体部位。实验表明，TAIHRI在任务关键身体部位估计精度上显著优于传统方法，并支持自然语言控制与全局人体网格重建等下游任务，相关代码已开源。

具身智能多模态论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

SPASM：面向多轮对话生成的稳定人设驱动智能体模拟框架

研究团队推出SPASM框架，通过模块化设计解决多轮对话中智能体的人设漂移与"回声"问题。该框架包含人设创建、对话生成与终止检测模块，核心创新Egocentric Context Projection（ECP）技术将对话历史存储为视角无关表示，再投影至各智能体自我中心视角，在不改变模型权重的前提下提升长程稳定性。基于GPT-4o-mini、DeepSeek-V3.2和Qwen-Plus构建的数据集包含4,500个人设与45,000段对话，实验证实ECP显著抑制人设漂移并消除回声现象。

智能体数据/训练论文/研究

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

使用 ChatGPT 进行头脑风暴

介绍如何运用 ChatGPT 开展头脑风暴，梳理思路并将模糊概念转化为结构化、可执行的行动方案，提升创意整理效率。

OpenAI教程/实践

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

如何个性化设置 ChatGPT

通过 custom instructions 和 memory 功能，让 ChatGPT 提供更相关、一致且量身定制的回答。

OpenAI教程/实践

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

在 ChatGPT 中处理文件

了解如何在 ChatGPT 中上传 PDF、电子表格等文件，利用该功能分析数据、总结文档，并基于文件内容生成新内容。

OpenAI检索增强教程/实践

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

OpenAI 的 AI 应用

介绍 OpenAI 旗下 ChatGPT、Codex 及 API 等产品在真实场景中的应用，涵盖工作、开发与日常任务等实际用例。

OpenAI其他

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

面向销售团队的 ChatGPT 应用指南

销售团队可利用 ChatGPT 完成客户调研、个性化外联、交易全流程管理及销售漏斗优化，有效提升线索转化与成交效率。

OpenAI教程/实践

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

金融服务业AI资源

专为金融服务业打造的AI资源合集，涵盖提示词包、GPT模型、实用指南及专业工具，助力金融机构安全、高效地部署和扩展人工智能应用，推动行业智能化升级与数字化转型。

OpenAI产品更新部署/工程

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

使用 ChatGPT 创建图像

本文介绍如何运用清晰提示词在 ChatGPT 中创建并优化图像，支持设计迭代，可在数分钟内生成高质量视觉内容。

OpenAI图像生成教程/实践

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

AI fundamentals

文章是一份面向初学者的清晰指南，旨在解释人工智能的基本概念与工作原理。它阐述了什么是人工智能，并重点说明了以ChatGPT为代表的工具如何利用大型语言模型（LLM）来运作。内容涵盖了AI的核心定义、运作机制，以及具体工具的应用方式，为读者理解这一技术提供了基础框架。

其他教程/实践

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

财务团队如何使用 ChatGPT

财务团队可利用 ChatGPT 简化报告编制、分析财务数据、改进预测准确性，并更清晰地向管理层传达业务洞察，提升整体财务管理效率。

OpenAI教程/实践

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

ChatGPT 入门指南

新手指南：介绍 ChatGPT 的基础使用方法，包括如何开启首次对话，以及利用 AI 进行写作、头脑风暴和解决问题的实用技巧。

OpenAI教程/实践

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

面向管理者的 ChatGPT 使用指南

介绍管理者如何利用 ChatGPT 准备重要对话、撰写清晰反馈、保持工作条理并提升团队效率，涵盖具体使用场景与实操方法。

OpenAI教程/实践

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

医疗保健

临床医生使用符合 HIPAA 标准的 ChatGPT 辅助诊断、病历记录和患者护理，探索安全合规的 AI 医疗工具在临床工作中的应用场景。

OpenAI产品更新

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

客户成功团队如何使用 ChatGPT

客户成功团队利用 ChatGPT 管理客户账户、改善沟通效率、降低流失率，并推动产品采用与续订转化。

OpenAI教程/实践

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

使用 ChatGPT 进行研究

ChatGPT 支持搜索与深度研究功能，可查找最新信息、分析来源并生成结构化洞察，帮助用户高效完成研究分析。

OpenAI搜索教程/实践

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

Prompting 基础

学习 Prompting 基础，掌握撰写清晰、有效提示词的方法，从 ChatGPT 获取更优质、实用的回复。

OpenAI教程/实践

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

负责任且安全地使用 AI

提供使用 ChatGPT 等 AI 工具的最佳实践指南，聚焦安全性、准确性与透明度，指导用户如何负责任地部署和应用生成式 AI。

OpenAI教程/实践

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

ChatGPT 研究指南

介绍使用 ChatGPT 做研究的方法，包括搜集资料、分析信息及生成带引用的结构化洞察。

OpenAI搜索教程/实践

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

ChatGPT 运营团队实战指南

面向运营团队的 ChatGPT 应用指南，介绍如何利用 AI 工具简化工作流程、提升团队协作效率、标准化操作规范并加速业务执行。涵盖从流程优化到跨部门协调的具体实践方法。

OpenAI教程/实践

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

使用 ChatGPT 进行写作

使用 ChatGPT 进行写作的方法，涵盖内容起草、修改与润色，帮助实现结构清晰、语气一致、意图明确的文本创作。

OpenAI教程/实践

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

使用 ChatGPT Skills

OpenAI 推出 ChatGPT Skills 功能，支持用户创建可复用的技能模块以构建标准化工作流。该功能可自动化处理重复性任务，确保输出结果的一致性与高质量，适用于需要批量处理或固定流程的场景。通过自定义技能，用户能够减少重复操作，提升工作效率，实现更灵活的 AI 应用部署。

OpenAI教程/实践

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

使用 ChatGPT 分析数据

使用 ChatGPT 进行数据分析的实用方法：探索数据集、生成洞察、创建可视化，并将发现转化为可执行决策。

OpenAI教程/实践数据/训练

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

使用自定义 GPTs

本文介绍如何构建和使用自定义 GPTs，实现工作流自动化、维持输出一致性，并创建专用 AI 助手，帮助用户打造适合特定业务需求的智能工具，提升工作效率。

OpenAI教程/实践

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

针对 Axios 开发者工具遭入侵事件的回应

OpenAI 回应 Axios 供应链攻击事件，已轮换 macOS 代码签名证书、更新应用程序，并确认用户数据未遭泄露。

OpenAI行业动态

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

ChatGPT 营销团队使用指南

营销团队使用 ChatGPT 规划营销活动、生成内容并分析数据表现，缩短从创意到执行的周期，提升 campaign 落地效率。

OpenAI教程/实践

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

在 ChatGPT 中使用 Projects 功能

ChatGPT 新增 Projects 功能，支持按项目组织聊天记录、上传文件和设置自定义指令，帮助用户管理长期工作流并提升协作效率。

OpenAI教程/实践

03:18

Claude Code：GitHub Releases（RSS）

Claude Code v2.1.98 发布

Claude Code v2.1.98 发布，新增 Google Vertex AI 交互式设置向导、Perforce 版本控制支持（CLAUDE_CODE_PERFORCE_MODE）及 Linux 子进程沙盒功能（PID 命名空间隔离）。修复多项 Bash 工具安全漏洞，包括权限绕过、复合命令绕过强制提示、/dev/tcp 重定向自动授权等问题。权限管理支持 additionalDirectories 实时生效，同时优化 MCP OAuth 刷新、流式响应超时及后台代理进度报告等体验细节。

智能体Anthropic产品更新编码

03:15

Gary Marcus：The Road to AI We Can Trust（RSS）

认为 Anthropic 的 Claude Mythos 公告被过度炒作的三个理由

针对 Anthropic 发布的 Claude Mythos 公告，文章认为市场反应过度，目前无需恐慌。尽管该公告可能涉及重大技术更新或新功能发布，但作者指出相关炒作存在夸大成分，建议保持冷静观察，避免对未经验证的性能指标或技术突破产生过度期待。

Anthropic大佬观点

00:00

LMSYS：Blog（Chatbot Arena 团队）

HiSparse：分层内存系统加速稀疏注意力

LMSYS Org推出HiSparse分层内存系统，针对稀疏注意力仍受限于GPU内存容量的问题，将非活跃KV缓存卸载至主机内存，仅在GPU HBM保留热缓冲区，并通过专用CUDA内核高效管理数据交换（采用LRU策略与页表更新）。该系统在256并发请求下实现超3倍吞吐量提升，GLM-5.1-FP8模型长上下文场景性能提升达5倍，支持DeepSeek-V3.2等采用DeepSeek Sparse Attention架构的模型。

开源/仓库推理部署/工程

00:00

Runway：News（网页）

Runway 扩大与 NYU Tisch 艺术学院合作

Runway 扩大与 NYU Tisch 艺术学院合作，向 ITP、IMA 及 Hyper Cinema Lab 学生开放全套 AI 工具，支持课程作业与个人创作。Runway 创始团队曾就读于 ITP，此次合作旨在让新一代创作者掌握 AI 时代的电影与艺术工作流。

行业动态视频

4月9日

08:00

HuggingFace Daily Papers（社区热门论文）

3D-VCD：通过视觉对比解码缓解3D具身智能体中的幻觉

本文提出首个面向3D具身智能体的推理时视觉对比解码框架3D-VCD，用于缓解多模态大模型在三维环境中的幻觉问题。该方法通过对物体类别、空间坐标及几何范围施加语义与几何扰动构建扭曲的3D场景图，通过对比原始与扭曲场景的预测差异，抑制受语言先验驱动而非场景证据支持的不可靠token。在3D-POPE和HEAL基准测试中，该方法无需重新训练即显著提升了具身智能体的基础推理能力。

智能体arXiv具身智能论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

元学习上下文学习实现免训练跨受试者脑解码

研究团队提出一种元优化的fMRI语义视觉解码方法，通过上下文学习实现免训练的跨受试者泛化。该方法仅需少量图像-脑激活样本作为条件，即可快速推断新受试者的独特神经编码模式，并采用分层反演策略完成解码。实验表明，无需重新训练、微调、解剖对齐或刺激重叠，即可在多种视觉主干网络上实现强跨受试者和跨扫描仪泛化能力，为构建非侵入式脑解码通用基础模型奠定关键基础。

多模态数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

语言模型何时学习什么？隐性课程假设

研究者提出隐性课程假设，指出预训练遵循可组合且可预测的课程结构。通过设计涵盖检索、形态转换、逻辑推理和数学等领域的组合任务，对410M至13B参数的四个模型家族进行追踪，发现技能涌现顺序跨模型高度一致（ρ=.81），且复合任务通常在其组件任务之后出现。研究表明该结构编码于模型内部表征中，利用任务表征空间可有效预测未见过组合任务的训练轨迹（R²=.68-.84），揭示预训练过程比损失曲线显示的更具结构性。

arXiv推理数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

ReconPhys：从单视频中重建外观与物理属性

ReconPhys 是首个可从单目视频联合重建几何、外观与物理属性的前馈框架。该方法采用双分支架构与自监督训练策略，无需真实物理标签即可实现端到端推理。在合成数据集测试中，其未来预测 PSNR 达到 21.64，显著优于现有优化基线的 13.27；Chamfer Distance 从 0.349 降至 0.004。关键突破在于推理速度：仅需不到 1 秒即可完成重建，而传统方法需耗时数小时，为机器人与图形学领域快速生成仿真就绪资产提供了新方案。

arXiv具身智能视频论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

基于经验回放的 LLM 高效强化学习训练

针对大语言模型后训练必须使用新鲜 on-policy 数据的传统观点，研究系统探讨了经验回放技术的应用。通过形式化分析 replay buffer 设计在数据陈旧性方差、样本多样性与生成计算成本间的权衡，发现当生成成本高昂时，严格的 on-policy 采样实为次优选择。实证表明，设计良好的 replay buffer 可在保持策略熵的同时，大幅减少推理计算，且不损害甚至提升最终模型性能。

arXiv数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

Uni-ViGU：基于扩散式视频生成器统一视频生成与理解

Uni-ViGU框架通过扩展扩散式视频生成器统一视频生成与理解，反转了传统以理解为中心的多模态模型范式。该框架采用统一流方法，在单一过程中对视频进行连续流匹配、对文本进行离散流匹配；引入模态驱动的MoE架构，以轻量级层增强Transformer实现文本生成；并通过双向训练机制（知识召回与能力细化两阶段）将生成知识迁移至理解任务。实验表明，该模型在视频生成与理解任务上均达到竞争性性能，验证了以生成为中心的架构路径可行性。

多模态视频论文/研究

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

CyberAgent 借助 ChatGPT Enterprise 与 Codex 加速业务

CyberAgent 部署 ChatGPT Enterprise 与 Codex，在广告、媒体及游戏业务中安全扩展 AI 应用，提升工作质量并加速决策流程，实现业务全面提速。

智能体OpenAI行业动态

05:52

Claude Code：GitHub Releases（RSS）

Claude Code v2.1.97 发布

Claude Code v2.1.97 版本发布，为 NO_FLICKER 模式新增焦点视图切换（Ctrl+O）及多项渲染修复。权限系统修复了 Bash 工具环境变量检查、MCP HTTP 连接内存累积（约 50MB/小时）、429 重试逻辑及设置热重载等漏洞。新增状态栏自动刷新、git worktree 检测、agents 运行指示器及 Cedar 策略文件语法高亮。改进包括自动批准安全环境变量前缀的文件命令、CJK 输入无需空格即可触发补全，以及图像压缩统一处理。

智能体Anthropic产品更新编码

01:47

Gary Marcus：The Road to AI We Can Trust（RSS）

如何看待 Anthropic 那份关于 Mythos 的（或许）可怕新报告？

Anthropic 发布了一份关于 Mythos 的新报告，其潜在影响令人担忧。尽管目前可验证的具体事实细节尚不充分，文章建议保持冷静思考，提供了理性评估该报告的出发点，呼吁在获得更多实证信息前避免过度反应，基于现有线索进行审慎分析。

Anthropic大佬观点安全/对齐