4月10日
08:00
HuggingFace Daily Papers(社区热门论文)
TAIHRI:面向近距离人机交互的任务感知3D人体关键点定位

腾讯发布首个专为近距离人机交互感知的视觉语言模型TAIHRI,突破传统全身重建范式,实现任务相关身体部位的精确度量级3D空间定位。该模型通过将3D关键点量化为有限交互空间,结合2D关键点推理与下一token预测机制,在自我中心相机坐标系下精准定位关键身体部位。实验表明,TAIHRI在任务关键身体部位估计精度上显著优于传统方法,并支持自然语言控制与全局人体网格重建等下游任务,相关代码已开源。

具身智能多模态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
SPASM:面向多轮对话生成的稳定人设驱动智能体模拟框架

研究团队推出SPASM框架,通过模块化设计解决多轮对话中智能体的人设漂移与"回声"问题。该框架包含人设创建、对话生成与终止检测模块,核心创新Egocentric Context Projection(ECP)技术将对话历史存储为视角无关表示,再投影至各智能体自我中心视角,在不改变模型权重的前提下提升长程稳定性。基于GPT-4o-mini、DeepSeek-V3.2和Qwen-Plus构建的数据集包含4,500个人设与45,000段对话,实验证实ECP显著抑制人设漂移并消除回声现象。

智能体数据/训练论文/研究
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
使用 ChatGPT 进行头脑风暴

介绍如何运用 ChatGPT 开展头脑风暴,梳理思路并将模糊概念转化为结构化、可执行的行动方案,提升创意整理效率。

OpenAI教程/实践
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
如何个性化设置 ChatGPT

通过 custom instructions 和 memory 功能,让 ChatGPT 提供更相关、一致且量身定制的回答。

OpenAI教程/实践
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
在 ChatGPT 中处理文件

了解如何在 ChatGPT 中上传 PDF、电子表格等文件,利用该功能分析数据、总结文档,并基于文件内容生成新内容。

OpenAI检索增强教程/实践
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
OpenAI 的 AI 应用

介绍 OpenAI 旗下 ChatGPT、Codex 及 API 等产品在真实场景中的应用,涵盖工作、开发与日常任务等实际用例。

OpenAI其他
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
面向销售团队的 ChatGPT 应用指南

销售团队可利用 ChatGPT 完成客户调研、个性化外联、交易全流程管理及销售漏斗优化,有效提升线索转化与成交效率。

OpenAI教程/实践
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
金融服务业AI资源

专为金融服务业打造的AI资源合集,涵盖提示词包、GPT模型、实用指南及专业工具,助力金融机构安全、高效地部署和扩展人工智能应用,推动行业智能化升级与数字化转型。

OpenAI产品更新部署/工程
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
使用 ChatGPT 创建图像

本文介绍如何运用清晰提示词在 ChatGPT 中创建并优化图像,支持设计迭代,可在数分钟内生成高质量视觉内容。

OpenAI图像生成教程/实践
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
27
AI fundamentals

文章是一份面向初学者的清晰指南,旨在解释人工智能的基本概念与工作原理。它阐述了什么是人工智能,并重点说明了以ChatGPT为代表的工具如何利用大型语言模型(LLM)来运作。内容涵盖了AI的核心定义、运作机制,以及具体工具的应用方式,为读者理解这一技术提供了基础框架。

其他教程/实践
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
财务团队如何使用 ChatGPT

财务团队可利用 ChatGPT 简化报告编制、分析财务数据、改进预测准确性,并更清晰地向管理层传达业务洞察,提升整体财务管理效率。

OpenAI教程/实践
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
ChatGPT 入门指南

新手指南:介绍 ChatGPT 的基础使用方法,包括如何开启首次对话,以及利用 AI 进行写作、头脑风暴和解决问题的实用技巧。

OpenAI教程/实践
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
面向管理者的 ChatGPT 使用指南

介绍管理者如何利用 ChatGPT 准备重要对话、撰写清晰反馈、保持工作条理并提升团队效率,涵盖具体使用场景与实操方法。

OpenAI教程/实践
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
医疗保健

临床医生使用符合 HIPAA 标准的 ChatGPT 辅助诊断、病历记录和患者护理,探索安全合规的 AI 医疗工具在临床工作中的应用场景。

OpenAI产品更新
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
客户成功团队如何使用 ChatGPT

客户成功团队利用 ChatGPT 管理客户账户、改善沟通效率、降低流失率,并推动产品采用与续订转化。

OpenAI教程/实践
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
使用 ChatGPT 进行研究

ChatGPT 支持搜索与深度研究功能,可查找最新信息、分析来源并生成结构化洞察,帮助用户高效完成研究分析。

OpenAI搜索教程/实践
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
Prompting 基础

学习 Prompting 基础,掌握撰写清晰、有效提示词的方法,从 ChatGPT 获取更优质、实用的回复。

OpenAI教程/实践
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
负责任且安全地使用 AI

提供使用 ChatGPT 等 AI 工具的最佳实践指南,聚焦安全性、准确性与透明度,指导用户如何负责任地部署和应用生成式 AI。

OpenAI教程/实践
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
ChatGPT 研究指南

介绍使用 ChatGPT 做研究的方法,包括搜集资料、分析信息及生成带引用的结构化洞察。

OpenAI搜索教程/实践
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
ChatGPT 运营团队实战指南

面向运营团队的 ChatGPT 应用指南,介绍如何利用 AI 工具简化工作流程、提升团队协作效率、标准化操作规范并加速业务执行。涵盖从流程优化到跨部门协调的具体实践方法。

OpenAI教程/实践
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
使用 ChatGPT 进行写作

使用 ChatGPT 进行写作的方法,涵盖内容起草、修改与润色,帮助实现结构清晰、语气一致、意图明确的文本创作。

OpenAI教程/实践
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
使用 ChatGPT Skills

OpenAI 推出 ChatGPT Skills 功能,支持用户创建可复用的技能模块以构建标准化工作流。该功能可自动化处理重复性任务,确保输出结果的一致性与高质量,适用于需要批量处理或固定流程的场景。通过自定义技能,用户能够减少重复操作,提升工作效率,实现更灵活的 AI 应用部署。

OpenAI教程/实践
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
使用 ChatGPT 分析数据

使用 ChatGPT 进行数据分析的实用方法:探索数据集、生成洞察、创建可视化,并将发现转化为可执行决策。

OpenAI教程/实践数据/训练
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
使用自定义 GPTs

本文介绍如何构建和使用自定义 GPTs,实现工作流自动化、维持输出一致性,并创建专用 AI 助手,帮助用户打造适合特定业务需求的智能工具,提升工作效率。

OpenAI教程/实践
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
针对 Axios 开发者工具遭入侵事件的回应

OpenAI 回应 Axios 供应链攻击事件,已轮换 macOS 代码签名证书、更新应用程序,并确认用户数据未遭泄露。

OpenAI行业动态
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
ChatGPT 营销团队使用指南

营销团队使用 ChatGPT 规划营销活动、生成内容并分析数据表现,缩短从创意到执行的周期,提升 campaign 落地效率。

OpenAI教程/实践
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
在 ChatGPT 中使用 Projects 功能

ChatGPT 新增 Projects 功能,支持按项目组织聊天记录、上传文件和设置自定义指令,帮助用户管理长期工作流并提升协作效率。

OpenAI教程/实践
03:18
Claude Code:GitHub Releases(RSS)
Claude Code v2.1.98 发布

Claude Code v2.1.98 发布,新增 Google Vertex AI 交互式设置向导、Perforce 版本控制支持(CLAUDE_CODE_PERFORCE_MODE)及 Linux 子进程沙盒功能(PID 命名空间隔离)。修复多项 Bash 工具安全漏洞,包括权限绕过、复合命令绕过强制提示、/dev/tcp 重定向自动授权等问题。权限管理支持 additionalDirectories 实时生效,同时优化 MCP OAuth 刷新、流式响应超时及后台代理进度报告等体验细节。

智能体Anthropic产品更新编码
03:15
Gary Marcus:The Road to AI We Can Trust(RSS)
认为 Anthropic 的 Claude Mythos 公告被过度炒作的三个理由

针对 Anthropic 发布的 Claude Mythos 公告,文章认为市场反应过度,目前无需恐慌。尽管该公告可能涉及重大技术更新或新功能发布,但作者指出相关炒作存在夸大成分,建议保持冷静观察,避免对未经验证的性能指标或技术突破产生过度期待。

Anthropic大佬观点
00:00
LMSYS:Blog(Chatbot Arena 团队)
HiSparse:分层内存系统加速稀疏注意力

LMSYS Org推出HiSparse分层内存系统,针对稀疏注意力仍受限于GPU内存容量的问题,将非活跃KV缓存卸载至主机内存,仅在GPU HBM保留热缓冲区,并通过专用CUDA内核高效管理数据交换(采用LRU策略与页表更新)。该系统在256并发请求下实现超3倍吞吐量提升,GLM-5.1-FP8模型长上下文场景性能提升达5倍,支持DeepSeek-V3.2等采用DeepSeek Sparse Attention架构的模型。

开源/仓库推理部署/工程
00:00
Runway:News(网页)
Runway 扩大与 NYU Tisch 艺术学院合作

Runway 扩大与 NYU Tisch 艺术学院合作,向 ITP、IMA 及 Hyper Cinema Lab 学生开放全套 AI 工具,支持课程作业与个人创作。Runway 创始团队曾就读于 ITP,此次合作旨在让新一代创作者掌握 AI 时代的电影与艺术工作流。

行业动态视频
4月9日
08:00
HuggingFace Daily Papers(社区热门论文)
3D-VCD:通过视觉对比解码缓解3D具身智能体中的幻觉

本文提出首个面向3D具身智能体的推理时视觉对比解码框架3D-VCD,用于缓解多模态大模型在三维环境中的幻觉问题。该方法通过对物体类别、空间坐标及几何范围施加语义与几何扰动构建扭曲的3D场景图,通过对比原始与扭曲场景的预测差异,抑制受语言先验驱动而非场景证据支持的不可靠token。在3D-POPE和HEAL基准测试中,该方法无需重新训练即显著提升了具身智能体的基础推理能力。

智能体arXiv具身智能论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
元学习上下文学习实现免训练跨受试者脑解码

研究团队提出一种元优化的fMRI语义视觉解码方法,通过上下文学习实现免训练的跨受试者泛化。该方法仅需少量图像-脑激活样本作为条件,即可快速推断新受试者的独特神经编码模式,并采用分层反演策略完成解码。实验表明,无需重新训练、微调、解剖对齐或刺激重叠,即可在多种视觉主干网络上实现强跨受试者和跨扫描仪泛化能力,为构建非侵入式脑解码通用基础模型奠定关键基础。

多模态数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
语言模型何时学习什么?隐性课程假设

研究者提出隐性课程假设,指出预训练遵循可组合且可预测的课程结构。通过设计涵盖检索、形态转换、逻辑推理和数学等领域的组合任务,对410M至13B参数的四个模型家族进行追踪,发现技能涌现顺序跨模型高度一致(ρ=.81),且复合任务通常在其组件任务之后出现。研究表明该结构编码于模型内部表征中,利用任务表征空间可有效预测未见过组合任务的训练轨迹(R²=.68-.84),揭示预训练过程比损失曲线显示的更具结构性。

arXiv推理数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
ReconPhys:从单视频中重建外观与物理属性

ReconPhys 是首个可从单目视频联合重建几何、外观与物理属性的前馈框架。该方法采用双分支架构与自监督训练策略,无需真实物理标签即可实现端到端推理。在合成数据集测试中,其未来预测 PSNR 达到 21.64,显著优于现有优化基线的 13.27;Chamfer Distance 从 0.349 降至 0.004。关键突破在于推理速度:仅需不到 1 秒即可完成重建,而传统方法需耗时数小时,为机器人与图形学领域快速生成仿真就绪资产提供了新方案。

arXiv具身智能视频论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
基于经验回放的 LLM 高效强化学习训练

针对大语言模型后训练必须使用新鲜 on-policy 数据的传统观点,研究系统探讨了经验回放技术的应用。通过形式化分析 replay buffer 设计在数据陈旧性方差、样本多样性与生成计算成本间的权衡,发现当生成成本高昂时,严格的 on-policy 采样实为次优选择。实证表明,设计良好的 replay buffer 可在保持策略熵的同时,大幅减少推理计算,且不损害甚至提升最终模型性能。

arXiv数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
Uni-ViGU:基于扩散式视频生成器统一视频生成与理解

Uni-ViGU框架通过扩展扩散式视频生成器统一视频生成与理解,反转了传统以理解为中心的多模态模型范式。该框架采用统一流方法,在单一过程中对视频进行连续流匹配、对文本进行离散流匹配;引入模态驱动的MoE架构,以轻量级层增强Transformer实现文本生成;并通过双向训练机制(知识召回与能力细化两阶段)将生成知识迁移至理解任务。实验表明,该模型在视频生成与理解任务上均达到竞争性性能,验证了以生成为中心的架构路径可行性。

多模态视频论文/研究
08:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
CyberAgent 借助 ChatGPT Enterprise 与 Codex 加速业务

CyberAgent 部署 ChatGPT Enterprise 与 Codex,在广告、媒体及游戏业务中安全扩展 AI 应用,提升工作质量并加速决策流程,实现业务全面提速。

智能体OpenAI行业动态
05:52
Claude Code:GitHub Releases(RSS)
Claude Code v2.1.97 发布

Claude Code v2.1.97 版本发布,为 NO_FLICKER 模式新增焦点视图切换(Ctrl+O)及多项渲染修复。权限系统修复了 Bash 工具环境变量检查、MCP HTTP 连接内存累积(约 50MB/小时)、429 重试逻辑及设置热重载等漏洞。新增状态栏自动刷新、git worktree 检测、agents 运行指示器及 Cedar 策略文件语法高亮。改进包括自动批准安全环境变量前缀的文件命令、CJK 输入无需空格即可触发补全,以及图像压缩统一处理。

智能体Anthropic产品更新编码
01:47
Gary Marcus:The Road to AI We Can Trust(RSS)
如何看待 Anthropic 那份关于 Mythos 的(或许)可怕新报告?

Anthropic 发布了一份关于 Mythos 的新报告,其潜在影响令人担忧。尽管目前可验证的具体事实细节尚不充分,文章建议保持冷静思考,提供了理性评估该报告的出发点,呼吁在获得更多实证信息前避免过度反应,基于现有线索进行审慎分析。

Anthropic大佬观点安全/对齐